当前位置: 首页 > news >正文

免费微网站制作教程视频哪个浏览器能打开那种网站

免费微网站制作教程视频,哪个浏览器能打开那种网站,wordpress+andriod,临沂网站开发多少钱一、LLM大语言模型的特点 二、大语言模型在ASR任务中的应用 浅度融合 浅层融合指的是LLM本身并没有和音频信息进行直接计算。其仅对ASR模型输出的文本结果进行重打分或者质量评估。 深度融合 LLM与ASR模型进行深度结合#xff0c;统一语音和文本的编码空间或者直接利用ASR…一、LLM大语言模型的特点 二、大语言模型在ASR任务中的应用 浅度融合 浅层融合指的是LLM本身并没有和音频信息进行直接计算。其仅对ASR模型输出的文本结果进行重打分或者质量评估。 深度融合 LLM与ASR模型进行深度结合统一语音和文本的编码空间或者直接利用ASR编码器的隐状态参与计算利用大语言模型的能力得到更好的解码结果。 三、浅度融合 1、Large-scale Language Model Rescoring on Long-Form Data 利用能力更加强大的LLM为ASR模型的推理结果进行质量评分 2、Prompting Large Language Models For Zero-Shot Domain Adaptation in Speech Recognition 利用能力更加强大的LLM为语言模型的输出进行重打分 四、深度融合 1、Prompting Large Language Models For Zero-Shot Domain Adaptation in Speech Recognition 使用语音编码器编码和提示文本的信息输入到大语言模型中预测下一个token 编码器使用HuBERT处理语音序列并使用卷积网络对其进行下采样 解码器使用LLaMA作为解码器并融入Gated-XATT-FFN Cross-attention使用编码器的输出作为key、value解码器的domain prompt和历史输出作为query计算注意力注意力使用Gated cross attention。 在训练时保持LLaMA的参数固定其他模块参数更新。 2、Adapting LLM with Speech for Full Formatted End-to-End Speech Recognition 使用语音编码器编码的信息输入到大语言模型中预测下一个token Text Encoder用于在训练阶段提供更多的文本数据使解码器可以更好地被训练在推理阶段不再被使用 Speech Encoder用于编码语音并使用CTC进行解码获得对应的token Text Decoder在训练时对Text Encoder计算MLM损失对Speech Encoder计算CE损失用来预测下一个token。在推理时对Speech Encoder的输出进行修正。 Speech Encoder用于编码语音信息 LM对Speech Encoder下采样之后的输出进行下一个token预测。 3、Prompting Large Language Models with Speech Recognition Abilities 使用语音编码器编码的信息输入到大语言模型中预测下一个token Encoder基于Conformer的声学编码器最后使用n个帧进行堆叠投影得到和LLaMA相同的维度 Decoder基于LLaMA 7B的解码器结构 在训练时LLaMA使用了基于LoRA的微调方法。 4、On Decoder-Only Architecture For Speech-to-Text and Large Language Model Integration 使用语音编码器编码和提示文本的信息输入到大语言模型中预测下一个token LLMLLaMA 7B CTC Compressor通过过滤语音空白匹配标签序列文本的长度 Audio Encoder对CTC过滤后的语音信号进行编码 Text Prompt手工设计的提示词为了达到instruct tuning的效果本文在训练时设计了多种提示词 为了稳定训练在训练时第一阶段训练CTC Compressor对LLM进行冻结第二阶段使用LoRA对LLM进行微调。 5、Speech-to-Text Adapter and Speech-to-Entity Retriever Augmented LLMs for Speech Understanding Speech2Text adapter由一些自注意力子层组成主要作用是将CTC过滤后的张量转换为可由LLM模型处理的张量。在训练期间其他部分保持不动仅训练此部分从而得到一个speech2text性能较好的适配器。 Speech2Entity retriever根据过滤后的语音表征从数据库中查找与该段语音相关的topk个实体。 T5 Encoder输入由三部分组成分别是提示文本表征输入语音表征以及检索到的topk实体文本表征。Topk实体会被添加到到提示文本输入前从而提高T5模型语音识别实体的准确率。 五、深度学习方法对比
http://www.sczhlp.com/news/151523/

相关文章:

  • 怎么弄网站关键词超市会员管理系统
  • 上海网站备案咨询wordpress vip会员可见
  • 网站后台都需要什么软件做船舶cms是什么意思
  • Jenkins+IIS+Bonobo.Git.Server 搭建适用dotnet开发者的小团队的devops环境
  • 函数-参数+作用域
  • 用 Nim 实现英文数字验证码识别
  • JDK17新特性梳理
  • 网站建设完成的时间为餐饮企业做网站推广
  • 企业网站倾向于wordpress衡阳网站推广
  • 有了域名怎么制作网站做空山寨币的网站
  • 深圳企业做网站公司wordpress二步验证
  • 网站开发众包平台wordpress 设置多域名 一个站点
  • 拖拽建站模板城乡建设网站人力资源
  • 菜谱分享网站开发开题报告wordpress如何添加内链
  • 建设地产网站标准个人简历模板免费下载
  • 在线教育网站用什么做平台期
  • 厦门市建设合同备案网站cms访问状态异常怎么处理
  • html网站建设中源代码凤岗镇网站建设公司
  • 做一个商城网站多少钱伪原创php网站镜像同步程序
  • 女装网站功能的建设企业网站有什么用
  • 网站新闻稿模板桂林北站到两江机场大巴时刻表
  • 成武县住房和城乡建设厅网站wordpress googleapis
  • 网上做夫妻的网站贴吧aso优化贴吧
  • 服装网站建设市场分析wordpress 地图
  • wordpress图片自动加广告搜索引擎优化包括
  • 网站没有域名wordpress 移动
  • 网站建设车成本网站建设方案书 个人备案
  • 门户网站开发案例南宁建站公司模板
  • 网站建设主要有哪些成本成都网站设计师
  • 校园网上超市网站建设推广学视频剪辑报个班的多少钱