当前位置: 首页 > news >正文

药品网站模板赞叹天河网站建设公司

药品网站模板,赞叹天河网站建设公司,西安有什么好玩的景点,上海企业招聘信息发布平台这里写自定义目录标题 介绍模型推理的输出过程方案原始Token输出RM输出(回归任务) 介绍 奖励函数模型 (Reward Model) 是人工智能 (AI) 中的一种方法,模型因其对给定提示的响应而获得奖励或分数。现在的文章清一色的讲解RM的训练&#xff0c…

这里写自定义目录标题

  • 介绍
  • 模型推理的输出过程方案
    • 原始Token输出
    • RM输出(回归任务)

介绍

奖励函数模型 (Reward Model) 是人工智能 (AI) 中的一种方法,模型因其对给定提示的响应而获得奖励或分数。现在的文章清一色的讲解RM的训练,但是没有讲解RM是如何输出一个分数的。本文只讲RM的输出,以补充资料的缺乏。RM通常采用Llama-7B模型,本文也沿用这一模型,同时模型的推理计算过程作为已知的知识,只讲解推理最后的输出部分。本文章先介绍传统Llama模型原始Token输出过程,再讲解RM的输出。以作为对比更好的学习。

模型推理的输出过程方案

  1. 原始Token输出

预训练语言模型(如LLaMA、GPT等)的默认任务是语言建模,它们的输出是针对每个token的概率分布(即词汇表中的每个词的概率)
在这里插入图片描述在这里插入图片描述
注,W矩阵在llama-7b中是lm_head.weight

  1. RM输出(回归任务)

写在前面:回归任务就不需要原始Token输出中的logits矩阵的计算(即图中H*W+B的部分)和softmax的计算。

  • 处理每个token的隐藏状态以生成全局表示
    隐藏状态的介绍:
    在这里插入图片描述
    1) 平均池化(Mean Pooling)
    在这里插入图片描述
    2) 最大池化(Max Pooling)在这里插入图片描述
  • 回归任务输出分数:

在这里插入图片描述

http://www.sczhlp.com/news/102237/

相关文章:

  • seo网站排名后退论坛门户网站建设
  • 用c语言可以做网站吗免费建站还用学做网站吗
  • 腾讯云 门户网站建设拼多多女装关键词排名
  • 营销型网站搭建.网站开发工具dw
  • 网站视觉规范演讲网站开发背景
  • 做网站白云临淄信息网123
  • 网站服务器数据库yande搜索引擎官网入口
  • 徐州网站开发公司网站建设包括哪些知识
  • C 语言头文件
  • 南宁模板建站哪家好中国比较大的外包公司
  • 网站建设费用的财务核算泰兴市住房和建设局网站
  • 域名注册好了怎么了做网站wordpress 小米
  • 池州网站制作优化建公司网站建设明细报价表
  • 网站首页图片轮播微营销方案
  • 淮阳 网站建设商丘百度推广公司地址
  • AFL++环境搭建
  • 广西圣泰建设工程有限公司网站网站建设需求分析报告
  • 婚纱摄影网站html网站编程用什么语言
  • 台州市椒江建设工程机械厂网站商务网站的建设步骤
  • h5网站价格方案什么系统做购物网站好
  • 室内设计网站案例成都智科达实验室设备有限公司
  • 网站设计方案范本wordpress视频去广告
  • WordPress最强网站深圳市住房和建设局工程交易服务中心
  • 谷歌浏览器在线入口seo网站优化培训找哪些
  • 做基础网站主机要?新媒体短视频推广
  • 做婚恋网站的翻译好吗酷家乐个人网页版
  • 外贸零售网站建设全球外贸网站制作教程
  • 网站目录文件查看网站的点击率怎么查
  • 做电商哪个设计网站比较好福田欧曼服务站电话
  • 重庆制作网站的公司排名wordpress插件如何使用教程