当前位置: 首页 > news >正文

做网站服务器一年多少钱哈尔滨信息工程学院地址

做网站服务器一年多少钱,哈尔滨信息工程学院地址,网站忧化教程,优秀的营销案例作者及发刊详情 摘要 正文 主要工作贡献 这篇文章的贡献主要有两部分: 分析Transformer的特征,调查高效transformer推理的方法通过应用方法学展现一个DNN加速器生成器Gemmini的case研究 1)分析和解析Transformer架构的运行时特性和瓶颈…

作者及发刊详情

摘要

正文

主要工作贡献

这篇文章的贡献主要有两部分:

  1. 分析Transformer的特征,调查高效transformer推理的方法
  2. 通过应用方法学展现一个DNN加速器生成器Gemmini的case研究

1)分析和解析Transformer架构的运行时特性和瓶颈

2)Transformer推理的硬件架构

3)对特定Transformer架构的优化策略,比如剪枝和量化

4)Transformer架构下操作的映射和调度,以及相关挑战

5)通过自动化的神经架构搜索过程,设计和调整transformer架构,使其硬件更加高效

Transformer模型架构和性能瓶颈

transformer的基本架构

Transformer架构包含两个模块:MHA和FFN
在这里插入图片描述Transformer架构的参数如下:
在这里插入图片描述

对Transformer架构的输入序列包含l个token,每个值都由一个d维度的向量表示,构成了 d ∗ l d*l dl的矩阵。token可以是一个词或一个句子片段。

MHA的计算特征

MHA有三种不同的权重 W Q W_Q WQ W K W_K WK W V W_V WV,具体执行流如图1所示,这些权重将会产生三种不同的激活,每种激活会被分成h个块(chunk,有隐藏维度d/h),因此这些块都被分成了h个不同的注意力头。q块和k块沿着隐藏层相乘,生成 l ∗ l l*l ll 大小的激活矩阵,这些激活矩阵经过softmax操作,与v块相乘,得到attention头的激活,然后h个head组合生成结果 W o u t W_{out} Wout。每阶段的计算结果如Table2所示。最终线性层的输出经过残差链接和层归一化生成MHA模块的输出。

MHA总共有6个线性操作,其中4个是权重到激活的矩阵乘( W Q W_Q WQ W K W_K WK W V W_V WV W o u t W_{out} Wout),另外两个是激活到激活的矩阵乘( q u e r y ∗ k e y query*key querykey a t t e n t i o n . s c o r e ∗ v a l u e attention.score*value attention.scorevalue),本文将前者称为投影(projection),后者称为激活到激活矩阵乘。

FFN包含两个线性层操作, d F F N d_FFN dFFN通常是 d d d的四倍,在两个线性层间有一个非线性层。

在这里插入图片描述

非线性操作的特征

非线性操作,包括Softmax, LayerNorm, 和 GELU需要片外计算的支持,虽然全部操作中占据了较小部分,但比矩阵乘更具挑战,如果处理不当将会产生额外的开销。

在有效利用临时内存和高效计算方面提出了挑战

需要在运行时传递所有的输入值,这些值都会保存在临时存储中。
比如softmax操作包括求指数操作、跨序列长维度的求和、每个指数向除以求和结果的归一化操作,需要解决指数溢出问题。
计算LayerNorm函数还需要跨隐藏维度多次传递整个输入值,先计算平均值,再计算标准差,然后再使用层归一化

encoder和decoder架构

encoder可以并行处理输入序列
encoder-only适合用于自然语言理解任务(sentiment analysis、sentence similarity analysis)
decoder一次只能推理出一个token,适合用于生成式任务
在这里插入图片描述

产生token的共同优化方法:在后续的迭代中,缓存和复用之前生成的token中间的K和V值

生成的token后继续传入到decoder的输入,复用可以节省计算时间。

模型的算力密度

矩阵乘在encoder-only和decoder-only中消耗了99%的FLOPS。
在这里插入图片描述在这里插入图片描述

模型优化

硬件设计

参考文献

这是一篇关于Transformer推理的全栈技术综述

http://www.sczhlp.com/news/106547/

相关文章:

  • 我的班级网站模板常熟市建设工程发承包网站
  • 美工免费素材网站WordPress源码路由
  • 专业做电脑系统下载网站协会网站建设
  • 佛山市网站建设分站多少钱网站开发用什么代码
  • 基于Python+Vue开发的蛋糕商城管理系统源码+运行步骤
  • 某运营商智慧协同平台——构建高效、敏捷的运营管理新模式
  • go使用反射获取http.Request参数到结构体 - 实践
  • 基于MATLAB/Simulink的TI2000系列DSP模型设计
  • 门户网站建设方案招标文件国内建站源码
  • 中国建设监理官方网站wordpress 页面404
  • thinkphp手机网站模板中国建设信用卡网站
  • 我做的电影网站为什么百度搜索不到个人网站制作模板
  • 建个什么网站赚钱做私活有哪些网站
  • 怎样利用网站做淘宝客网站公司备案有用
  • 好孩子官方网站王建设注册公司怎么注册
  • 东莞网站制作的方案做同城信息类网站如何赚钱
  • wordpress 手册 chm郑州百度seo
  • 手机礼品网站模板文创产品设计说明模板
  • 龙岗网站设计案例做加工都在哪个网站推广
  • 深圳南山区住房和建设局网站怎么做营销型网站
  • 大连仟亿科技网站建设公司怎么样网站商城的公司运营结构
  • nginx 常用参数
  • 单页网站优化网站首页面设计代码
  • Python常见函数和代码示例
  • 阿里云网站备案拍照点无锡营销型网站
  • 佛山网站设计实力乐云seo网站专题优化
  • 戴尔网站建设成功的关键网站备案幕布照如何做
  • 微信 app 微网站 整合最好看免费观看高清大全老师补课中国
  • 怎么做网站框架聊城网站建设招聘
  • 上海市杨浦区建设小学网站天津平台网站建设费用