当前位置: 首页 > news >正文

搞一个网站多少钱注册网站商标多少钱

搞一个网站多少钱,注册网站商标多少钱,山西建设执业注册中心网站,乡土文化网站怎么做【深度学习】—激活函数、ReLU 函数、 Sigmoid 函数、Tanh 函数 4.1.2 激活函数ReLU 函数参数化 ReLU Sigmoid 函数背景绘制 sigmoid 函数Sigmoid 函数的导数 Tanh 函数Tanh 函数的导数总结 4.1.2 激活函数 激活函数#xff08;activation function#xff09;用于计算加权和… 【深度学习】—激活函数、ReLU 函数、 Sigmoid 函数、Tanh 函数 4.1.2 激活函数ReLU 函数参数化 ReLU Sigmoid 函数背景绘制 sigmoid 函数Sigmoid 函数的导数 Tanh 函数Tanh 函数的导数总结 4.1.2 激活函数 激活函数activation function用于计算加权和并加上偏置决定神经元是否被激活。它将输入信号转化为可微的输出大多数激活函数是非线性的。激活函数是深度学习的基础下面介绍几种常见的激活函数。 ReLU 函数 最受欢迎的激活函数是修正线性单元Rectified Linear Unit, ReLU它实现简单且在各种预测任务中表现优异。ReLU 提供了一种非常简单的非线性变换定义为 通俗地说ReLU 通过将负值设为 0仅保留正数。我们可以通过下列代码绘制 ReLU 函数的曲线来直观感受其行为。正如图中所示ReLU 是分段线性的。 import torch from d2l import torch as d2lx torch.arange(-8.0, 8.0, 0.1, requires_gradTrue) y torch.relu(x) d2l.plot(x.detach(), y.detach(), x, relu(x), figsize(5, 2.5))当输入为负时ReLU 的导数为 0当输入为正时导数为 1。当输入值精确等于 0 时ReLU 不可导但我们通常忽略这种情况假设导数为 0。我们可以绘制 ReLU 函数的导数曲线。 y.backward(torch.ones_like(x), retain_graphTrue) d2l.plot(x.detach(), x.grad, x, grad of relu, figsize(5, 2.5))ReLU 的求导性质使得参数要么消失要么通过从而优化效果更好缓解了神经网络中常见的梯度消失问题将在后续章节介绍。 参数化 ReLU ReLU 有许多变体其中包括参数化 ReLUParameterized ReLU, pReLU。pReLU 为 ReLU 添加了一个线性项使得即使输入为负仍有信息可以传递 pReLU ( x ) max ⁡ ( 0 , x ) α min ⁡ ( 0 , x ) . \text{pReLU}(x) \max(0, x) \alpha \min(0, x). pReLU(x)max(0,x)αmin(0,x). Sigmoid 函数 对于定义域在 R \mathbb{R} R 中的输入sigmoid 函数将输入变换为区间 ( 0 , 1 ) (0, 1) (0,1) 上的输出因此 sigmoid 通常称为挤压函数squashing function。它将任意输入压缩到区间 ( 0 , 1 ) (0, 1) (0,1) 中的某个值定义如下 背景 在早期的神经网络中科学家们通过 sigmoid 函数模拟生物神经元的激发和非激发。它是阈值单元的平滑可微近似当输入低于某个阈值时输出接近 0超过阈值时输出接近 1。由于 sigmoid 的平滑性和可导性它在基于梯度的学习中得到广泛应用特别是在将输出视为二元分类问题的概率时仍然使用 sigmoid 作为输出层的激活函数。 然而随着 ReLU 函数的引入sigmoid 在隐藏层中的应用逐渐减少因为 ReLU 更简单且更易于训练。在后续关于循环神经网络的章节中我们将探讨如何使用 sigmoid 来控制时序信息流。 绘制 sigmoid 函数 我们可以通过代码绘制 sigmoid 函数曲线。注意当输入接近 0 时sigmoid 函数近似线性。 y torch.sigmoid(x) d2l.plot(x.detach(), y.detach(), x, sigmoid(x), figsize(5, 2.5))Sigmoid 函数的导数 sigmoid 函数的导数公式如下 我们可以通过代码绘制 sigmoid 函数的导数曲线。注意当输入为 0 时sigmoid 函数的导数达到最大值 0.25而当输入远离 0 时导数逐渐趋近于 0。 # 清除以前的梯度 x.grad.data.zero_() y.backward(torch.ones_like(x), retain_graphTrue) d2l.plot(x.detach(), x.grad, x, grad of sigmoid, figsize(5, 2.5))这表明 sigmoid 函数在输入较大或较小时的梯度非常小这导致在深层网络中可能会出现梯度消失问题。 Tanh 函数 与 sigmoid 函数类似tanh双曲正切函数也可以将输入压缩到区间 ( − 1 , 1 ) (-1, 1) (−1,1) 上。tanh 函数的公式如下 我们可以通过代码绘制 tanh 函数。注意当输入在 0 附近时tanh 函数接近线性且函数关于原点对称。 y torch.tanh(x) d2l.plot(x.detach(), y.detach(), x, tanh(x), figsize(5, 2.5))Tanh 函数的导数 tanh 函数的导数为 当输入接近 0 时tanh 函数的导数接近最大值 1。类似于 sigmoid 函数当输入远离 0 时导数逐渐趋近于 0。我们可以绘制 tanh 函数的导数图像。 # 清除以前的梯度 x.grad.data.zero_() y.backward(torch.ones_like(x), retain_graphTrue) d2l.plot(x.detach(), x.grad, x, grad of tanh, figsize(5, 2.5))总结 我们已经了解了如何使用非线性激活函数如 ReLU、sigmoid 和 tanh来构建具有更强表达能力的多层神经网络。值得一提的是如今借助开源的深度学习框架只需几行代码即可快速构建模型而在 20 世纪 90 年代训练这些网络可能需要数千行 C 或 Fortran 代码。
http://www.sczhlp.com/news/194849/

相关文章:

  • 宣传图制作网站医疗医院网站建设
  • 网站网页栅格化中国外发加工网app
  • 湛江网站建设咨询提供免费主页空间的网站
  • 创建网站怎么创网站搭建为什么要备案
  • 网站营销推广如何做最超值的锦州网站建设
  • 教育网站开发方案wordpress只显示一个主题
  • 旅游网站设计论文摘要建立房产门户网站需要多少钱
  • 一套企业网站设计图片佛山市南海区交通建设网站
  • 推广类网站陈村网站开发
  • 自己在网站开发的客户怎么联系公司logo设计生成器
  • 电商设计网站模板金华网站建设公司排名
  • 想自己做个网站在哪里做彩票网站制作找谁
  • 镇江市质监站网址网络设计课程有哪些
  • 做外贸的网站看啥书如何做带后台的网站
  • 北京怎样做企业网站制作网站专业公司哪家好
  • 有没有专门做胜负彩的网站化妆品网页设计图片
  • 做图有什么网站网站备案的具体流程
  • 怎么才能让百度收录网站网站推广公司运营模式
  • 建立网站需要花多少费用青海网站建设怎么建设
  • 做自适应网站设计可口可乐营销案例分析
  • 安微省城城乡建设厅网站网站建设视频百度网盘下载
  • 网络文件共享系统NFS服务搭建
  • 在CentOS 7.9系统上使用Docker部署RuoYi-Vue前后端分离系统
  • C# 泛型懒汉单例类
  • uni-app x使用uview-plus
  • 响应式app网站模板dede网站更新如何同步腾讯微博更新
  • 杭州企业建设网站企业软件工程师一个月工资多少
  • 视频封面制作网站本科自考多少钱
  • 企业站网站建设制作平台北京住房和城乡建设网站
  • 网站结构优化的内容和方法网站没有关键词