游戏租号网站怎么建设,怎么做网站的排名,wordpress实现图片全屏代码,东莞网站建设最优深度学习之卷积神经网络理论基础
卷积层的操作#xff08;Convolutional layer#xff09;
在提出卷积层的概念之前首先引入图像识别的特点
图像识别的特点
特征具有局部性#xff1a;老虎重要特征“王字”仅出现在头部区域特征可能出现在任何位置下采样图像#xff0c…深度学习之卷积神经网络理论基础
卷积层的操作Convolutional layer
在提出卷积层的概念之前首先引入图像识别的特点
图像识别的特点
特征具有局部性老虎重要特征“王字”仅出现在头部区域特征可能出现在任何位置下采样图像不会改变图像目标 例如从512 * 512的图像进行下采样得到32 * 32的图像目标 特征具有局部性卷积核每次仅连接K * K区域K * K是卷积核尺寸 特征可能出现在任何位置卷积核参数重复使用参数共享在图像上滑动
该图片的卷积的计算步骤如下所示即对应位置相乘在相加得到最终的结果
0×01×13×24×319 1×02×14×25×325 3×04×16×27×337 4×05×17×28×343 其中绿色代表的是输出部分蓝色代表的是输入的部分绿色的每一个区域是在蓝色区域的基础上经过卷积运算得到的在计算的过程中区域不断的进行滑动
卷积层的相关概念
卷积核Kernel具可学习参数的算子用于对输入图像进行特征提取输出通常称为特征图(featuremaps 通常我们说的就是3x3的卷积核即对应上图中的核函数2x2的卷积核 卷积核当中的权重就代表的是一种特征模式。2012年AlexNet网络第一个卷积层卷积核可视化卷积核呈现边缘、频率和色彩上的特征模式。 填充Padding 在输入图像的周围添加额外的行/列。使卷积后图像分辨率不变方便计算特征图尺寸的变化弥补边界信息丢失 而该图中的padding1 在上下左右都添加1个位置的像素保证边缘部分与中间部分相比不会参与卷积的次数太少而被忽略而丢失 步长Stride 卷积核滑动的行数和列数称为步幅控制输出特征图的大小会被缩小1/s倍 在蓝色图像上每次滑动的距离之间影响得到的输出图的大小和像素值 感受野特征图中的一个点相当于图片中多大的区域层数越多感受野越大。 感受野从3 * 3 到 5 * 5的区域 多通道卷积
多通道卷积RGB图像是3 * h* w 的三维的数据第一个维度3表示channel通道数一个卷积核是3-D张量第一个维与输入通道有关注卷积核尺寸通常指高、宽 补充2-d卷积和3-d卷积的区分卷积核在输入上只在行和列两个维度上移动并进行卷积—称为2d卷积 而在一些视频任务中在此基础上还需要使用到第三个维度即时间维度称为3-d卷积 池化层操作Pooling layer
下采样图像不会改变图像目标降低计算量减少特征
池化一个像素表示一块区域的像素值降低图像分辨率
方法1:MaxPooling取最大值(最大池化)方法2:AveragePooling取平均值平均池化 而池化层中无可学习的参数 池化操作可以看作是一种特殊的卷积操作。
池化的作用
缓解卷积层对位置的过度敏感。
Lenet -5 C1层 卷积核K1(6,1,5,5),p1s1output(6,28,28S2层最大池化层池化窗口2,2s2output61414C3层卷积核K316,6,5,5),p1,s1output16,10,10)S4层最大池化层池化窗口2,2s2output1655FC层3个FC层输出分类 特征提取器C1、S2、C3、S4分类器3个FC