自己网站制作,动漫设计是什么,如果做车站车次查询的网站需要什么消息信息,注册公司费用流程图经典分割算法-DFN 一 宏观角度看待分割问题二 注意力机制2.1 代表算法 三 DFN摘要四 相关工作五 算法架构Border NetworkSmooth NetWork 华科 北大 在CVPR2018发表 一 宏观角度看待分割问题
微观角度#xff1a;每一个像素都对应一个具体类别宏观角度#xff1a;将语义分割看… 经典分割算法-DFN 一 宏观角度看待分割问题二 注意力机制2.1 代表算法 三 DFN摘要四 相关工作五 算法架构Border NetworkSmooth NetWork 华科 北大 在CVPR2018发表 一 宏观角度看待分割问题
微观角度每一个像素都对应一个具体类别宏观角度将语义分割看作一个任务将一致的语义标签分配给一类事物而不是每个像素按照这一个角度语义分割中就会存在类间不一致和类类不一致的问题宏观角度以语义地图为例交通信号灯在点云地图中他们只是三维形状有坐标位置朝向或车道应用范围等信息这些信息并不足以帮助自动驾驶做出行驶策略因为交通灯还可能有红灯或绿灯等各种状态这时语义地图就能发挥作用它能够辅助车辆的感知和规划系统判定交通信号灯状态这就是语义地图与其他地图的区别所在。SLAM同步定位与建图。即时定位与地图构建或并发建图与定位。问题可以描述为将一个机器人放入位置环境中的未知未知是否有办法让机器人一边移动一边描绘出此环境完全的地图所谓完全地图是指不受障碍行进到房间可进入的每个角落SLAM的意义是实现机器人自主定位和导航。
二 注意力机制
深度学习中的注意力机制从形式上讲和人类的选择性视觉注意力机制类似核心目标也是从众多信息中选择出对当前任务目标更关键的信息。 注意力机制包含两个步骤
注意力机制需要先决定整段输入的那个部分需要更加关注从关键的部分进行特征提取得到重要的信息
注意力机制按注意力的关注点可分为
空间域通道域层域混合域时间域 注意力机制可以帮助模型为输入图像的各个部分分配不同的权重提取更关键、更重要的信息使模型能够做出更准确的判断同时不会给模型的计算和存储带来更多的损耗
2.1 代表算法
2019 CVPR Dual Attention Network For Sence Segmentation DANet引入了一种自注意力机制来分别捕捉空间域和通道域中的视觉特征依赖性 空间域 网络输出的局部特征Ac,h,w首先利用三个卷积层得到BCD三个特征并分别reshape到cn然后将B的转置与C相乘在通过softMax得到spatial attention map SNN将S的专职与D矩阵相乘后的结果reshape到chw在加上原始输入图像得到最后的输出。 通道域 先对A进行reshape到CN然后A与A的专职进行矩阵相乘经过softmax后得到通道间的map Xcc之后在乘以A得到的输出结果与原图相加后获得最后的输出E
三 DFN摘要
背景介绍现代语义分割算法会存在类内不一致和类间不一致的问题算法组成提出了DFN网络包括平滑网络和边界网络具体作用平滑网络用于解决类内不一致通过引入注意力机制和全局平均池化选择更具代表性的特征边界网络通过深度语义边界监督更好的区域双边特征
四 相关工作
FCN/PSPNet/RefineNet/GCN等网络学习到的特征不具备类内和类间不一致的判别能力创新角度从宏观的角度看待语义分割任务以往的文章都是从微观角度看待语义分割即对每个像素点进行分类这样就会导致上面提出的两个问题。本文将一致的语义标签分配给事物的类别而不是每个像素点将每类像素做为一个整体内在考虑类内一致性和类间变化因此这要求提取到的特征需具有判别能力
五 算法架构
Border Network
主要思想利用多监督使网络学习到的特征具有很强的类间不一致性。利用bottom-up结构获取更多的语义信息 优点该模块可以从低阶网络获得边界信息从高阶网络获得语义信息再融合避免缺失某类信息的情况出现高阶语义信息具有优化低阶边界信息的作用 使用focal loss监督Border NetWork的输出 Smooth NetWork
问题1:不同尺度的感受野产生的特征具有不同程度的判别能力导致结果不一致 作用1:用高阶信息的一致性指导低阶信息从而提升预测效果 现有的方法大致分为两种类型一是用不同尺度的全局信息嵌入PSP、ASPP 二是Encoder-Decode结构即利用不同阶段固有的多尺度语境但缺房具有强一致性的全局语境