当前位置: 首页 > news >正文

张家港网站制作网络推广做营销网站 如何让商家入驻

张家港网站制作网络推广,做营销网站 如何让商家入驻,免费制作个人简历的网站,谷歌网站地图生成器文章目录 1、概述2、Backbone3、RPN网络3.1、anchor的生成3.2、anchor的标注/分配3.3、分类预测和bbox回归3.4、NMS生成最终的anchor 4、ROI Head4.1、ROI Align4.2、cls head和bbox head4.3、mask head 1、概述 Mask RCNN是在Faster RCNN的基础上增加了mask head用于实例分割… 文章目录 1、概述2、Backbone3、RPN网络3.1、anchor的生成3.2、anchor的标注/分配3.3、分类预测和bbox回归3.4、NMS生成最终的anchor 4、ROI Head4.1、ROI Align4.2、cls head和bbox head4.3、mask head 1、概述 Mask RCNN是在Faster RCNN的基础上增加了mask head用于实例分割的模型。总体来说Mask RCNN网络结构可以分为BackBone(ResNetFPN) — RPN网络(Region Proposal Network) — ROI Head(ROIAlign cls head bbox head mask head)整体网络结构如下来自原论文https://arxiv.org/pdf/1703.06870.pdf 2、Backbone Backbone主要由ResNet和FPN组成如下图 1C1-C5是指ResNet网络5个stage输出的特征图下采样率分别为2, 4, 8, 16, 32通道数分别为64, 256, 512, 1024, 2048 2FPN网络类似于UNet网络中的跳级连接都是为了增强多尺度表征能力的分别对C2-C5四个特征图通过1 × \times × 1卷积改变通道数为256再与上采样路径中对应尺度的特征图相加。得到的P2-P6就是FPN网络的五个特征图下采样率为4, 8, 16, 32, 64通道数都为256 3需要注意的是P2-P6这五个特征图将分别作为RPN网络的输入和ROI Head中的ROI Align的输入 RPN网络的输入用于在这五个特征图上生成先验的anchor并对这些anchor进行类别预测和bbox回归以生成最终的anchor输入到ROI Head中 ROI Align的输入根据RPN网络生成的anchors提取这五个特征图中对应的ROI区域特征图输入到cls、bbox和maskhead中 3、RPN网络 RPN网络为Region Proposal Network主要作用用于生成先验的anchor box/proposals并将P2-P6这五个特征图作为网络输入学习得到这些先验的anchor box/proposal的类别(前景or背景)以及通过bbox 回归得到偏移量最终经过RPN网络预测得到的具有更高质量的proposal送入ROI Head中主要流程为1anchor的生成2anchor的标注3P2-P6五个特征图进行二分类的预测和bbox回归4通过NMS后处理得到最终的anchor 3.1、anchor的生成 在P2-P6的五个特征图上分别对应设置5个不同的anchor size(32, 64, 128, 256, 512)并设置3种长宽比(0.5, 1.0, 2.0)也就是每个特征图的每个像素点生成3个anchor(x, y, w, h)具体来说特征图中的每个点都会先映射到原始图像中并以该点为中心以对应的anchor size和3种长宽比的设置生成3个anchor(x, y, w, h)例如输入图像为512 × \times × 512那么五个特征图的尺寸分别为128, 64, 32, 16, 8那么生成的anchors的数量为(128 × \times × 128 64 × \times × 64 32 × \times × 32 16 × \times × 16 8 × \times × 8) × \times × 3 21824 × \times × 3 65472个anchors 3.2、anchor的标注/分配 该过程就是确定生成的所有anchor为正样本or负样本标注流程如下 1先排除掉超过原图边界的anchors 2计算其余的每个anchor与 所有ground truth bbox的IoU取与每个bbox的的最大IoU作为判断大于0.7为正样本小于0.3为负样本 3计算每个bbox与那个anchor的IoU最大把该anchor也标记为正样本 最后随机选择128个正样本和128个负样本用于RPN网络的训练对于分类128个正样本的label为1,128个负样本的label和剩下的anchor的label为0对于bbox回归超过边界的anchor的label为(0, 0, 0, 0)其余anchor的label是与它对应的具有最大IoU的bbox的实际偏移量 3.3、分类预测和bbox回归 首先对5个特征图进行3 × \times × 3卷积然后分为2个分支分类分支为1 × \times × 1卷积输出通道数为num_anchors3表示的是特征图的每个像素点对应的3个anchors为前景的概率值。 需要注意的是五个特征图分别作为3 × \times × 3卷积和该分支的1 × \times × 1卷积的输入计算得到概率值再计算128个正样本和128个负样本的分类损失也就是说只有一组3 × \times × 3卷积和1 × \times × 1卷积 bbox回归分支为1 × \times × 1卷积输出通道数为num_anchors × \times × 4 12表示3个anchor的4个预测位置参数 以下为bbox回归的详细介绍预测得到的(dx, dy, dw, dh)与ground truth之间计算Smooth L1损失 训练RPN网络对128个正样本和128个负样本计算分类损失二分类交叉熵损失函数以及回归损失Smooth L1损失 3.4、NMS生成最终的anchor 根据RPN网络生成的所有anchor的score和4个位置参数(tx, ty, tw, th)进行如下操作 1根据偏移量对anchor的位置进行微调得到(x, y, w, h) 2删除掉超过边界的anchor 3根据score对anchor从大到小进行排序 4对于每个尺度上的特征图就是P2-P6的五个特征图选择前2000个anchor在经过NMS之后选择最高1000个anchors作为最终的anchor输入到ROI Head中(这些数量属于超参数可调整) 例如5个特征图在NMS之前选择的前2000个anchor如下3和4没到2000是因为他们的特征图P5和P6的尺寸分别为16和8计算得到的anchors数量为768和192。 训练阶段和推理阶段有一些不同 训练阶段计算loss并生成anchor 推理阶段直接生成anchor 生成anchor的NMS的配置可能不同例如 训练阶段 推理阶段 4、ROI Head 主要包括ROI ALign和3个head: class head, bbox head, mask head 4.1、ROI Align RPN网络最终生成的anchors将作为ROI Align的输入也就是说根据这些anchors(x, y, w, h) 来提取P2-P6特征图中的anchors对应的特征作为3个head的特征图输入。我们首先要知道anchors的坐标位置(x, y, w, h)表示的是原图像中的区域可以将其映射到特征图中Faster RCNN正是采用了ROI pooling层映射为固定尺寸的ROI区域 但是ROI pooling层由于存在取整操作对于一些小目标很容易导致区域不匹配问题因此Mask RCNN采用了ROI ALign操作 1将anchor映射到对应的特征图中w和h在被除时不去整ROI pooling取整了。对于五个特征图的选择方法如下 2将映射后的ROI区域均匀分为K × \times ×K的bin每个bin的大小不取整ROI pooling取整了 3每个bin的每个像素值计算为特征图中与它邻近的4个值的双线性插值 4使用max pooling或者average pooling得到K × \times ×K特征图(7 × \times × 7或者14 × \times × 14)作为3个head的输入 4.2、cls head和bbox head 首先是样本的标注与分配 1计算由RPN网络最终生成的所有anchors与每个GT bbox的IoU值取每个anchor的最大IoU值进行判断IoU0.5的样本中选择128个正样本小于0.5的样本中选择384个负样本 2对于类别标签正样本为对应的GT bbox的类别标签负样本为0对于bbox回归的标签与该样本最大IoU值的GT bbox的实际偏移量 将这512个样本anchors通过ROI Align获取得到512个7 × \times × 7 × \times × 256的特征图作为class head和bbox head的输入进行如下的前向传播一般为2个3*3卷积2个fc层 最后就是损失函数的计算分类损失为多类别交叉熵损失回归损失也是Smooth L1损失 4.3、mask head mask标签和输入特征图的获取 1计算每个anchor在原始图像中的大mask就是根据位置参数在原图像的二值mask框出来的 2根据计算得到的每个anchor对应尺度的特征图P2-P6中的一个将anchor位置参数除以缩放倍数/下采样率再进行ROI Align得到512个14 × \times × 14 × \times × 256的特征图作为mask head的输入 3而对于大mask也进行倍数缩放就可以得到每个anchor在对应特征图上的mask(软掩码)—二值化—硬掩码 对输入特征图再通过FCN层进行预测得到28 × \times × 28的预测mask结果 最后进行损失函数的计算为交叉熵损失需要注意的是推理阶段不一样有先后顺序
http://www.sczhlp.com/news/152833/

相关文章:

  • 建筑工程公司需要什么资质石家庄seo管理
  • 设计公司网站建设费用新手做自己的网站
  • 国家高新技术企业查询网站wordpress 截取长度
  • 2025年真空机厂家推荐榜:平台式真空封口机,拉伸膜真空覆膜机,全自动拉伸膜真空包装机,滚动连续式真空包装机,双面拉伸真空包装机公司实力甄选指南
  • 安安互联怎么上传网站小程序商城开发
  • 莱芜网站建设价格动易网站无法安装
  • 网站模板中文乱码asp源码 自助建站
  • 网站建设网站制作哪个好最好的flash网站
  • 西安网站建设服务商十强塘沽网红书店
  • 刷网站软件开小加工厂去哪接单子
  • 网站建设有关表格个人公司注册流程及需要的材料
  • 闲鱼网站做交易是先付款吗网站建设需要的准备
  • 网站建设工期时间表wordpress调用全站最新文章
  • 做网赌网站得多少钱做外贸最适合的网站系统
  • 免费网站建设网站有那些科研网站怎么建设
  • 做网站app价格多少钱怎么用域名做网站
  • 建设服装网站的意义建立个人网页需要多少钱
  • 免费网站申请域名com无锡做网站专业的公司
  • 企业网站免费建设校园门户网站建设项目技术支持
  • 把网站内容东西打出来怎么做flask做网站
  • 网站服务器容器建设化工网站的功能
  • 重庆有哪些做网站的公司互联网 创新创业项目
  • 如何写wordpress主题windows优化大师功能
  • 怎么做的英文网站做网站十大公司哪家好
  • 网站什么时候恢复彩色网站建设的行业新闻
  • 网站建设招聘网雄县网站建设
  • 网上商城互联网网站开发如何在百度发视频推广
  • 济南济阳网站建设事件营销的步骤
  • 建设企业网站模板下载网站文章伪原创如何做
  • 河南郑州建设网站免费创建网站教程