[发明专利]基于深层卷积网络的RGB-D图像的物体检测和语义分割方法有效

专利信息
申请号: 201611168200.3 申请日: 2016-12-16
公开(公告)号: CN106709568B 公开(公告)日: 2019-03-22
发明(设计)人: 刘波;邓广晖 申请(专利权)人: 北京工业大学
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08;G06K9/00
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 沈波
地址: 100124 *** 国省代码: 北京;11
权利要求书: 暂无信息 说明书: 暂无信息
摘要: 发明公开了基于深层卷积网络的RGB‑D图像的物体检测和语义分割方法,属于深度学习及机器视觉领域。本方法采用的技术方案中使用Faster‑RCNN替换原来缓慢的RCNN,Faster‑RCNN使用GPU不仅在提取特征方面拥有很快速度,而且在网络中能同时产生区域方案,能够实现整个训练过程是端到端的训练,同时使用FCN执行RGB‑D图像的语义分割,FCN使用GPU和深层卷积网络快速提取图像的深层特征,利用反卷积操作把图像卷积的深层特征和浅层特征进行融合,把图像的局部语义信息融入到全局语义信息中。
搜索关键词: 图像 语义分割 卷积 物体检测 网络 机器视觉 局部语义 快速提取 提取特征 图像卷积 训练过程 语义信息 操作把 反卷积 浅层 替换 融合 融入 全局 学习
【主权项】:
1.基于深层卷积网络的RGB‑D图像的物体检测和语义分割方法,其特征在于:S1、通过RGB图像计算灰度图像,通过灰度图像和HHA图像合并成HHG图像;HHA三个通道的离散傅里叶变换的光学图像中,有最明显的区别是A通道的离散傅里叶变换,其体现在直流分量即横纵坐标轴的强度很微弱,故舍去这个通道;由于RGB三个通道的离散傅里叶变换的光学图像都相似而且直流分量的强度也强烈,使用RGB图像的灰度图像替换HHA图像的中的A通道图像,所以使用融合RGB图像和深度图像的三通道图像为HHG图像;S2、使用Faster‑RCNN作为HHG图像的物体检测系统;使用HHG图像作为网络的输入数据,通过Faster‑RCNN中的RPN产生Region Proposals,通过Fast‑RCNN提取Region Proposals的特征,然后对每一个Region Proposals进行分类,检测结果为在HHG图像中用一个矩形框标出物体的位置和范围,并且标出该矩形框中物体的类别;S3、改变非极大值抑制即NMS保留边框的机制,把边框周围的边框数量作为评价因素;具体的步骤如下:每一个边框是一个5元组(x1,y1,x2,y2,score),其中(x1,y1)是边框左上角的坐标,(x2,y2)是边框右下角的坐标,score是边框中包含物体的置信度;边框首先按照score值对每一个元组进行升序排序;按如下公式计算边框的交比并重叠率;其中,O(i,j)表示边框i和边框j的交比并重叠率,inter(i,j)表示边框i和边框j的重叠面积,area(i)表示边框i的面积,area(j)表示框j的面积;对于边框i,统计的数量Sumi,如果Sumi≥δ,舍去边框i,反之保留,n代表边框总数量,δ代表取舍阈值;S4、利用HHG图像和FCN完成RGB‑D图像的语义分割任务;使用HHG图像作为FCN的输入数据,通过FCN提取语义特征并分类后,输出HHG图像中每一个像素点的类别标签,用标签值作为该像素点的像素值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201611168200.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top