[发明专利]基于深层卷积网络的RGB-D图像的物体检测和语义分割方法有效
申请号: | 201611168200.3 | 申请日: | 2016-12-16 |
公开(公告)号: | CN106709568B | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 刘波;邓广晖 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/00 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明公开了基于深层卷积网络的RGB‑D图像的物体检测和语义分割方法,属于深度学习及机器视觉领域。本方法采用的技术方案中使用Faster‑RCNN替换原来缓慢的RCNN,Faster‑RCNN使用GPU不仅在提取特征方面拥有很快速度,而且在网络中能同时产生区域方案,能够实现整个训练过程是端到端的训练,同时使用FCN执行RGB‑D图像的语义分割,FCN使用GPU和深层卷积网络快速提取图像的深层特征,利用反卷积操作把图像卷积的深层特征和浅层特征进行融合,把图像的局部语义信息融入到全局语义信息中。 | ||
搜索关键词: | 图像 语义分割 卷积 物体检测 网络 机器视觉 局部语义 快速提取 提取特征 图像卷积 训练过程 语义信息 操作把 反卷积 浅层 替换 融合 融入 全局 学习 | ||
【主权项】:
1.基于深层卷积网络的RGB‑D图像的物体检测和语义分割方法,其特征在于:S1、通过RGB图像计算灰度图像,通过灰度图像和HHA图像合并成HHG图像;HHA三个通道的离散傅里叶变换的光学图像中,有最明显的区别是A通道的离散傅里叶变换,其体现在直流分量即横纵坐标轴的强度很微弱,故舍去这个通道;由于RGB三个通道的离散傅里叶变换的光学图像都相似而且直流分量的强度也强烈,使用RGB图像的灰度图像替换HHA图像的中的A通道图像,所以使用融合RGB图像和深度图像的三通道图像为HHG图像;S2、使用Faster‑RCNN作为HHG图像的物体检测系统;使用HHG图像作为网络的输入数据,通过Faster‑RCNN中的RPN产生Region Proposals,通过Fast‑RCNN提取Region Proposals的特征,然后对每一个Region Proposals进行分类,检测结果为在HHG图像中用一个矩形框标出物体的位置和范围,并且标出该矩形框中物体的类别;S3、改变非极大值抑制即NMS保留边框的机制,把边框周围的边框数量作为评价因素;具体的步骤如下:每一个边框是一个5元组(x1,y1,x2,y2,score),其中(x1,y1)是边框左上角的坐标,(x2,y2)是边框右下角的坐标,score是边框中包含物体的置信度;边框首先按照score值对每一个元组进行升序排序;按如下公式计算边框的交比并重叠率;
其中,O(i,j)表示边框i和边框j的交比并重叠率,inter(i,j)表示边框i和边框j的重叠面积,area(i)表示边框i的面积,area(j)表示框j的面积;对于边框i,统计
的数量Sumi,如果Sumi≥δ,舍去边框i,反之保留,n代表边框总数量,δ代表取舍阈值;S4、利用HHG图像和FCN完成RGB‑D图像的语义分割任务;使用HHG图像作为FCN的输入数据,通过FCN提取语义特征并分类后,输出HHG图像中每一个像素点的类别标签,用标签值作为该像素点的像素值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611168200.3/,转载请声明来源钻瓜专利网。
- 上一篇:检测尿液中对羟基苯丙氨酸的试剂盒及其制备方法
- 下一篇:体感交互音乐播放器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序