[发明专利]目标识别方法及装置在审
申请号: | 201910614107.8 | 申请日: | 2019-07-09 |
公开(公告)号: | CN110334769A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 郭建亚;李骊 | 申请(专利权)人: | 北京华捷艾米科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06T5/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 薛娇 |
地址: | 100193 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度图像 目标识别 三通道 修复 采集目标 空洞填充 准确率 申请 | ||
本申请实施例公开了一种目标识别方法及装置,采集目标区域的RGB图像和深度图像;对深度图像进行空洞填充,得到修复的深度图像;对修复的深度图像进行编码得到三通道深度图像;将RGB图像和三通道深度图像输入预先训练好的识别模型,得到RGB图像中的目标识别结果。本申请利用预先训练好的识别模型,结合RGB图像和深度图像进行目标识别,提高了目标识别的准确率。
技术领域
本申请涉及图像处理技术领域,更具体地说,涉及一种目标识别方法及装置。
背景技术
目前的目标识别均是基于RGB图像实现的,通过从RGB图像中提取颜色特征、纹理特征和轮廓特征来识别目标。但由于成像时受到光照等环境因素的影响,现有的基于RGB图像的目标识别过程中所提取的特征并不能完整体现目标的可用特征信息,使得目标的识别准确率较低。
发明内容
本申请的目的是提供一种目标识别方法及装置,以提高目标识别的准确率,包括如下技术方案:
一种目标识别方法,包括:
采集目标区域的RGB图像和深度图像;
对所述深度图像进行空洞填充,得到修复的深度图像;
对所述修复的深度图像进行编码得到三通道深度图像;
将所述RGB图像和所述三通道深度图像输入预先训练好的识别模型,得到所述RGB图像中的目标识别结果;所述识别模型为,预先以若干标注的RGB图像以及与各标注的RGB图像对应的深度图像为样本训练得到。
上述方法,优选的,所述对所述深度图像进行空洞填充,得到修复的深度图像包括:
对所述深度图像进行二值化处理,得到掩模;
根据所述掩模确定所述深度图像中的空洞点;
对灰度化的所述RGB图像中的像素值进行聚类,得到聚类图像,所述聚类图像标识灰度化的所述RGB图像中像素值近似的像素点;
在灰度化的所述RGB图像中确定与所述空洞点对应的第一像素,以及与所述第一像素同类的所有第二像素,所述第二像素与所述深度图像中的非空洞点对应;
计算所述第一像素与各个第二像素间的距离;
将与所述第一像素间的距离最短的第二像素对应的深度值作为所述空洞点的填充值。
上述方法,优选的,所述对所述深度图像进行空洞填充,得到修复的深度图像包括:
对所述深度图像进行二值化处理,得到掩模;
根据所述掩模确定深度图像中的空洞点;
在所述RGB图像中确定与所述空洞点对应的第一像素,以及所述第一像素的预设邻域内的第二像素,所述第二像素为所述预设邻域内的与非空洞点对应的像素;
计算所述第一像素与各个第二像素间的距离;
将与所述第一像素间的距离最短的第二像素对应的深度值作为所述空洞点的填充值。
上述方法,优选的,所述识别模型包括:
深度网络单元和卷积神经网络单元;其中,
所述深度网络单元用于对所述三通道深度图像进行处理,以提取所述三通道深度图像的特征;
所述卷积神经网络单元用于对所述RGB图像进行处理,提取所述RGB图像的特征,对所述三通道深度图像的特征,以及所述RGB图像的特征进行处理,得到所述RGB图像中的目标识别结果。
上述方法,优选的,所述深度网络单元包括:三层多层感知机卷积层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华捷艾米科技有限公司,未经北京华捷艾米科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910614107.8/2.html,转载请声明来源钻瓜专利网。