[发明专利]识别处理设备、识别处理方法和程序有效
申请号: | 201780092890.5 | 申请日: | 2017-07-12 |
公开(公告)号: | CN110832542B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 小野大地;堀川勉 | 申请(专利权)人: | 索尼互动娱乐股份有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张晓明 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 处理 设备 方法 程序 | ||
提供了一种识别处理设备、识别处理方法和程序,其能够有效缩小将使用三维卷积神经网络进行识别处理的三维区域。第一识别处理执行部分(68)在通过捕获真实空间的图像而获取的、并且用于生成体素数据的捕获图像上执行第一识别处理。目标二维区域确定部分(70)基于第一识别处理的结果来确定捕获图像的二维区域占据部分。目标三维区域确定部分(72)基于二维区域和相机获取捕获图像时相机的位置来确定真实空间中的三维区域。第二识别处理执行部分(74)使用三维卷积神经网络在与三维区域中的位置相关联的体素数据上执行第二识别处理。
技术领域
本发明涉及识别处理设备、识别处理方法和程序。
背景技术
已知的一种技术通过使用三维卷积神经网络在将三维空间中的位置与体素值相关联的体素数据上执行识别处理来执行诸如三维空间中的对象识别的识别处理。在这种识别处理技术中使用的体素数据是通过例如使用通过捕获三维空间的图像而获取的捕获图像而生成的。
发明内容
[技术问题]
一般来说,使用三维卷积神经网络进行识别处理的计算成本高。因此,希望使用三维卷积神经网络进行识别处理的体素数量尽可能少。
这里,例如,为了降低使用三维卷积神经网络的识别处理的计算成本,可以设想在执行识别处理之前缩小要进行识别处理的三维区域。
然而,在这种情况下,单独准备用于缩小三维区域的数据是麻烦和低效的。
本发明是针对上述问题做出的,并且本发明的目的之一是提供一种识别处理设备、识别处理方法和程序,其能够有效缩小使用三维卷积神经网络进行识别处理的三维区域。
[解决问题]
为了解决上述问题,根据本发明的识别处理设备是使用三维卷积神经网络对体素数据执行识别处理、其中真实空间中的位置和体素值彼此关联的识别处理设备。该识别处理设备包括:第一识别处理执行部分,其在通过捕获真实空间的图像而获取的、并且用于生成体素数据的捕获图像上执行第一识别处理;二维区域确定部分,其基于第一识别处理的结果确定捕获图像的二维区域占据部分;三维区域确定部分,其基于二维区域和相机获取捕获图像时相机的位置来确定真实空间中的三维区域;以及第二识别处理执行部分,其使用三维卷积神经网络在与三维区域中的位置相关联的体素数据上执行第二识别处理。
根据本发明的一个方面,第一识别处理执行部分在通过从彼此不同的位置捕获真实空间的图像而获取的第一捕获图像和第二捕获图像中的每一个上执行第一识别处理。二维区域确定部分基于第一识别处理的结果,确定第一捕获图像的第一二维区域占据部分、以及第二捕获图像的第二二维区域占据部分。三维区域确定部分确定基于第一二维区域和相机获取第一捕获图像时的相机位置确定的第一三维区域、以及基于第二二维区域和相机获取第二捕获图像时的相机位置确定的第二三维区域。并且第二识别处理执行部根据第一三维区域和第二三维区域,使用三维卷积神经网络在与真实空间中的三维区域中的位置相关联的体素数据上执行第二识别处理。
在这方面,第二识别处理执行部分使用三维卷积神经网络在与三维区域中第一三维区域和第二三维区域相交的位置相关联的体素数据上执行第二识别处理。
在本发明的一个方面,第一识别处理执行部分在与深度信息相关联的捕获图像上执行第一识别处理,并且三维区域确定部分基于与二维区域中的位置相关联的深度信息确定真实空间中的三维区域。
在本发明的一个方面,第一识别处理执行部分使用二维卷积神经网络在捕获图像上执行第一识别处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼互动娱乐股份有限公司,未经索尼互动娱乐股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780092890.5/2.html,转载请声明来源钻瓜专利网。