[发明专利]机器人及其手部图像分割方法和装置在审
申请号: | 202110182033.2 | 申请日: | 2021-02-08 |
公开(公告)号: | CN112950652A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 顾在旺;程骏;庞建新 | 申请(专利权)人: | 深圳市优必选科技股份有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/13;G06K9/00;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 刘永康 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器人 及其 图像 分割 方法 装置 | ||
本申请属于机器人领域,提出了一种机器人及其手部图像分割方法和装置,该方法包括:获取待分割图像;根据已训练的第一神经网络模型对所述待分割图像进行特征提取,获得所述待分割图像对应的第一特征图像;根据预设的空洞卷积核获取所述待分割图像对应的第二特征图像;根据已训练的解码神经网络模型对所述第一特征图像和所述第二特征图像进行解码处理,确定所述待分割图像的手部图像。本申请通过空洞卷积核可以学习到待分割图像中感受域更大的特征,能够为解码神经网络模型提供更为丰富的特征数据,在与多尺寸卷积分割操作方式的计算量基本相同的情况下,能够得到更为准确的分割结果,有利于提高手部图像的分割精度。
技术领域
本申请属于机器人领域,尤其涉及机器人及其手部图像分割方法和装置。
背景技术
近年来,随着人工智能的快速发展,机器人端部署了许多人工智能的应用。机器人通过人工智能算法可以与人进行互动。在机器人与人交互过程中,手势是一种非常简单和方便的互动方式。机器人为了能够有效的进行手势互动,需要准确的分割出交互对象的手部区域,从而便于对交互对象的手势进行精确的识别。
目前的手部区域识别算法通常采用全卷积神经网络模型。在编码部分,使用连续的卷积来提取图像中的特征,同时使用池化操作减少提取到的特征的尺寸,以达到减少网络计算量的目的。这种连续的卷积和池化操作可以保证提取特征的平稳不变形,但会减少提取特征的尺寸,不利于对每个像素进行判断。虽然通过反卷积可以对特征进行尺寸还原,但从一个较小尺寸的特征图还原时,会丢失部分信息,而且手势种类多种多样,所处的环境容易变化,不利于提高手部图像的分割精度。
发明内容
有鉴于此,本申请实施例提供了一种机器人及其手部图像分割方法和装置,以解决现有技术中进行手部图像分割时,不利于提高手部图像的分割精度的问题。
本申请实施例的第一方面提供了一种手部图像分割方法,所述方法包括:
获取待分割图像;
根据已训练的第一神经网络模型对所述待分割图像进行特征提取,获得所述待分割图像对应的第一特征图像;
根据预设的空洞卷积核获取所述待分割图像对应的第二特征图像;
根据已训练的解码神经网络模型对所述第一特征图像和所述第二特征图像进行解码处理,确定所述待分割图像的手部图像。
结合第一方面,在第一方面的第一种可能实现方式中,在根据已训练的第一神经网络模型对所述待分割图像进行特征提取,获得所述待分割图像对应的第一特征图像之前,所述方法还包括:
对所述待分割图像进行归一化处理。
结合第一方面的第一种可能实现方式,在第一方面的第二种可能实现方式中,对所述待分割图像进行归一化处理,包括:
确定所述待分割图像中像素的像素值;
根据公式:(Ii-Imin)/Imax确定每个像素对应的归一化数值,其中Ii为任意像素的像素值,Imin为待分割图像中的像素的最小像素值,Imax为待分割图像中的像素的最大像素值。
结合第一方面,在第一方面的第三种可能实现方式中,根据已训练的解码神经网络模型对所述第一特征图像和所述第二特征图像进行解码处理,确定所述待分割图像的手部图像,包括:
根据已训练的解码神经网络模型对所述第一特征图像和所述第二特征图像进行解码处理,得到所述待分割图像中的人像分割结果和边缘检测结果;
根据所述人像分割结果和所述边缘检测结果确定所述待分割图像的手部图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优必选科技股份有限公司,未经深圳市优必选科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110182033.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序