[发明专利]分割模型的训练方法及装置、图像识别方法及装置在审
申请号: | 202210407639.6 | 申请日: | 2022-04-19 |
公开(公告)号: | CN114913338A | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 胡永恒;马晨光 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/82;G06T7/55;G06N3/04;G06N3/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分割 模型 训练 方法 装置 图像 识别 | ||
1.分割模型的训练方法,该分割模型包括:第一网络模型、第二网络模型以及第三网络模型,其中包括:
获取样本图像对;其中,所述样本图像对中包括对同一视觉范围拍摄后得到的RGB图像以及深度图像;
将所述深度图像输入第一网络模型,得到该第一网络模型输出的第一深度特征提取结果;
将所述深度图像与所述RGB图像的组合图像输入第二网络模型,得到该第二网络模型输出的目标对象的边缘特征;
将所述目标对象的边缘特征以及所述第一深度特征提取结果输入第三网络模型,得到该第三网络模型输出的目标对象的分割结果;
根据所述样本图像对的标签以及该目标对象的分割结果,对所述第一网络模型、第二网络模型以及第三网络模型进行参数调整。
2.根据权利要求1所述的方法,其中,
所述样本图像对的标签包括:第一标签以及第二标签;其中,第一标签为预先由人工形成的对所述RGB图像或所述深度图像的分割结果;第二标签为对所述第一标签进行高斯模糊处理后得到的;
所述对所述第一网络模型、第二网络模型以及第三网络模型进行参数调整,包括:
根据第一标签与目标对象的分割结果之间的差异,对第二网络模型以及第三网络模型进行参数调整;
根据第二标签与第一深度特征提取结果之间的差异,对第一网络模型进行参数调整。
3.根据权利要求1所述的方法,其中,
在所述将所述深度图像输入第一网络模型中之后,进一步包括:得到第一网络模型包括的中间层神经网络所提取出的目标对象的轮廓信息,将该中间层神经网络所提取出的目标对象的轮廓信息作为第二深度特征提取结果输出给所述第二网络模型;
在所述将所述深度图像与所述RGB图像的组合图像输入第二网络模型之后,并在得到该第二网络模型输出的目标对象的边缘特征之前,进一步包括:
由所述第二网络模型包括的前端各层神经网络对所述组合图像进行特征提取,得到初级边缘特征;
由第二网络模型包括的后端各层神经网络对该初级边缘特征以及第二深度特征提取结果进行处理,以便得到并输出所述目标对象的边缘特征。
4.根据权利要求3所述的方法,其中,调整所述第一网络模型及所述第二网络模型的所述卷积核以及卷积步长,使得所述初级边缘特征与所述第二深度特征提取结果对应的图像尺寸相同。
5.根据权利要求1所述的方法,其中,在将所述深度图像与所述RGB图像进行组合之前,进一步包括:
对所述RGB图像的像素值和所述深度图像的像素值进行归一化,并且将深度图像中值为空的像素的像素值归一化为0。
6.图像识别方法,其中包括:
获取对同一视觉范围拍摄后得到的待处理的RGB图像以及待处理的深度图像;
将待处理的深度图像输入第一网络模型,得到该第一网络模型输出的深度特征提取结果;
将待处理的深度图像与待处理的RGB图像的组合图像输入第二网络模型,得到该第二网络模型输出的目标对象的边缘特征;
将该目标对象的边缘特征以及该深度特征提取结果输入第三网络模型,得到该第三网络模型输出的目标对象的分割结果。
7.分割模型的训练装置,其中包括:
样本图像获取模块,配置为获取样本图像对;其中,样本图像对中包括对同一视觉范围拍摄后得到的所述RGB图像以及所述深度图像;
第一网络模型训练模块,配置为将所述深度图像输入第一网络模型,得到该第一网络模型输出的第一深度特征提取结果;
第二网络模型训练模块,配置为将所述深度图像与所述RGB图像组合,将该组合图像输入第二网络模型,得到该第二网络模型输出的目标对象的边缘特征;
第三网络模型训练模块,配置为将所述目标对象的边缘特征以及所述第一深度特征提取结果输入第三网络模型,得到该第三网络模型输出的目标对象的分割结果;
调整模块,配置为根据所述样本图像对的标签以及该目标对象的分割结果,对所述第一网络模型、第二网络模型以及第三网络模型进行参数调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210407639.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高效LNG储罐真空度检测维护方法
- 下一篇:一种可快速定位式弧焊机