[发明专利]一种基于通道注意力和自监督约束的服装解析方法及系统有效
申请号: | 202110226332.1 | 申请日: | 2021-03-01 |
公开(公告)号: | CN112927236B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 项欣光;左成婷;张冬 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06N3/04;G06N3/08 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 杜阳阳 |
地址: | 210094 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通道 注意力 监督 约束 服装 解析 方法 系统 | ||
本发明涉及一种基于通道注意力和自监督约束的服装解析方法及系统,该方法包括:获取服装图片数据集,服装图片数据集中包括服装解析图;将服装图片数据集中各服装图片输入神经网络,神经网络包括通道注意力模块;基于通道注意力模块,对输入的服装图片进行多次图像特征提取,获得各服装图片的输出特征图;基于强监督约束和自监督约束,对神经网络进行迭代训练,获得训练好的神经网络模型;强监督约束为各服装图片对应的服装解析图对输出特征图的强监督约束,自监督约束为神经网络中各次解码输出数据中高层输出对低层输出的自监督约束;将待解析服装图片输入训练好的神经网络模型中,输出服装解析图。本发明减少了参数量,提高了服装解析精度。
技术领域
本发明涉及计算机视觉语义分割技术领域,特别是涉及一种基于通道注意力和自监督约束的服装解析方法及系统。
背景技术
图像语义分割是计算机视觉领域的核心研究问题之一,目的是从图像中挖掘出正确的高层语义信息,并正确关联到每个像素点。服装解析是语义分割领域中一个重要的更细化的研究方向,其目的是自动分析获取到的图像,对其中的人体服装进行解析,以代替人眼完成对服装的判断和定位。服装解析的应用前景广泛,主要涉及虚拟换衣、行人重识别、服装推荐、服装检索等领域,但由于服装解析是近几年新兴的研究方向,相关技术较少;同时深度学习技术又在不断的发展壮大,因此,亟需一种紧跟当前发展趋势的先进服装解析方法。
现有的服装解析方法主要分为两大类,一类是基于多阶段的方法,另一类是基于端到端的方法。多阶段方法大多将人体姿态估计、服装分类作为先验知识添加到服装解析网络中,并利用条件随机场作为网络后续辅助处理手段。而端到端的方法则是直接将原始时尚服装图片输入到服装解析网络中,并由该网络直接输出一个解析好的服装预测图。但是这些服装解析网络要么过多引入先验知识和后续辅助;要么引入的先验知识中存在噪声,从而导致提取到的特征不是最优的;要么需要庞大的网络结构。还有一些网络从简化结构角度进行了改进,但是分割性能仍有待提升。
发明内容
本发明的目的是提供一种基于通道注意力和自监督约束的服装解析方法及系统,提高了服装解析精度。
为实现上述目的,本发明提供了如下方案:
一种基于通道注意力和自监督约束的服装解析方法,所述方法包括:
获取服装图片数据集,所述服装图片数据集中包括和各服装图片对应的服装解析图;
将所述服装图片数据集中各所述服装图片输入神经网络,所述神经网络包括通道注意力模块;
基于所述通道注意力模块,对输入的所述服装图片进行多次图像特征提取,获得各所述服装图片的输出特征图;
基于强监督约束和自监督约束,对所述神经网络进行迭代训练,获得训练好的神经网络模型;所述强监督约束为各服装图片对应的服装解析图对所述输出特征图的强监督约束,所述自监督约束为所述神经网络中各次解码输出数据中高层输出对低层输出的自监督约束;
将待解析服装图片输入所述训练好的神经网络模型中,输出服装解析图。
可选地,将所述服装图片数据集中各所述服装图片输入神经网络之前,所述方法还包括:
对所述服装图片数据集中各所述服装图片进行归一化处理。
可选地,所述图像特征提取,具体包括:
对输入所述神经网络的各所述服装图片进行不同的卷积操作,得到第一数据;
对所述第一数据进行平均池化,得到第二数据;
用设定卷积对所述第二数据进行特征提取,得到第一特征数据;
对所述第一数据进行最大池化,得到第三数据;
用所述设定卷积对所述第三数据进行特征提取,得到第二特征数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110226332.1/2.html,转载请声明来源钻瓜专利网。