[发明专利]一种基于实例分割的行人属性识别方法在审
申请号: | 202110339871.6 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113033428A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 任利;齐晨阳;王云;毛晨;罗俊海;鲜维富;邓文浩 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 实例 分割 行人 属性 识别 方法 | ||
本发明属于图像处理领域,具体为一种基于实例分割的行人属性识别方法。大多数行人属性识别算法都会将图像中的背景信息包含进来,并将背景信息一起进行识别。然而这些背景信息对于属性识别来说具有一定的影响性。因此本发明使用YOLACT算法对行人属性识别过程中的背景信息进行抑制处理。首先针对背景噪声问题,本发明采用YOLACT算法进行背景抑制处理,并得到了很好的效果;另外本发明提出将不同大小的特征图拼接后再进行多任务网络预测的方法提高识别准确度;最后为了平衡多任务训练过程中不同任务具有不同的训练速度,本发明提出了梯度权重损失函数很好的解决了该问题。
技术领域
本发明属于图像处理领域,具体涉及一种基于实例分割的行人属性识别方法。
背景技术
目前为止,行人属性识别是一项艰巨的挑战,尤其是数据非常多样化的情况下,如背景和前景非常杂乱、拍摄时的不同的距离、行人的多个姿势以及部分遮挡等问题。以往行人属性识别的做法还达不到令人满意的效果,常使用的方法有基于检测的行人属性识别,该方法需要先对行人做检测,检测出行人的不同位置,如头、上半身和下半身,然后在这些检测到的位置进行属性识别,但该方法在复杂环境下的效果表现并不算好,并且具有昂贵的标注工作。还有基于注意力机制的行人属性识别方法,该方法依赖注意力机制对行人不同的位置做属性识别,但该方法容易包含背景信息,从而影响识别效果。因此,通过实例分割的方法抑制背景、突出前景,将有利于提升行人属性的识别的效果。
发明内容
本发明要解决的技术问题是:针对复杂环境下背景对行人属性识别产生较大影响的问题进行了相应改进。该网络主要通过实例分割的方法抑制背景、突出前景,有利于后期处理,可提高人体属性识别效果。
本发明提出了基于实例分割的人体属性识别算法,并设计了ISPAR网络,该算法包括以下步骤:
步骤1:输入图片经过实例分割网络提取出不同尺度的特征图像以及行人掩码;
步骤2:对行人掩码进行下采样操作放缩到和特征图相同的大小;
步骤3:将放缩后的行人掩码与对应特征图进行逐元素相乘,通过预测的行人掩码来抑制背景干扰;
步骤4:采用注意力模块来突出更值得关注的通道特征,并进行全局平均池化操作对特征图进行压缩;
步骤5:对不同尺度特征图计算得到的压缩特征进行拼接;
步骤6:使用多任务分类网络对不同的属性进行分类。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
(1)针对抑制背景噪声问题,本发明采用改进后的YOLACT算法进行处理,并得到了很好的效果;
(2)提出将不同大小的特征图拼接后再进行多任务网络预测的方法,使得不同大小特征图所预测的不同属性之间能够进行共享,提高了网络预测的准确度;
(3)提出的梯度权重损失函数很好的解决了平衡多任务训练过程中不同任务具有不同的训练速度的问题。
附图说明
图1 ISPAR网络框架图
图2 YOLACT实例分割网络结构图
图3多层特征拼接结构图
图4掩码抑制背景算法流程图
图5背景抑制效果图
图6 MCAM模块结构图
图7多任务分类网络图
图8计算损失函数算法流程图
具体实施方式
下面结合附图对本发明进一步说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110339871.6/2.html,转载请声明来源钻瓜专利网。