[发明专利]分类方法和装置、电子设备、计算机存储介质有效
申请号: | 201711354471.2 | 申请日: | 2017-12-15 |
公开(公告)号: | CN108229341B | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 蒋正锴;邵婧;闫俊杰 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 方法 装置 电子设备 计算机 存储 介质 | ||
本发明实施例公开了一种分类方法和装置、电子设备、计算机存储介质,其中,方法包括:接收待分类图像;基于神经网络和剪裁技术对所述待分类图像进行处理,获得多个特征;对所述多个特征进行融合处理,得到融合特征;利用分类网络,基于所述融合特征获得所述待分类图像对应的分类结果。基于本发明上述实施例提供的一种分类方法,通过剪裁技术,充分利用了全局关键信息和局部特征信息;利用分类网络,基于融合特征获得对应待分类图像的分类结果,基于融合特征获得的分类结果,提升了对图像分类的准确度。
技术领域
本发明涉及计算机视觉技术,尤其是一种分类方法和装置、电子设备、计算机存储介质。
背景技术
行人属性分类是指根据给出一张行人图像,预测出行人图像中行人的性别、年龄、衣着颜色等属性。
通过卷积神经网络对行人进行属性分类,通常是通过卷积神经网络对需判断的行人图像提取全局整体特征,之后将得到的特征作为各属性的分类器的输入,进而实现对行人的属性分类的预测。
发明内容
本发明实施例所要解决的一个技术问题是:提供一种分类技术。
本发明实施例提供的一种分类方法,包括:
接收待分类图像;
基于神经网络和剪裁技术对所述待分类图像进行处理,获得多个特征;所述剪裁技术用于对待分类图像或基于待分类图像得到的完整特征执行剪裁处理;
多所述多个特征进行融合处理,得到融合特征;
利用分类网络,基于所述融合特征获得所述待分类图像对应的分类结果。
在基于本发明上述方法的另一个实施例中,所述基于神经网络和剪裁技术对所述待分类图像进行处理,获得多个特征,包括:
基于剪裁技术,对待分类图像执行剪裁处理,获得剪裁后的至少一个剪裁图像;所述剪裁图像的大小小于所述待分类图像,所有所述剪裁图像拼接后至少包括一个所述待分类图像;
基于神经网络分别对所述待分类图像和各所述剪裁图像进行处理,得到分别对应所述待分类图像和各所述剪裁图像的多个特征。
在基于本发明上述方法的另一个实施例中,在基于神经网络分别对所述待分类图像和各所述剪裁图像进行处理,得到分别对应所述待分类图像和各所述剪裁图像的多个特征之前,还包括:
将所述待分类图像和所有所述剪裁图像缩放到相同大小。
在基于本发明上述方法的另一个实施例中,所述基于神经网络和剪裁技术对所述待分类图像进行处理,获得多个特征,包括:
基于神经网络对输入的待分类图像进行处理,得到对应所述待分类图像的完整特征;
基于剪裁技术,对所述完整特征执行剪裁处理,获得剪裁后的多个对应所述待分类图像的特征;所述剪裁后得到的特征的大小小于或等于所述完整特征,所有所述特征拼接后至少包括一个所述完整特征。
在基于本发明上述方法的另一个实施例中,所述对所述完整特征执行剪裁处理,获得剪裁后的多个对应所述待分类图像的特征之后,还包括:
将所有所述待分类图像的特征缩放到相同大小。
在基于本发明上述方法的另一个实施例中,所述神经网络包括至少一个卷积层;
所述基于神经网络和剪裁技术对所述待分类图像进行处理,获得多个特征,包括:
迭代执行:
通过神经网络中上一个卷积层对待分类图像执行卷积计算,得到输出的完整特征图,将所述完整特征图剪裁得到至少两个特征图;所有所述特征图拼接后至少包括一个所述完整特征图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711354471.2/2.html,转载请声明来源钻瓜专利网。