[发明专利]多层神经网络模型的训练和应用方法、装置及存储介质在审
申请号: | 201910149265.0 | 申请日: | 2019-02-28 |
公开(公告)号: | CN111626400A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 李岩;黄耀海;赵东悦 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京怡丰知识产权代理有限公司 11293 | 代理人: | 迟军;李艳丽 |
地址: | 日本国东京都*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多层 神经网络 模型 训练 应用 方法 装置 存储 介质 | ||
本公开提供一种多层神经网络模型的训练和应用方法、装置及存储介质。本公开利用网络模型中的多层的输出特征图进行目标识别,来提高目标识别的精度。
技术领域
本公开涉及一种针对多层神经网络的建模领域,尤其涉及一种利用多层神经网络模型进行的多任务应用。
背景技术
近年来,基于建模的多层神经网络模型已被广泛地应用在计算机业务中,诸如人脸检测、车辆检测等。在这些对目标(人脸、车辆)的检测业务中,确定目标在图像中的位置对于后续针对目标的属性识别、目标的特征点识别等目标识别业务是十分重要的。在传统的方法中,需要针对不同的业务分别训练网络模型,例如,需要针对人脸检测和人脸识别分别训练网络模型,并且人脸检测网络模型的输出要进行重新匹配后才能作为人脸识别网络模型的输入,这些都会对网络模型的简化以及业务精度造成负面影响。对此,业界提出了一种可执行多任务的网络模型,该多任务的网络模型可同时执行多种任务,从而使要使用的可学习参数的数量更少、以更小的计算量和更高的精度实现多任务。
图1(a)示出了一种基于深度学习的可执行多任务的网络模型,以人体检测为例,如图1(b)的流程图所示,当原始图像输入到该网络模型中时,图像以特征图的形式在该网络模型中进行前向传播,提取出第N层的输出特征图,根据预先确定的候选区域框(针对各人体(目标)的矩形框),确定提取出的输出特征图中的子区域特征图,该子区域特征图中包括由候选区域框确定的人体区域。将该子区域特征图输入到可进行人体检测的目标检测网络模型以及可进行人体识别的目标识别网络模型中。一方面,通过目标检测网络模型可检测出图像中的人体数量和位置;另一方面,通过目标识别网络模型可进行人体识别,例如,识别出人体的头部,或者识别出人的性别或年龄范围等。
当原始图像在网络模型中进行前向传播时,如果网络模型中存在池化层,则特征图在经过池化层的池化处理后,特征图的尺寸会变小。如果按照图1(a)和图1(b)所示的方法,根据第N层的输出特征图确定出的子区域特征图的尺寸可能会很小,其所包含的有用信息也较少,这使得对目标的检测和对目标的识别的精度不高,导致最终输出的目标检测结果和目标识别结果不够理想。
发明内容
本公开旨在提高能够进行多任务的神经网络模型的目标识别结果的精度。
根据本公开的一方面,提供一种多层神经网络模型的应用方法,所述应用方法包括:基于向多层神经网络模型输入的图像,提取所述网络模型中的至少两层的输出特征图;根据预先确定的候选区域框,获得提取的各输出特征图中对应同一目标的子区域特征图;利用获得的多个子区域特征图进行目标识别。
根据本公开的另一方面,提供一种多层神经网络模型的训练方法,所述网络模型包括第一子网络和第二子网络,所述第一子网络和第二子网络分别包括至少一层,且第一子网络在网络模型中的层级高于第二子网络;所述网络模型还包括进行目标检测的第三子网络和进行目标识别的第四子网络;所述训练方法包括:将第二子网络的输出特征图输入到所述第三子网络,根据第三子网络的目标检测结果和预先确定的检测真值来训练所述第一子网络、第二子网络和第三子网络;将所述第一子网络的输出特征图输入到所述第四子网络,根据第四子网络的目标识别结果和预先确定的识别真值来训练所述第四子网络。
根据本公开的另一方面,提供一种多层神经网络模型的应用方法,所述网络模型包括第一子网络和第二子网络,所述第一子网络和第二子网络分别包括至少一层,且第一子网络在网络模型中的层级高于第二子网络;所述网络模型还包括进行目标检测的第三子网络和进行目标识别的第四子网络;所述应用方法包括:将第二子网络的输出特征图输入至第三子网络,以使第三子网络基于接收到的特征图进行目标检测任务;将第一子网络输出的输出特征图输入至第四子网络,以使第四子网络基于接收到的特征图进行目标识别任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910149265.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水下潜标可扩展电源系统
- 下一篇:可分离式投影设备