[发明专利]多类目标对象检测方法、装置、电子设备、存储介质有效
申请号: | 201910070496.2 | 申请日: | 2019-01-24 |
公开(公告)号: | CN109784293B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 肖潇;晋兆龙;张震国 | 申请(专利权)人: | 苏州科达科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 臧云霄;潘一诺 |
地址: | 215011 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 类目 对象 检测 方法 装置 电子设备 存储 介质 | ||
本发明提供一种多类目标对象检测方法、装置、电子设备、存储介质,多类目标对象检测方法,包括:训练第一神经网络模型以使第一神经网络模型输出准第一目标框和准第二目标框,准第一目标框指示第一类目标对象,准第二目标框指示第二类目标对象;训练第二神经网络模型,以使第二神经网络模型输出准第一目标框和准第二目标框的二级置信度及属性信息;将经训练的第一神经网络模型及经训练的、第二神经网络模型作为多类目标对象检测模型;将待检测图片输入多类目标对象检测模型,根据多类目标对象检测模型输出的准第一目标框和准第二目标框的二级置信度及属性信息确定优异度。本发明提供的方法及设备实现多类对象的同时检测。
技术领域
本发明涉及计算机应用领域,尤其涉及一种多类目标对象检测方法、装置、电子设备、存储介质。
背景技术
随着平安城市的普及和社会面监控的数量迅速增长,基于深度学习、AI(Artificial Intelligence)智能的发展,以及对各种监控图片、监控视频进行分析的各种技术需求,能够准确快速的从图片、视频中检测出具体的目标,尤其是人脸和行人,成为极其重要的关键部分,既要保证检测的精确度高,又不能遗漏任何目标,为后续分析提高了坚实基础。
基于传统算法的行人和人脸检测是分别独立的模块,且需要单独设计特征和单独训练分类器,能保证某些特定场景中的人脸和行人检测率,但是,想在光照、视角、色差等复杂多样的各种场景的图片和视频中准确快速的检测,难度比较大,无法得到合格的检测效果。
发明内容
本发明为了克服上述现有技术存在的缺陷,提供一种多类目标对象检测方法、装置、电子设备、存储介质,实现多类对象的同时检测。
根据本发明的一个方面,提供一种多类目标对象检测方法,包括:
训练第一神经网络模型以使所述第一神经网络模型输出准第一目标框和准第二目标框,所述准第一目标框指示第一类目标对象,所述准第二目标框指示第二类目标对象;
训练与所述第一神经网络模型级联的第二神经网络模型,以使所述第二神经网络模型输出所述准第一目标框和准第二目标框的二级置信度及属性信息;
将经训练的所述第一神经网络模型及经训练的、级联所述第一神经网络模型级联的第二神经网络模型作为多类目标对象检测模型;
将待检测图片输入所述多类目标对象检测模型,根据所述多类目标对象检测模型输出的准第一目标框和准第二目标框的二级置信度及属性信息确定各准第一目标框及各准第二目标框的优异度。
可选地,所述训练第一神经网络模型以使所述第一神经网络模型输出准第一目标框和准第二目标框还包括:
将测试图片数据输入第一神经网络模型,所述测试图片数据标定有第一目标框和第二目标框,所述第一目标框指示所述第一类目标对象,所述第二目标框指示所述第二类目标对象;
根据将所述第一神经网络模型输出的准第一目标框和准第二目标框分别与所述第一目标框和第二目标框进行匹配,并根据匹配结果调整所述第一神经网络模型中的参数以训练所述第一神经网络模型。
可选地,所述根据将所述第一神经网络模型输出的准第一目标框和准第二目标框分别与所述第一目标框和第二目标框进行匹配,并根据匹配结果调整所述第一神经网络模型中的参数以训练所述第一神经网络模型包括:
分别计算所述第一神经网络模型输出的准第一目标框和准第二目标框与所述第一目标框和第二目标框之间的重叠度;
根据所述重叠度将所述准第一目标框分配为第一类目标对象或其它,根据所述重叠度将所述准第二目标框分配为第二类目标对象或其它;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州科达科技股份有限公司,未经苏州科达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910070496.2/2.html,转载请声明来源钻瓜专利网。