[发明专利]一种基于神经网络的目标检测与识别方法有效
申请号: | 202110268857.1 | 申请日: | 2021-03-12 |
公开(公告)号: | CN112884064B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 宋永端;谈世磊;黄力;蒋自强;刘剑;谭力珲 | 申请(专利权)人: | 迪比(重庆)智能科技研究院有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 重庆晟轩知识产权代理事务所(普通合伙) 50238 | 代理人: | 王海凤 |
地址: | 401233 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 目标 检测 识别 方法 | ||
本发明公开了一种基于神经网络的目标检测与识别方法,该方法在现有YOLOv5网络模型的三层检测层后再增加一层检测层得到新型YOLOv5网络模型;然后在考虑预测框和真实框的重叠区域、两个框的中心点的距离和两框的纵横比的情况下对新型YOLOv5网络模型进行训练,最后将待检测图像输入训练好的模型中,输出目标的预测框和目标所属类别对应的概率值,设最大概率值对应的类别为该待检测图像中目标的预测类别。该方法能够快速有效地检测出多类目标,尤其对小目标检测效果更为理想,同时克服了多目标紧凑排列易出现的漏检现象,算法检测速度也可以满足实时检测要求。
技术领域
本发明涉及计算机视觉及图像处理技术领域,特别涉及一种基于神经网络的目标检测与识别方法。
背景技术
近年来,随着人工智能技术的发展和计算设备算力的提升,使得人工智能算法被广泛应用于军事和民用领域。计算机视觉作为人工智能领域的一大分支,一直为国内外研究的热点方向,其主要针对图像和视频进行处理。视频处理中的目标进行检测与识别已衍生出众多实际应用,例如:人脸识别、舰船检测、自动驾驶路标障碍物检测与识别等,其都需要检测算法具备高准确性和实时性。
现有的神经网络目标检测与识别方法主要分为两大类。第一类为基于区域生成方式的,首先生成区域候选帧,然后进行分类。主流方法有SPP、R-CNN和Fast R-CNN等,这类方法检测准确率高,但速度很慢,无法满足实时检测需求。另外一类为采用端到端的方法,常用的方法为SSD、RetinaNet和YOLOv3等,这类方法检测速度快,但准确率稍微低了些。为了提升检测性能,业界学者对上述两大类方法做了大量的改进工作,使其能够更好的满足实际需求。但由于模型结构的限制,以上方法无法获得较快的检测速度。
YOLOv5为2020年最新提出的网络模型,其在检测准确率和速度方面都有了很大程度的提升,但在小目标提取方面表现不是很理想。
发明内容
针对现有技术存在的上述问题,本发明的要解决的技术问题是:在目标检测与识别过程中存在小目标和多目标排列紧凑情况下容易出现的漏检错检的问题。
为解决上述技术问题,本发明采用如下技术方案:一种基于神经网络的目标检测与识别方法,包括如下步骤:
S100:构建新型YOLOv5网络模型,在现有YOLOv5网络模型的三层检测层后再增加一层检测层;
S200:训练新型YOLOv5网络模型,具体训练过程如下:
S210:构建训练数据集:采集N张图像,将每张图像进行尺寸变换使其适用于模型训练,并对每张进行标注,即标注目标框和目标分类标签,标注后的所有图像构成训练数据集;
S220:设置新型YOLOv5网络模型的中心点间距离阈值和纵横比阈值;
S230:初始化新型YOLOv5网络模型中的参数;
将训练数据集中的所有样本输入新型YOLOv5网络模型中,采用如下公式计算:
IoU为预测框和真实框的纵横比,表达式为:
RCIoU为重叠区域和真实框中心点距离,表达式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于迪比(重庆)智能科技研究院有限公司,未经迪比(重庆)智能科技研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110268857.1/2.html,转载请声明来源钻瓜专利网。