[发明专利]一种基于神经网络的目标检测与识别方法有效
申请号: | 202110268857.1 | 申请日: | 2021-03-12 |
公开(公告)号: | CN112884064B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 宋永端;谈世磊;黄力;蒋自强;刘剑;谭力珲 | 申请(专利权)人: | 迪比(重庆)智能科技研究院有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 重庆晟轩知识产权代理事务所(普通合伙) 50238 | 代理人: | 王海凤 |
地址: | 401233 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 目标 检测 识别 方法 | ||
1.一种基于神经网络的目标检测与识别方法,其特征在于,包括如下步骤:
S100:构建新型YOLOv5网络模型,在现有YOLOv5网络模型的三层检测层后再增加一层检测层;
S200:训练新型YOLOv5网络模型,具体训练过程如下:
S210:构建训练数据集:采集N张图像,将每张图像进行尺寸变换使其适用于模型训练,并对每张进行标注,即标注目标框和目标分类标签,标注后的所有图像构成训练数据集;
S220:设置新型YOLOv5网络模型的中心点间距离阈值和纵横比阈值;
S230:初始化新型YOLOv5网络模型中的参数;
将训练数据集中的所有样本输入新型YOLOv5网络模型中,采用如下公式计算:
IoU为预测框和真实框的纵横比,表达式为:
RCIoU为重叠区域和真实框中心点距离,表达式为:
其中,si为各类别目标的分类得分,ε为人为设定的NMS阈值,M为预测框得分最高的值,Bi为预测框列表,b为预测框,bgt为真实框,ρ2(b,bgt)为预测框与真实框中心点的距离,表示为两个框中最小的封闭矩形盒子的对角线长度,ωgt和hgt分别表示为真实框的宽和高,ω和h分别表示为预测框的宽和高;
S240:当所述S230训练时,针对预测框的抑制问题,得分最高的预测框M与其它框Bi的IoU-CIoU相减后的值小于所设置的阈值ε,Bi框的得分si不变;否则,直接将si变成0,如此这个预测框将会被过滤掉;
再通过计算损失函数,其中包括目标损失函数、类别损失函数和框损失函数,通过反复迭代训练使损失函数最小,获取最优的网络模型参数;
S300:待检测图像检测,将待检测图像采用S210中的方法进行尺寸变换后输入训练好的新型YOLOv5网络模型中进行预测,输出目标的预测框和目标所属类别对应的概率值,设最大概率值对应的类别为该待检测图像中目标的预测类别。
2.如权利要求1所述的基于神经网络的目标检测与识别方法,其特征在于,所述S210构建训练数据集时,对标注好的N张图像通过Mosaic数据增强提升训练数据集中数据量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于迪比(重庆)智能科技研究院有限公司,未经迪比(重庆)智能科技研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110268857.1/1.html,转载请声明来源钻瓜专利网。