[发明专利]一种基于Yolo V3的多源视频影像重点目标快速检测方法在审

专利信息
申请号: 201910143170.8 申请日: 2019-02-26
公开(公告)号: CN109919058A 公开(公告)日: 2019-06-21
发明(设计)人: 王超;张洪艳;张良培 申请(专利权)人: 武汉大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 王琪
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 快速检测 多源视频 监控视频 多源 影像 锁定 多源数据采集 视频数据源 视频帧图像 可见光 先验 红外监控 目标检测 目标探测 确切位置 训练数据 影像数据 输出 多尺度 精细化 全天时 传感器 校正 追踪 监测 制作
【权利要求书】:

1.一种基于Yolo V3的多源视频影像重点目标快速检测方法,其特征在于,包括以下步骤:

步骤一、获取往期多源即多传感器获取的区域视频监控数据;

步骤二、基于所述往期区域视频监控数据,通过视频帧截取得到所述往期监控视频的图像格式数据,并对所述图像数据进行几何校正与超分辨率重建预处理,得到预处理后的图像;

步骤三、联合重点嫌疑目标的先验材料,对预处理后的图像数据进行所述嫌疑目标的目标信息标注,构建训练、验证与测试对应的数据集;

步骤四、将所述数据集输入到目标检测模型Yolo V3中进行训练与交叉验证,输出训练好的重点嫌疑目标快速探测模型;

步骤五、将所述嫌疑目标所有可能藏匿点及潜逃路线所对应的实时监控视频输入到所述重点嫌疑目标快速探测模型中进行检测,输出所述嫌疑目标出现的区域;

步骤六、对所述嫌疑目标出现的区域利用无人机飞行器进行多源影像数据采集并用训练好的快速检测模型进行目标检测,在影像上对所述重点嫌疑目标进行精准定位,综合上述多源数据的目标检测信息,对目标进行锁定与追踪。

2.根据权利要求1所述的一种基于Yolo V3的多源视频影像重点目标快速检测方法,其特征在于:步骤一所述往期区域视频监控数据包括:可见光传感器监控数据,热红外传感器监控数据;其中可见光传感器在白昼对重点区域进行高分辨率监控,热红外传感器在夜晚对目标进行监控,从而达到全天时监控的效果。

3.根据权利要求1所述的一种基于Yolo V3的多源视频影像重点目标快速检测方法,其特征在于:步骤二中超分辨率重建采用基于生成式对抗网络的影像超分重建方法,具体实现方式如下,

生成式对抗网络的目标函数如式(2)所示:

其中maxmin表示生成模块与判别模块进行博弈,直至达到纳什均衡;D为判别器,G为生成器,E表示取平均值;Fl表示真实图像,即高分辨率图像;D(Fl)表示将当前图像判别为真实图像的概率,所述概率越高越好,并尽量将真实图像判别为真,将生成图像判别为假;G(Fs|f)表示生成模块,(Fs|f)表示待重建的低分辨率影像,生成器希望生成的图像尽可能为真;log(1-D(G(Fs|f)))为生成损失,其值越小越好;为判别损失,其值越大越好;Wi,j与Hi,j表示像素行列的个数,IHR表示高分影像,ILR表示低分影像,(Gθ(ILR))表示重建后的影像,为激活函数。

4.根据权利要求1所述的一种基于Yolo V3的多源视频影像重点目标快速检测方法,其特征在于:步骤三所述嫌疑目标的先验数据包括但不限于以下选项:所述嫌疑目标的驾驶车辆信息,所述嫌疑目标的可疑路线信息,所述嫌疑目标的人物画像信息,所述嫌疑目标的社会关系网络。

5.根据权利要求1-4任一权利要求所述的一种基于Yolo V3的多源视频影像重点目标快速检测方法,其特征在于:步骤四中获得重点嫌疑目标快速探测模型的具体实现方式如下,

a.设置所述目标检测模型Yolo V3的训练超参数,其中,所述训练超参数包括批处理尺寸(batch size),类别信息包括目标与背景,权值衰减,学习率,动量;

b.配置所述目标检测模型Yolo V3的训练环境,其中,所述训练环境包括以下依赖库以及工具:GPU、CUDA、Opencv;

c.按比例划分出训练、验证与测试数据集进行模型训练与交叉验证,获得对应的重点嫌疑目标快速探测模型;

d.基于所述数据集,采用数据集增强技术,对所述数据集进行多角度旋转,尺度缩放操作,并作为输入,对目标检测模型Yolo V3模型进行多尺度、多角度训练,增强模型泛化能力,采用交叉训练与验证的方式,得到最终的所述目标快速探测模型,其目标优化函数如公式(3)所示,包括分类误差与定位误差:

其中λcoord表示权重,一般定位误差比重大,分类误差权重较小;表示栅格中是否有目标出现,若出现值取为1,不出现为0,i,j表示图像上所划分栅格的行列值;xi、yi与表示预测边界框的中心点坐标与长宽值的平方根,与表示ground truth里的标注边界框的中心点坐标与长宽值的平方根;表示含有目标的边界框预测值,ci为预测置信度,为ground truth里目标置信度,显然值为1;表示不含目标的边界框预测值;表示类别预测,其中判断是否有目标的中心点落在栅格中,若有,则该栅格就负责预测目标的类别概率值,pi(c)表示预测类别概率值,表示ground truth里目标概率值,值通常取1。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910143170.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top