[发明专利]一种基于Yolo V3的多源视频影像重点目标快速检测方法在审

申请号：	201910143170.8	申请日：	2019-02-26
公开（公告）号：	CN109919058A	公开（公告）日：	2019-06-21
发明（设计）人：	王超;张洪艳;张良培	申请（专利权）人：	武汉大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	王琪
地址：	430072 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	快速检测多源视频监控视频多源影像锁定多源数据采集视频数据源视频帧图像可见光先验红外监控目标检测目标探测确切位置训练数据影像数据输出多尺度精细化全天时传感器校正追踪监测制作
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于Yolo V3的多源视频影像重点目标快速检测方法，其特征在于，包括以下步骤：

步骤一、获取往期多源即多传感器获取的区域视频监控数据；

步骤二、基于所述往期区域视频监控数据，通过视频帧截取得到所述往期监控视频的图像格式数据，并对所述图像数据进行几何校正与超分辨率重建预处理，得到预处理后的图像；

步骤三、联合重点嫌疑目标的先验材料，对预处理后的图像数据进行所述嫌疑目标的目标信息标注，构建训练、验证与测试对应的数据集；

步骤四、将所述数据集输入到目标检测模型Yolo V3中进行训练与交叉验证，输出训练好的重点嫌疑目标快速探测模型；

步骤五、将所述嫌疑目标所有可能藏匿点及潜逃路线所对应的实时监控视频输入到所述重点嫌疑目标快速探测模型中进行检测，输出所述嫌疑目标出现的区域；

步骤六、对所述嫌疑目标出现的区域利用无人机飞行器进行多源影像数据采集并用训练好的快速检测模型进行目标检测，在影像上对所述重点嫌疑目标进行精准定位，综合上述多源数据的目标检测信息，对目标进行锁定与追踪。

2.根据权利要求1所述的一种基于Yolo V3的多源视频影像重点目标快速检测方法，其特征在于：步骤一所述往期区域视频监控数据包括：可见光传感器监控数据，热红外传感器监控数据；其中可见光传感器在白昼对重点区域进行高分辨率监控，热红外传感器在夜晚对目标进行监控，从而达到全天时监控的效果。

3.根据权利要求1所述的一种基于Yolo V3的多源视频影像重点目标快速检测方法，其特征在于：步骤二中超分辨率重建采用基于生成式对抗网络的影像超分重建方法，具体实现方式如下，

生成式对抗网络的目标函数如式(2)所示：

其中maxmin表示生成模块与判别模块进行博弈，直至达到纳什均衡；D为判别器，G为生成器，E表示取平均值；F_l表示真实图像，即高分辨率图像；D(F_l)表示将当前图像判别为真实图像的概率，所述概率越高越好，并尽量将真实图像判别为真，将生成图像判别为假；G(F_s|f)表示生成模块，(F_s|f)表示待重建的低分辨率影像，生成器希望生成的图像尽可能为真；log(1-D(G(F_s|f)))为生成损失，其值越小越好；为判别损失，其值越大越好；W_i，j与H_i，j表示像素行列的个数，I^HR表示高分影像，I^LR表示低分影像，(G_θ(I^LR))表示重建后的影像，为激活函数。

4.根据权利要求1所述的一种基于Yolo V3的多源视频影像重点目标快速检测方法，其特征在于：步骤三所述嫌疑目标的先验数据包括但不限于以下选项：所述嫌疑目标的驾驶车辆信息，所述嫌疑目标的可疑路线信息，所述嫌疑目标的人物画像信息，所述嫌疑目标的社会关系网络。

5.根据权利要求1-4任一权利要求所述的一种基于Yolo V3的多源视频影像重点目标快速检测方法，其特征在于：步骤四中获得重点嫌疑目标快速探测模型的具体实现方式如下，

a.设置所述目标检测模型Yolo V3的训练超参数，其中，所述训练超参数包括批处理尺寸(batch size)，类别信息包括目标与背景，权值衰减，学习率，动量；

b.配置所述目标检测模型Yolo V3的训练环境，其中，所述训练环境包括以下依赖库以及工具：GPU、CUDA、Opencv；

c.按比例划分出训练、验证与测试数据集进行模型训练与交叉验证，获得对应的重点嫌疑目标快速探测模型；

d.基于所述数据集，采用数据集增强技术，对所述数据集进行多角度旋转，尺度缩放操作，并作为输入，对目标检测模型Yolo V3模型进行多尺度、多角度训练，增强模型泛化能力，采用交叉训练与验证的方式，得到最终的所述目标快速探测模型，其目标优化函数如公式(3)所示，包括分类误差与定位误差：

其中λ_coord表示权重，一般定位误差比重大，分类误差权重较小；表示栅格中是否有目标出现，若出现值取为1，不出现为0,i,j表示图像上所划分栅格的行列值；x_i、y_i与表示预测边界框的中心点坐标与长宽值的平方根，与表示ground truth里的标注边界框的中心点坐标与长宽值的平方根；表示含有目标的边界框预测值，c_i为预测置信度，为ground truth里目标置信度，显然值为1；表示不含目标的边界框预测值；表示类别预测，其中判断是否有目标的中心点落在栅格中，若有，则该栅格就负责预测目标的类别概率值，p_i(c)表示预测类别概率值，表示ground truth里目标概率值，值通常取1。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉大学，未经武汉大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910143170.8/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于高效卷积神经网络的多模态融合手势识别方法
下一篇：一种基于特征匹配的身份证内容识别系统及方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于Yolo V3的多源视频影像重点目标快速检测方法在审

专利文献下载