[发明专利]一种基于深度学习的视频车辆大数据搜索方法在审
| 申请号: | 201910322235.5 | 申请日: | 2019-04-22 |
| 公开(公告)号: | CN110096982A | 公开(公告)日: | 2019-08-06 |
| 发明(设计)人: | 张斯尧;谢喜林;王思远;黄晋;蒋杰;张诚 | 申请(专利权)人: | 长沙千视通智能科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46 |
| 代理公司: | 长沙德恒三权知识产权代理事务所(普通合伙) 43229 | 代理人: | 徐仰贵 |
| 地址: | 410000 湖南省长沙市高新开发区麓谷大道*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 大数据 搜索 数据库 车辆信息 目标车辆 提取特征 视频 车辆特征信息 视频关键帧 相似度计算 车辆识别 车辆图像 机器学习 监控系统 视频图像 结构化 相似度 检测 比对 算法 分段 排序 存储 学习 | ||
1.一种基于深度学习的视频车辆大数据搜索方法,其特征在于,包括以下步骤:
S1、基于MLbase机器学习库搭建Spark大数据平台;
S2、在上述搭建的平台上接入视频图像,将视频关键帧分段,然后基于深度学习算法对目标图像进行车辆的结构化检测,提取特征信息并存储于数据库中,以获得具备大数据车辆信息的数据库;
S3、基于SOBS算法对目标车辆进行检测并提取特征,对目标车辆特征与数据库中所有车辆特征信息进行相似度计算与比对,得出相似度;
S4、排序并搜索出最相似的车辆信息与车辆图像。
2.如权利要求1所述的一种基于深度学习的视频车辆大数据搜索方法,其特征在于,所述步骤S2具体包括:
S2.1、首先将实时视频或者录像文件传入Spark大数据平台中,然后将视频图像数据经过Map方法,自动切分为视频片段,并接入视频图像的深度学习算法进行处理,处理结果传递到Reduce方法进行自动汇聚,数据存储;
S2.2、利用ResNet网络对步骤S2.1处理后的图像进行卷积池化操作,生成特征映射图,并利用区域建议网络对生成的特征映射图进行全图的前后景目标搜索和筛选,同时调整算法中对输入图片动态长宽比的实际需求模型参数,然后通过深度学习特征提取出特征向量并存储。
3.如权利要求2所述的一种基于深度学习的视频车辆大数据搜索方法,其特征在于,所述步骤S2.1中,切分为视频片段的步骤如下:
根据视频文件中不同帧数据的不同,区分I帧、P帧数据,取出视频的关键帧信息,作为视频文件的分段关键点;
根据车辆出现和消失时间,得出分段的准确时间以及文件位置,作为视频分段点;
当视频分段点为分段关键点时,进行分段。
4.如权利要求3所述的一种基于深度学习的视频车辆大数据搜索方法,其特征在于,所述步骤S2.2中通过深度学习特征提取出特征向量并存储包括:
利用卷积操作在整幅图像上生成网格状的多个位置敏感分数图,对每个位置敏感分数图进行池化操作,将池化操作的上一层ResNet直接以特征向量的形式存储在大数据系统的数据库中,形成大数据模型,即实现特征信息的提取。
5.如权利要求4所述的一种基于深度学习的视频车辆大数据搜索方法,其特征在于,所述步骤S2.2中,每个位置敏感分数图有C个通道输出,代表C-1类物体外加一个背景,对于一个w×h大小的候选目标框,由目标框RPN网络获得,将目标框划分为k×k个子区域,则每个子区域为w×h/k2大小,对于任意一个子区域bin(i,j),0≤i,j≤k-1,定义一个位置敏感池化操作,具体公式为:
其中,rc(i,j|Θ)是子区域bin(i,j)对C个类别的池化响应,zi,j,c是子区域bin(i,j)所对应的位置敏感分数图,(x0,y0)代表目标候选框左上角的坐标,n是子区域bin(i,j)中的像素数,Θ代表网络的所有学习得到的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙千视通智能科技有限公司,未经长沙千视通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910322235.5/1.html,转载请声明来源钻瓜专利网。





