[发明专利]一种基于旋转不变感知哈希的无人机航拍视频帧定位方法在审
申请号: | 201911129923.6 | 申请日: | 2019-11-18 |
公开(公告)号: | CN110942002A | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 印鉴;陈智聪;陈殷齐 | 申请(专利权)人: | 中山大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T7/80;G06T9/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 旋转 不变 感知 无人机 航拍 视频 定位 方法 | ||
本发明提供一种基于旋转不变感知哈希的无人机航拍视频帧定位方法,该方法有一定的平移不变形(pooling原理);编码时使用差分编码,使得光照天气条件无关;再加上起点无关的圆周编码顺序使具有旋转不变性;圆周编码顺序时不编码边角部分,因为边角部分会因为视角不同差异大,从而排除了旋转时边角的其他景物不同影响。通过在真实无人机视频上的实验表明,本发明对比之前的感知哈希方法,成功解决了传统感知哈希不具有旋转不变的特性。
技术领域
本发明涉及视频图像处理算法领域,更具体地,涉及一种基于旋转不变感知哈希的无人机航拍视频帧定位方法。
背景技术
近年来,随着无人机的普及,利用无人机航拍视频来完成一些任务已经越来越受到工业界的关注。但在无人机河道异常巡航的任务中,需要对同一条河道的不同时间段无人机视频进行逐帧的定位,即找到一个视频上的一帧在另一个视频上同一个位置的一帧。这样的任务仍未有相关的研究。
比较相关的技术有基于深度学习的图片检索,但是不符合无人机视频帧定位的应用,因为深度学习的图片检索旨在找到图片之间的语义匹配,而我们一整段视频的语义信息基本相同并且深度学习耗时过大,而一个短视频具有的帧数巨大。所以我们采用感知哈希(Perceptual Hashing)这样一种简单又快速的相似图片搜索技术。感知哈希是多媒体数据集到感知摘要集的一类单向映射,即将具有相同感知内容的多媒体数字表示唯一地映射为一段数字摘要,并满足感知鲁棒性和安全性。感知哈希为多媒体内容识别、检索、认证等信息服务方式提供安全可靠的技术支撑。
哈希函数(Hash Functions)是不可逆的提取原始数据的数字摘要(Digest),具有单向性、脆弱性等特点,可保证原始数据的唯一性与不可篡改性。各种哈希函数已在信息检索与管理、数据认证等领域中得到了成功的应用。但是,传统哈希函数已无法满足不同时间的俩段无人机航拍视频的帧定位功能,因为即使在同一个地方不同时间拍摄出来的视频他们之间存在一些镜头旋转的差异,而这样的细微差异使得哈希映射不正确(同一张图片旋转哈希值完全不相同)。
发明内容
本发明提供一种基于旋转不变感知哈希的无人机航拍视频帧定位方法,该方法实现了排除了旋转时边角的其他景物不同影响。
为了达到上述技术效果,本发明的技术方案如下:
一种基于旋转不变感知哈希的无人机航拍视频帧定位方法,包括以下步骤:
S1:对需要定位的视频帧-参考帧和需要检索的视频帧-目标帧进行旋转不变的哈希值计算;
S2:将参考帧和目标帧与另一个时间的无人机视频所有帧对比哈希值差异找到差异最小的一帧。
进一步地,所述步骤S1的具体过程是:
S11:将参考帧和目标帧进行图片缩放;
S12:将缩放后的图片进行灰度图转换;
S13:将灰度图进行获取哈希值的圆周编码顺序;
S14:对S13处理后的图片进行获取哈希值的二进制形式进而获取旋转不变的哈希值;
S15:根据S14的结果得出信息指纹。
进一步地,所述步骤S11的过程是:
把图片统一缩放到8*8,共64个像素的图片,这样操作具有一定的平移不变性,当平移量在缩放范围时,缩略图基本会一致。
进一步地,所述步骤S12的过程是:把缩放后的图片转化为256阶的灰度图。
进一步地,所述步骤S13的过程是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911129923.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:有效频道确定方法、装置及车载终端
- 下一篇:一种快速涂胶装置