[发明专利]多路4K准实时拼接视频的全景拼接算法在审
申请号: | 202011293276.5 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112637519A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 黄博文 | 申请(专利权)人: | 合肥市卓迩无人机科技服务有限责任公司 |
主分类号: | H04N5/265 | 分类号: | H04N5/265;H04N5/262 |
代理公司: | 合肥正则元起专利代理事务所(普通合伙) 34160 | 代理人: | 匡立岭 |
地址: | 230000 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多路 实时 拼接 视频 全景 算法 | ||
1.多路4K准实时拼接视频的全景拼接算法,其特征在于,包括采集终端、数据解码模块,帧图像预处理模块,中央处理器,图形处理器、图像融合并行模块以及融合处理并行模块,所述图像融合并行模块是不同的采集终端间的并行执行,所述融合处理并行模块是内部多线程大规模的并行执行;所述中央处理器包括特征点检测单元、特征点描述单元以及特征点匹配单元;
多路4K准实时拼接视频的全景拼接算法的具体实现方法包括以下步骤:
通过多个采集终端进行视频图像的获取;
通过数据解码模块将获取的视频图像进行视频帧的数据解码,并通过帧图像预处理模块对解码后的帧图像进行预处理;
将处理后的帧图像数据发送至中央处理器进行帧图像配准,帧图像配准具体包括特征点检测、特征点描述以及特征点匹配;
配准后的图像数据发送至图形处理器,在图形处理器得到配准后的图像数据后通过像素缓冲区对加速图像进行渲染与显示;
其中,中央处理器将处理第N帧配准后的数据传递给图像处理器后,捕获第N+1帧图像解码数据,并在中央处理器处理,同时,在图像处理器进行第N帧图像融合。
2.根据权利要求1所述的多路4K准实时拼接视频的全景拼接算法,其特征在于:
所述特征点检测单元的具体方法包括以下步骤:
步骤一:使用高斯核平滑滤波器对图像进行预处理;
步骤二:使用FAST算法检测图像的特征点;
步骤三:对检测到的特征点进行排序,选取前M个最大的特征点;
步骤四:对于获取到的M个特征点,计算角点的方向θ;
在特征点周围选取一个半径为R的圆形领域,选取领域像素对(x,y),使得x,y∈[-R,R];图像中一小块区域图像I(x,y)的(p+q)阶矩定义为:
角点所在小块区域的质心坐标C:
质心方向即为特征点的方向:
3.根据权利要求1所述的多路4K准实时拼接视频的全景拼接算法,其特征在于:
所述特征点描述单元用于对图像中检测到的特征点进行特征描述,特征描述在于描述特征的描述子,描述子具有具有鲁棒性和可区分性;鲁棒性指特征描述子不受到视角、尺度、旋转和光照变化的影响;可区分性则是指所使用的描述算子在一定程度上反映特征区域的图像特征,并量化区分与之匹配的特征和非匹配的特征;描述子为:
针对图像的特征点区域,选取48*48大小的图像块,对补丁块进行高斯滤波去噪,选取满足高斯分布的n个(x,y)像素位置对,p(x)为图像块在像素点x处的灰度值,p(y)为图像块在像素点y处的灰度值,则有:
在特征点周围,选取n=256对像素点对,通过这些点对构建一个具有256个二进制比特流的向量;对于任意特征点,序列在(x,y)像素位置的n个二进制位准则构建矩阵S;使用关键点及周围邻域构成的图像小块的方向θ和对应的旋转矩阵Rθ,得到描述算子:gn(p,θ)=fn(p)|(xi,yi)。
4.根据权利要求1所述的多路4K准实时拼接视频的全景拼接算法,其特征在于:所述特征点匹配单元用于匹配特征点,特征点匹配是在两个特征点集中搜索相互距离最近的特征点的过程;特征点匹配,利用各种欧氏距离作为衡量特征点相似性的标准;消除错误匹配的特征点对,计算出特征点集合满足的模型,再通过此模型验证各个特征点对,去除误匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥市卓迩无人机科技服务有限责任公司,未经合肥市卓迩无人机科技服务有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011293276.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多路准实时拼接视频的全景降码流方法
- 下一篇:一种多路电源供电电路及供电装置