[发明专利]一种视频中的文本跟踪和多帧增强方法无效
| 申请号: | 200810101653.3 | 申请日: | 2008-03-10 |
| 公开(公告)号: | CN101276416A | 公开(公告)日: | 2008-10-01 |
| 发明(设计)人: | 朱成军;李超;秦思思;熊璋 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/72;G06T5/20 |
| 代理公司: | 北京科迪生专利代理有限责任公司 | 代理人: | 贾玉忠;卢纪 |
| 地址: | 100083*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 中的 文本 跟踪 增强 方法 | ||
1、一种视频中的文本跟踪和多帧增强方法,其特征在于:包括以下步骤:
(1)利用文本检测算法检测视频序列第i帧中出现的文本区域,记为文本图像fi,将参考图像Rf设置为fi,令C代表文本图像fi多个副本的集合,将fi添加到集合C中;
(2)跟踪文本图像fi在相邻帧的位置,跟踪过程如下:
步骤2.1:利用Canny边缘算子提取参考图像Rf的边缘图EM;
步骤2.2:估算参考图像Rf在后续帧的出现区域,记为R′;
步骤2.3:利用Canny边缘算子提取R′的边缘图EM1;
步骤2.4:利用文本笔画形成的边缘具有边缘对的特点,删除边缘图EM和EM1中的背景对象形成的边缘;
步骤2.5:采用Chamfer 5-7-11距离变换将边缘图EM和EM1进行Hausdorff距离变换;
步骤2.6:计算R′和Rf之间的Hausdorff距离值v,如果v小于预先设定的阈值,R′中取得值v所在的区域f′就是参考图像Rf在相邻帧的匹配区域;如果v大于预先设定的阈值,完成文本跟踪过程;
步骤2.7:将参考图像Rf设置f′,将Rf添加到集合C中,转到步骤(2.1),继续跟踪;
(3)利用最小像素搜索法,经由集合C中的多个文本图像,得到一个新的文本图像f,此时变换的背景已经被大大减弱消除;
(4)利用最小均方差的二值化方法,对文本图像f进行二值化操作,最终得到具有干净背景的文本二值化图像。
2、根据权利要求1所述的一种视频中的文本跟踪和多帧增强方法,其特征在于:所述步骤(2.4)的方法如下:
(1)计算文本图像每个像素点的梯度方向θ(x,y),计算公式如下:
(2)如果在相邻的距离[Dmin,Dmax]范围内出现梯度方向平行的两个像素,则认为这两个像素构成像素对,其中Dmin和Dmax的值由需要跟踪的文本字体的大小决定;
(3)令EM代表边缘集合,边缘对(p1,p2)集合记为Ep,则Ep对E的重构定义为RE(EΘEp),E经由Ep重构后得到结果主要由文本边缘组成。
3、根据权利要求1所述的一种视频中的文本跟踪和多帧增强方法,其特征在于:所述步骤(2.2)的方法如下:
(1)假定视频的分辨率为RH×RV,RV、RH分别为垂直、水平分辨率,帧率s帧/秒,如果文本的出现时间为δt,那么当前文本在相邻帧垂直和水平方向上的偏移值:
(2)设置δt的最小估计值,根据上述公式,在相邻帧得到文本的最大偏帧垂直偏移值和最大水平方向偏移值,如果当前文本区fi的矩形面积为w×h,根据最大偏移值δv和δh,可以估计出参考图像Rf在相邻下一帧的匹配区域面积大小(wi+2×δh)×(hi+2×δv)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810101653.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电光装置、其驱动方法以及电子设备
- 下一篇:容器水位指示结构





