[发明专利]一种视频中的文本跟踪和多帧增强方法无效

申请号：	200810101653.3	申请日：	2008-03-10
公开（公告）号：	CN101276416A	公开（公告）日：	2008-10-01
发明（设计）人：	朱成军;李超;秦思思;熊璋	申请（专利权）人：	北京航空航天大学
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/72;G06T5/20
代理公司：	北京科迪生专利代理有限责任公司	代理人：	贾玉忠;卢纪
地址：	100083***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种视频中的文本跟踪增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1、一种视频中的文本跟踪和多帧增强方法，其特征在于：包括以下步骤：

(1)利用文本检测算法检测视频序列第i帧中出现的文本区域，记为文本图像f_i，将参考图像R_f设置为f_i，令C代表文本图像f_i多个副本的集合，将f_i添加到集合C中；

(2)跟踪文本图像f_i在相邻帧的位置，跟踪过程如下：

步骤2.1：利用Canny边缘算子提取参考图像R_f的边缘图EM；

步骤2.2：估算参考图像R_f在后续帧的出现区域，记为R′；

步骤2.3：利用Canny边缘算子提取R′的边缘图EM1；

步骤2.4：利用文本笔画形成的边缘具有边缘对的特点，删除边缘图EM和EM1中的背景对象形成的边缘；

步骤2.5：采用Chamfer 5-7-11距离变换将边缘图EM和EM1进行Hausdorff距离变换；

步骤2.6：计算R′和R_f之间的Hausdorff距离值v，如果v小于预先设定的阈值，R′中取得值v所在的区域f′就是参考图像R_f在相邻帧的匹配区域；如果v大于预先设定的阈值，完成文本跟踪过程；

步骤2.7：将参考图像R_f设置f′，将R_f添加到集合C中，转到步骤(2.1)，继续跟踪；

(3)利用最小像素搜索法，经由集合C中的多个文本图像，得到一个新的文本图像f，此时变换的背景已经被大大减弱消除；

(4)利用最小均方差的二值化方法，对文本图像f进行二值化操作，最终得到具有干净背景的文本二值化图像。

2、根据权利要求1所述的一种视频中的文本跟踪和多帧增强方法，其特征在于：所述步骤(2.4)的方法如下：

(1)计算文本图像每个像素点的梯度方向θ(x，y)，计算公式如下：

gxx=|∂R∂x|2+|∂G∂x|2+|∂B∂x|2gyy=|∂R∂y|2+|∂G∂y|2+|∂B∂y|2gxy=∂R∂x∂R∂y+∂G∂x∂G∂y+∂B∂x∂B∂yθ(x,y)=12arctan[2gxy/(gxx+gyy)]]>

(2)如果在相邻的距离[D_min，D_max]范围内出现梯度方向平行的两个像素，则认为这两个像素构成像素对，其中D_min和D_max的值由需要跟踪的文本字体的大小决定；

(3)令EM代表边缘集合，边缘对(p₁，p₂)集合记为E_p，则E_p对E的重构定义为R_E(EΘE_p)，E经由E_p重构后得到结果主要由文本边缘组成。

3、根据权利要求1所述的一种视频中的文本跟踪和多帧增强方法，其特征在于：所述步骤(2.2)的方法如下：

(1)假定视频的分辨率为R_H×R_V，R_V、R_H分别为垂直、水平分辨率，帧率s帧/秒，如果文本的出现时间为δt，那么当前文本在相邻帧垂直和水平方向上的偏移值：

δv=RVs×δt]]>δh=RHs×δt]]>

(2)设置δt的最小估计值，根据上述公式，在相邻帧得到文本的最大偏帧垂直偏移值和最大水平方向偏移值，如果当前文本区f_i的矩形面积为w×h，根据最大偏移值δv和δh，可以估计出参考图像R_f在相邻下一帧的匹配区域面积大小(w_i+2×δh)×(h_i+2×δv)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京航空航天大学，未经北京航空航天大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810101653.3/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载