[发明专利]一种用于预处理包括文本的视频区域的方法及系统有效

专利信息
申请号: 201080042059.7 申请日: 2010-12-29
公开(公告)号: CN102511048A 公开(公告)日: 2012-06-20
发明(设计)人: T·查托帕迪亚;A·辛哈;A·帕尔 申请(专利权)人: 塔塔咨询服务有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/34
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 黄志华
地址: 印度*** 国省代码: 印度;IN
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 预处理 包括 文本 视频 区域 方法 系统
【权利要求书】:

1.一种用于预处理包括文本的视频区域以改进光学字符识别输入的方法,其中,通过计算机实现的下列步骤来预处理所述包括文本的视频区域:

a.定位所述包括文本的视频区域中的文本图像;

b.将所述包括文本的视频区域中的所识别的文本图像提高至更高分辨率;

c.二值化提高的高分辨率文本图像;

d.分割二值化的文本图像中的至少两个粘连字符;以及

e.将来自分割的文本图像的关键字确定为用于光学字符识别的改进的输入。

2.如权利要求1所述的方法,其中,通过计算机实现的下列步骤定位所述包括文本的视频区域中的所述文本:

a.利用亮度的直流分量,获得所述包括文本的视频区域中的高对比度的宏块;

b.获得所述包括文本的视频区域中的具有强垂直边缘的宏块;

c.去除所述包括文本的视频区域中的不满足文本特性的宏块;

d.在时域中进行滤波以去除所述包括文本的视频区域中的高光色候选宏

块;

e.标记所述包括文本的视频区域中的文本区域;以及

f.检测每个候选文本区域的屏幕布局,以识别所述包括文本的视频区域中的文本图像。

3.如权利要求1所述的方法,其中,通过计算机实现的下列步骤,将所述包括文本的视频区域中的定位到的文本图像进一步提高至更高分辨率:

a.应用具有滤波器系数的六抽头有限脉冲响应滤波器,将所关注的区域在高度和宽度上放大两倍;

b.应用插值技术进一步将所关注的区域在高度和宽度上放大两倍;

c.在所述更高分辨率的图像上应用离散余弦变换;

d.通过应用巴特沃斯低通滤波器,摒除高频分量;以及

e.应用反离散余弦变换,重建所述更高分辨率的图像。

4.如权利要求1所述的方法,其中,通过自适应阈值转换法来二值化所述提高的高分辨率文本图像,以分离所述文本图像的前景和背景。

5.如权利要求1所述的方法,其中,通过计算机实现的下列步骤,分割二值化的图像的至少两个粘连字符:

a.获得所述二值化的图像中的每个字符的宽度;

b.确定所述二值化的图像中的平均字符宽度;

c.获得所述二值化的图像中的字符宽度的标准偏差;以及

d.限定所述二值化的图像中的字符长度的阈值。

6.如权利要求1所述的方法,其中,通过计算机实现的下列步骤,确定来自分割的文本图像的关键字:

a.从所述包括文本的视频区域的分割的文本图像中选择所有字母为大写的关键字;

b.获得所述包括文本的视频区域的分割的文本图像的文本行中的字数;

c.如果文本行中的字数大于用试探法获得的阈值,则将所述文本行作为候选关键字;

d.从所述候选关键字中去除停用字;

e.连接所述候选关键字中的剩余字以产生搜索字符串;

f.使用连接的关键字作为搜索字符串,以改进光学字符识别的性能。

7.如权利要求6所述的方法,其中,所述停用字选自由比如“一”、“该”、“用于”、“或”、“的”构成的组。

8.如权利要求1所述的方法,其中,来自分割的文本图像的所述关键字用作搜索请求,以搜索、获取并显示与嵌入在视频流中的文本相关的附加信息。

9.如权利要求1所述的方法,其中,预处理后的包括文本的视频区域还用于在包括相关信息的因特网或简易信息聚合源中搜索与所述文本相关的附加信息。

10.如权利要求9所述的方法,其中,搜索到的与所述预处理后的包括文本的视频区域相关的附加信息显示在用户界面上。

11.如权利要求10所述的方法,其中,搜索到并显示的与所述预处理后的包括文本的视频区域相关的附加信息被存储在可扩展标记语言文件中。

12.如权利要求8所述的方法,其中,处理后的、搜索到的、获取的并显示的与包括文本的视频区域相关的附加信息与看电视时的新闻有关。

13.如权利要求12所述的方法,其中,所述新闻选自包括突发新闻和跑马灯新闻的组。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于塔塔咨询服务有限公司,未经塔塔咨询服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201080042059.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top