[发明专利]一种用于预处理包括文本的视频区域的方法及系统有效

申请号：	201080042059.7	申请日：	2010-12-29
公开（公告）号：	CN102511048A	公开（公告）日：	2012-06-20
发明（设计）人：	T·查托帕迪亚;A·辛哈;A·帕尔	申请（专利权）人：	塔塔咨询服务有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/34
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	黄志华
地址：	印度***	国省代码：	印度;IN
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种用于预处理包括文本视频区域方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及广播领域。尤其是，本发明涉及一种用于预处理包括文本的视频区域的方法及系统。更具体地，本发明涉及一种用于预处理包括文本的视频区域以改进光学字符识别的输入的方法和系统。

背景技术

近年来使用诸如电视、计算机等装置进行信息动态传播有显著增长。这样的装置正在越来越多地用于获取与各领域相关的最新信息。通过这些装置的信息传播是以视频、音频、文本或其组合的形式进行的。新闻广播是以视频、音频、文本及其组合的形式进行的信息传播的最好示例。

在当前情况下，用户仅可以获得正在传播的信息。为了获得特定主题或感兴趣的领域的进一步相关信息，用户必须使用一些其它的信息源，例如因特网。用户必须进行手动搜索以获取例如电视的信息传播装置正在传播的信息以外的、所感兴趣的领域的相关信息。

为了获取信息传播装置上正在显示的信息以外的、用户所需的与感兴趣的领域相关的信息，需要具有一套使用当前的包括文本的视频区域以改进光学字符识别的性能并随后搜索的自动化系统。因此，应当有效地确定包括文本的视频区域，以改进光学字符识别的性能并利用所述文本进行随后搜索。

我们所知的能够进行基于文本的搜索、但不足以有效地确定包括文本的视频区域以改进光学字符识别的性能并随后搜索的一些现有方法和系统如下：

Kim等的专利US6766528提供了一种用于在电视节目中显示附加信息的装置和方法。其教导了一种用于从诸如因特网的外部源获取信息以及进一步显示给用户(如果提出要求)的方法。

Tomsen等的专利US20020083464提供了上下文敏感请求，其用于搜索与互动电视系统正显示的电视广播相关的补充内容。该专利没有教导预处理包括文本的视频区域以改进光学字符识别性能以及使用预处理后的包括文本的视频区域随后搜索相关信息。

Kim等的专利US20090019482提供了一种图像显示装置和利用该图像显示装置的信息提供方法。该专利讨论了所述图像显示装置，诸如数字电视机，根据播放时段将网络服务器提供的RSS(简易信息聚合)信息分类，并且在相应的播放时段显示预定类别的RSS信息。

Ullman等的专利US20020038344提供了一种用于将视频节目与互联网的大量的信息资源结合的系统。Ullman等教导了一种基于计算机的系统，该基于计算机的系统接收带有嵌入式统一资源定位符(URL)的视频节目。

Piotrowski的专利US2002188959提供了一种允许视频/电视节目的观看者自动地或按要求接收与所述视频/电视节目相关的同步的补充多媒体信息的系统和方法。所解决的问题尤其涉及补充多媒体信息，该补充多媒体信息作为一种例如使用同步多媒体集成语言(SMIL)的互联网文件被接收。从视频/电视节目接收/提取同步信息。此外，其涉及以虚拟网页显示视频/电视节目和补充多媒体信息。

Chen等在“GeoTV：navigating geocoded rss to create an IPTV experience”中教导了GeoTV，通过其中的架构，以有意义的方式展示和推行网页内容，为电视观众创造娱乐体验。

Farhi在“Broadband News Aggregator”中教导了从多信源传送新闻的宽带互动电视应用。

在我们自己的以前的专利2236/MUM/2008和出版物“Recognition of trademarks from sports videos for channel hyper linking in consumer end”中公开一种从体育视频自动识别商标以通道超链接的系统。使用文本的一些特性定位文本区域，并且通过与来自受限商标数据库的形状不变特征和颜色特征相比较来识别商标。

以上提及的现有技术未公开一种可以预处理包括文本的视频区域以改进光学字符识别的性能并使用预处理后的包括文本的视频区域随后搜索相关的信息的有效方法和系统。因此，根据上述背景技术，可以看出，需要一种解决方案，该解决方案可以提供一种用于准确地预处理包括文本的视频区域以改进光学字符识别的性能并使用输出的预处理后的包括文本的视频区域随后搜索相关的信息的方法及系统。

发明目的

根据本发明，主要目的是提供一种用于预处理包括文本的视频区域以改进光学字符识别的性能的方法及系统。

本发明的另一目的是提供一种用于预处理包括文本的视频区域以随后搜索、获取并进一步显示与嵌入在视频流中的文本相关的信息的方法及系统。

发明内容

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于塔塔咨询服务有限公司，未经塔塔咨询服务有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201080042059.7/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种用于预处理包括文本的视频区域的方法及系统有效

专利文献下载