[发明专利]一种视频流文本识别方法和装置在审

申请号：	201710050733.X	申请日：	2017-01-23
公开（公告）号：	CN108345886A	公开（公告）日：	2018-07-31
发明（设计）人：	许盛辉;马龙;苏雪峰	申请（专利权）人：	北京搜狗科技发展有限公司
主分类号：	G06K9/34	分类号：	G06K9/34;G06K9/46
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	赵娟
地址：	100084 北京市海淀区中关***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频流图像文本区域文本文本识别方法和装置视频流预设时间间隔整幅图像重叠信息申请图像检测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供了一种视频流文本识别方法和装置，包括：按照预设时间间隔获取视频流图像；检测所述视频流图像中的文本区域；比较T(n)时刻的视频流图像的文本区域与T(n‑1)时刻的视频流图像的文本区域；根据比较结果，确定新增文本区域；对所述新增文本区域进行文本识别，获得新增识别文本；将所述新增识别文本与针对T(n‑1)时刻的视频流图像的识别文本组合为T(n)时刻的视频流图像的识别文本。本申请实施例中，利用了前后帧的图像的重叠信息，将对整幅图像的识别简化为对新增识别区域中的文本进行识别，减少了需要识别的文本的数量，从而提高对视频流图像进行识别的速度。

技术领域

本申请涉及图像处理技术领域，特别是涉及一种视频流文本识别方法和一种视频流文本识别装置。

背景技术

光学字符识别OCR(Optical Character Recognition)技术是图像处理领域的一种重要技术，可以实现对图像中的文字进行识别。

光学字符识别技术不仅仅可以用来对单张的图像进行识别，也可以对视频流中出现的文字进行识别。目前，在对视频流中出现的文字进行识别的方式为：获取视频流中的图像，对获取的整幅图像中的字符进行识别。

这种对整幅图像进行识别的方法，识别速度慢，对完整视频流进行文本识别将需要耗费大量的时间，对实时性要求很高的需求难以满足。

发明内容

鉴于上述问题，提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种视频流文本识别方法和一种视频流文本识别装置。

为了解决上述问题，本申请实施例公开了一种视频流文本识别方法，包括：

按照预设时间间隔获取视频流图像；

检测所述视频流图像中的文本区域；

比较T(n)时刻的视频流图像的文本区域与T(n-1)时刻的视频流图像的文本区域；