[发明专利]用于OCR的基于文本图像质量的反馈有效
申请号: | 201380064784.8 | 申请日: | 2013-11-22 |
公开(公告)号: | CN104871180A | 公开(公告)日: | 2015-08-26 |
发明(设计)人: | P·K·拜哈提;A·S·比塞恩;R·桑德拉拉简;D·A·戈尔 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/20 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 宋献涛 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 ocr 基于 文本 图像 质量 反馈 | ||
1.一种通过使用相同文本的多个图像改善文本辨识的方法,所述方法包括:
按多个变焦等级捕捉现实世界的场景的多个图像,现实世界的所述场景含有一或多个大小的文本;
从所述多个图像中的每一者提取一或多个文本区域;
分析与如从所述多个图像中的一或多者提取的第一文本区域的一或多个版本中的OCR相关的属性;以及
当所述属性具有符合所述第一文本区域的版本中的光学字符辨识OCR的限制的值时,将所述第一文本区域的所述版本作为输入提供到OCR。
2.根据权利要求1所述的方法,其中:
所述属性包括在所述一或多个文本区域中的每一区域的高度。
3.根据权利要求1所述的方法,其中:
所述提取包括检查所述一或多个文本区域中的共用二进制值的一行像素的存在。
4.根据权利要求1所述的方法,其中:
所述提取包括检查所述一或多个文本区域中的字符的笔划的宽度的方差。
5.根据权利要求1所述的方法,其进一步包括:
检查所述第一文本区域的极值x坐标是否大于w/zoom_level,其中w为所述第一文本区域的宽度,且zoom_level为包括所述第一文本区域的图像由相机捕捉的变焦的等级。
6.根据权利要求1所述的方法,其进一步包括:
检查所述第一文本区域的极值y坐标是否大于h/zoom_level,其中h为所述第一文本区域的高度,且zoom_level为包括所述第一文本区域的图像由相机捕捉的变焦的等级。
7.根据权利要求1所述的方法,其中:
所述多个图像是按序列连续地、一个接一个地捕捉。
8.根据权利要求7所述的方法,其中:
在所述提取前捕捉所述多个图像。
9.根据权利要求7所述的方法,其中:
响应于单一用户输入自动捕捉所述多个图像。
10.根据权利要求1所述的方法,其中:
包括所述第一文本区域的经放大版本的图像中的未捕捉的现实世界的所述场景中的特征捕捉于包括所述第一文本区域的较小版本的另一图像中。
11.根据权利要求1所述的方法,其进一步包括:
当所述属性具有不符合所述第一文本区域的版本中的光学字符辨识OCR的限制的值时,自动分析如从所述一或多个图像提取的所述第一文本区域的额外版本。
12.根据权利要求1所述的方法,其进一步包括:
分析与如从所述多个图像中的一或多者提取的第二文本区域的一或多个版本中的OCR相关的属性;以及
当所述属性具有符合所述第二文本区域的版本中的光学字符辨识OCR的限制的值时,将所述第二文本区域的所述版本作为输入提供到OCR。
13.根据权利要求12所述的方法,其进一步包括:
输出在所述第一和第二区域中辨识的文本。
14.一种非暂时性计算机可读存储媒体,所述至少一个非暂时性计算机可读存储媒体包括待由至少一个处理器执行以校正现实世界的场景的图像中的偏斜的多个指令,所述多个指令包括:
按多个变焦等级捕捉现实世界的场景的多个图像的第一指令,现实世界的所述场景含有一或多个大小的文本;
从所述多个图像中的每一者提取一或多个文本区域的第二指令;
分析与如从所述多个图像中的一或多者提取的第一文本区域的一或多个版本中的OCR相关的属性的第三指令;以及
当所述属性具有符合所述第一文本区域的版本中的光学字符辨识OCR的限制的值时将所述第一文本区域的所述版本作为输入提供到OCR的第四指令。
15.根据权利要求14所述的至少一个非暂时性计算机可读存储媒体,其中:
所述属性包括在所述一或多个文本区域中的每一区域的高度。
16.根据权利要求14所述的至少一个非暂时性计算机可读存储媒体,其中:
所述第二指令包括检查所述一或多个文本区域中的共用二进制值的一行像素的存在的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380064784.8/1.html,转载请声明来源钻瓜专利网。