[发明专利]图片处理方法和装置在审
申请号: | 201611063806.0 | 申请日: | 2016-11-25 |
公开(公告)号: | CN106778721A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 周列淳;岳智磊;刘泓;江岩 | 申请(专利权)人: | 天方创新(北京)信息技术有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/36 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 张大威 |
地址: | 100081 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 处理 方法 装置 | ||
技术领域
本发明涉及图片处理技术领域,尤其涉及一种图片处理方法和装置。
背景技术
光学字符识别(Optical Character Recognition,OCR)是指通过图像处理和模式识别技术对光学字符进行识别,并将光学字符翻译成计算机文字的过程。通过OCR技术进行光学字符识别的图片通常被称为OCR图片。
为了能够提高OCR识别结果的准确率,在进行OCR识别之前,通常要对图片进行预处理。预处理方式的选择直接影响OCR的识别结果。在同样的识别算法下,预处理方式越合适,OCR识别结果的准确率也越高。
现有的OCR图片预处理技术,是对所有图片均采用相同的预处理方式。然而,对于不同的图片,可能一部分图片经某一预处理方式处理后,会使OCR识别结果的准确率提高;而另一部分图片经同样的预处理方式处理后,可能会使OCR识别结果的准确率降低。因此,现有的OCR图片预处理技术忽视了不同图片特征对预处理方式的适用性,难以保证OCR识别结果的准确率。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的第一个目的在于提出一种图片处理方法,该方法通过多个预测模型,从多个预处理方式中,选取最佳组合的预处理方式对图片进行预处理,从而提高了OCR识别结果的准确率。
本发明的第二个目的在于提出一种图片处理装置。
为了实现上述目的,本发明第一方面实施例提出了一种图片处理方法,包括:获取输入的图片;提取图片的特征;将特征依次输入至多个预测模型中,并根据预测模型判断是否采用与预测模型相对应的预处理方式;如果采用与预测模型相对应的预处理方式,则在对图片进行预处理后,对图片进行OCR识别。
本发明实施例的图片处理方法,通过将图片的特征依次输入多个预测模型中,判读是否采用与预测模型相对应的预处理方式,如果采用与预测模型相对应的预处理方式,则在对图片进行预处理后,对图片进行OCR识别。该方法通过多个预测模型,从多个预处理方式中,选取最佳组合的预处理方式对图片进行预处理,从而提高了OCR识别结果的准确率。
为达上述目的,本发明第二方面实施例提出了一种图片处理装置,包括:获取模块,用于获取输入的图片;提取模块,用于提取图片的特征;判断模块,用于将特征依次输入至多个预测模型中,并根据预测模型判断是否采用与预测模型相对应的预处理方式;处理模块,用于如果采用与预测模型相对应的预处理方式,则在对图片进行预处理后,对图片进行OCR识别。
本发明实施例的图片处理装置,通过将图片的特征依次输入多个预测模型中,判读是否采用与预测模型相对应的预处理方式,如果采用与预测模型相对应的预处理方式,则在对图片进行预处理后,对图片进行OCR识别。该装置通过多个预测模型,从多个预处理方式中,选取最佳组合的预处理方式对图片进行预处理,从而提高了OCR识别结果的准确率。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1是根据本发明一个实施例的图片处理方法的流程图;
图2是根据本发明一个实施例的训练预测模型的方法的流程图;
图3是根据本发明一个实施例的图片处理装置的结构示意图;
图4是根据本发明一个具体实施例的图片处理装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的图片处理方法和装置。
图1是根据本发明一个实施例的图片处理方法的流程图。
如图1所示,该图片处理方法包括:
S101,获取输入的图片。
具体地,获取需要进行OCR识别的图片。例如,用户在图书馆阅览书籍时,发现某页的内容自己比较喜欢,用手机拍下了该页,并想通过OCR获取图片中的文字并进行编辑。因而,用户拍下的这张照片可以作为输入的图片。
S102,提取图片的特征。
具体地,在获取输入图片后,提取图片的特征。其中,图片的特征包括形态学特征和纹理特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天方创新(北京)信息技术有限公司,未经天方创新(北京)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611063806.0/2.html,转载请声明来源钻瓜专利网。