[发明专利]图像处理方法以及装置有效
申请号: | 201910539227.6 | 申请日: | 2019-06-20 |
公开(公告)号: | CN110399872B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 梁山雪 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06V10/24 | 分类号: | G06V10/24;G06V20/62;G06T3/60;G06V30/19 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
地址: | 开曼群岛大开曼岛乔治镇医院*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 以及 装置 | ||
本申请提供图像处理方法以及装置,其中,所述图像处理方法包括:对待处理图像进行旋转处理,获得旋转图像;识别所述待处理图像和所述旋转图像组成的候选图像包含的文字内容,获得各候选图像对应的文本内容;利用统计语言模型计算所述文本内容的预测概率值;选择预测概率值最高的文本内容对应的候选图像作为目标图像。本申请提供的图像处理方法,通过对待处理图像进行旋转处理以获得旋转图像,并在在细粒度层面对待处理图像和旋转图像组成的候选图像包含的文本内容进行识别以及合理性预测,从而来选择目标图像进行归档,提升了图像归档的质量,同时具有很强的适用性。
技术领域
本申请涉及图像处理技术领域,特别涉及一种图像处理方法。本申请同时涉及一种图像处理装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
在许多领域都需要对纸质文档进行电子化归档,便于纸质文档的统一管理、查询和分析,但是在对纸质文档进行扫描时,由于设备(扫描仪等)或人工操作的问题,可能使得扫描后的文档图片存在不同程度的偏转问题,比如在扫描时将扫描文档向左或者向右偏转90或者180度进行扫描,这些偏转的文档图片在电子化归档后严重影响了归档质量,并且会影响后续的其他应用(比如,合同比对、合同结构化等)。
目前,针对偏转图片的矫正方法,以像素点作为分析单位,在像素层面对图片进行矫正,具体处理过程中,首先是基于文档图片中的文字内容都是左对齐这一假设,然后来统计图片中横轴上的文字像素点分布,以此来判断是否有偏转情况,但这种方法局限性较大,只能处理严格满足图片中文字内容左对齐这一假设的图片,存在一定的缺陷。
发明内容
有鉴于此,本申请实施例提供了一种图像处理方法,以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种图像处理装置,一种计算设备,以及一种计算机可读存储介质。
本申请提供一种图像处理方法,包括:
对待处理图像进行旋转处理,获得旋转图像;
识别所述待处理图像和所述旋转图像组成的候选图像包含的文字内容,获得各候选图像对应的文本内容;
利用统计语言模型计算所述文本内容的预测概率值;
选择预测概率值最高的文本内容对应的候选图像作为目标图像。
可选的,所述对待处理图像进行旋转处理,获得旋转图像,包括:
按照预先设置的多个旋转角度对所述待处理图像进行旋转处理,获得各旋转角度对应的旋转图像;
其中,所述旋转角度包括下述至少一项:
顺时针旋转90度、顺时针旋转180度以及顺时针旋转270度。
可选的,所述识别所述待处理图像和所述旋转图像组成的候选图像包含的文字内容,获得各候选图像对应的文本内容,包括:
采用光学字符识别技术识别所述候选图像包含的文字内容,作为所述候选图像各自对应的文本内容。
可选的,所述统计语言模型,采用如下方式进行训练:
利用训练语料对预先构建的神经网络模型进行训练,训练完成后获得所述统计语言模型;
其中,所述统计语言模型的输入包括所述候选图像各自对应的文本内容,输出包括所述文本内容的预测概率值。
可选的,所述选择预测概率值最高的文本内容对应的候选图像作为目标图像步骤执行之后,包括:
对所述目标图像进行灰度处理,获得所述目标图像的灰度特征;
基于所述灰度特征确定所述目标图像的特征边缘区域;
根据水平基准方向和所述特征边缘区域计算所述目标图像的偏转角度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910539227.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序