[发明专利]文本图像朝向识别方法和文本内容识别方法、装置、设备在审
申请号: | 202111011403.2 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113780131A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 丁拥科 | 申请(专利权)人: | 众安在线财产保险股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 杨明莉 |
地址: | 200001 上海市黄*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 图像 朝向 识别 方法 内容 装置 设备 | ||
本申请涉及图像处理技术领域,特别是涉及一种文本图像朝向识别方法和文本内容识别方法、装置、设备。所述方法包括:获取待识别的初始文本图像;对初始文本图像的朝向进行预估,确定初始文本图像的预估朝向;根据预估朝向,得到对应初始文本图像的各文本行图像;确定各文本行图像中文本内容的文本内容朝向;基于各文本内容朝向以及预估朝向,确定初始文本图像的文本图像朝向。采用本方法能够提升文本图像识别准确性。
技术领域
本申请涉及图像处理技术领域,特别是涉及一种文本图像朝向识别方法和文本内容识别方法、装置、设备。
背景技术
随着移动互联网和人工智能(Artificial Intelligence,AI)技术的快速发展,文档和卡证电子化采集和处理趋势日益明显,越来越多的文档(如档案材料、医疗病历等)或卡证(如身份证、银行卡等)通过智能手机app(Application)拍摄采集后,送入后台进行自动化处理,例如,通过光学文字识别(Optical Character Recognition,OCR)获得文本信息,通过自然语言处理(Natural Language Processing,NLP)进行实体抽取或语义分析。
在传统方式中,智能手机app拍摄得到或用户点击上传的文本图像可能是任意朝向的,比如向左或向右旋转了90度,或者是180颠倒的文档。
直接对任意朝向的文本图像进行识别,识别结果并不准确,得到的识别结果的准确性较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升文本图像识别准确性的文本图像朝向识别方法和文本内容识别方法、装置、设备。
一种文本图像朝向识别方法,所述文本图像朝向识别方法包括:
获取待识别的初始文本图像;
对初始文本图像的朝向进行预估,确定初始文本图像的预估朝向;
根据预估朝向,得到对应初始文本图像的各文本行图像;
确定各文本行图像中文本内容的文本内容朝向;
基于各文本内容朝向以及预估朝向,确定初始文本图像的文本图像朝向。
在其中一个实施例中,对初始文本图像的朝向进行预估,确定初始文本图像的预估朝向,以及确定各文本行图像中文本内容的文本内容朝向,均通过预先训练的分类模型进行的,分类模型包括第一分类模型以及第二分类模型;
对初始文本图像的朝向进行预估,确定初始文本图像的预估朝向,包括:
将初始文本图像输入预先训练的第一分类模型中,确定初始文本图像的预估朝向;
确定各文本行图像中文本内容的文本内容朝向,包括:
将各文本行图像输入预先训练的分本行分类模型中,确定各文本行图像对应文本内容的文本内容朝向。
在其中一个实施例中,分类模型的训练方式包括:
获取初始训练数据集,初始训练数据集包括第一样本数据集;
对第一样本数据集进行旋转处理,生成第二样本数据集;
对初始训练数据集进行文本内容识别处理,生成第三样本数据集;
对第三样本数据集进行旋转处理,得到第四样本数据集;
通过第一样本数据集以及第二样本数据集对第一分类模型进行训练,得到训练后的第一分类模型;
通过第三样本数据集以及第四样本数据集对第二分类模型进行训练,得到训练后的第二分类模型。
在其中一个实施例中,根据预估朝向,得到对应初始文本图像的各文本行图像,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众安在线财产保险股份有限公司,未经众安在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111011403.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序