[发明专利]文本识别方法、装置、计算机设备和存储介质在审
申请号: | 202210525789.7 | 申请日: | 2022-05-16 |
公开(公告)号: | CN114898348A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 张鹏;齐蓉;张芳;张敏华 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06F16/35;G06F40/216;G06F40/30;G06V30/10 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 樊倩 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种文本识别方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:将包含有待识别文本的目标图像输入至目标字符识别模型,得到待识别文本对应的短语集合;目标字符识别模型为文本识别类型与目标文本类型相匹配的字符识别模型;若短语集合中存在语义错误的第一短语,则将第一短语在目标图像中对应的文本图像输入至新的字符识别模型,得到文本图像对应的第二短语;根据第一短语与第二短语之间的差异,对第一短语与第二短语进行重组,得到至少一个候选短语;采用至少一个候选短语中不存在语义错误的第三短语,对第一短语进行更新,得到更新后的短语集合,作为目标图像的文本识别结果。采用本方法能够提高文本识别结果的准确性。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种文本识别方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着人工智能技术的发展,文本识别技术在图像处理领域得到了广泛的应用。
然而,现有的文本识别模型往往只能识别特定类型的文本图像,对于涉及多种文本类型的文本图像,如包含混合语言、包含手写体的文本图像往往识别准确率较低。
因此,传统技术中存在着文本识别准确率低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高文本识别准确率的文本识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种文本识别方法。所述方法包括:
将包含有待识别文本的目标图像输入至目标字符识别模型,得到所述待识别文本对应的短语集合;所述目标字符识别模型为在字符识别模型集合中文本识别类型与目标文本类型相匹配的字符识别模型;所述目标文本类型为在所述待识别文本中出现次数最多的文本类型;
若所述短语集合中存在语义错误的第一短语,则将所述第一短语在所述目标图像中对应的文本图像输入至新的字符识别模型,得到所述文本图像对应的第二短语;所述新的字符识别模型为所述字符识别模型集合中除所述目标字符识别模型以外的字符识别模型;
根据所述第一短语与所述第二短语之间的差异,对所述第一短语与所述第二短语进行重组,得到至少一个候选短语;
采用所述至少一个候选短语中不存在语义错误的第三短语,对所述第一短语进行更新,得到更新后的短语集合,作为所述目标图像的文本识别结果。
在其中一个实施例中,所述根据所述第一短语与所述第二短语之间的差异,对所述第一短语与所述第二短语进行重组,得到至少一个候选短语,包括:
根据所述第一短语与所述第二短语之间的差异,确定所述第一短语中各字符位置对应的至少一个候选字符;
按照各所述字符位置的顺序,基于各所述字符位置对应的至少一个候选字符构造出可能出现的短语,作为所述至少一个候选短语。
在其中一个实施例中,若所述第一短语由至少两个单词构成;所述根据所述第一短语与所述第二短语之间的差异,对所述第一短语与所述第二短语进行重组,得到至少一个候选短语,包括:
根据所述第一短语与所述第二短语之间的差异,确定所述第一短语中各单词位置对应的至少一个候选单词;
确定各所述单词位置对应的至少一个候选单词中不存在语义错误的目标单词;
按照各所述单词位置的顺序,基于各所述单词位置对应的至少一个目标单词构造出可能出现的短语,作为所述至少一个候选短语。
在其中一个实施例中,所述根据所述第一短语与所述第二短语之间的差异,确定所述第一短语中各单词位置对应的至少一个候选单词,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210525789.7/2.html,转载请声明来源钻瓜专利网。