[发明专利]一种视觉特征增强的字符识别方法、装置和设备在审
申请号: | 202110666440.0 | 申请日: | 2021-06-16 |
公开(公告)号: | CN113343981A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 李煜林;庾悦晨;钦夏孟;章成全;姚锟;韩钧宇;刘经拓;丁二锐;吴甜;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 赵林琳 |
地址: | 100094 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视觉 特征 增强 字符 识别 方法 装置 设备 | ||
根据本公开的实施例,提供了一种视觉特征增强的字符识别方法、装置和设备。涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域,可应用于智慧城市和智慧金融场景。具体方案为:针对包括字符的图像中的多个区域中的每个区域,确定区域的视觉特征和区域的多个字符文本特征,字符文本特征对应于区域中的一个字符;针对每个区域,基于区域的视觉特征和多个字符文本特征,确定区域的中的字符的字符视觉语义特征;以及基于字符视觉语义特征,对字符进行识别。由此,能够提升文本识别的准确率。
技术领域
本公开涉及人工智能领域,具体涉及计算机视觉和深度学习技术领域,可应用于智慧城市和智慧金融场景;并且更具体地,涉及用于视觉特征增强的字符识别方法、装置、设备、计算机可读存储介质和计算机程序产品。
背景技术
随着信息技术的发展,神经网络被广泛用于诸如计算机视觉、语音识别和信息检索等的各种机器学习任务。文档的特定信息提取,是从文档(例如请示、通知函、报告、会议纪要,以及合同、招标书、巡检报告、检修工单)中自动抽取特定信息,包括用户感兴趣的信息实体和关系等。利用神经网络对文档的图像进行处理,以对文档中的信息提取被认为是一种有效的方法。然而,文本识别的准确率还有待提高。
发明内容
根据本公开的示例实施例,提供了一种视觉特征增强的字符识别方法、装置、设备、计算机可读存储介质和计算机程序产品。
在本公开的第一方面中,提供了一种视觉特征增强的字符识别方法。该方法包括:针对包括字符的图像中的多个区域中的每个区域,确定区域的视觉特征和区域的多个字符文本特征,字符文本特征对应于区域中的一个字符;针对每个区域,基于区域的视觉特征和多个字符文本特征,确定区域的中的字符的字符视觉语义特征;以及基于字符视觉语义特征,对字符进行识别。
在本公开的第二方面中,提供了一种视觉特征增强的字符识别装置。该装置包括:第一特征确定模块,被配置为针对包括字符的图像中的多个区域中的每个区域,确定区域的视觉特征和区域的多个字符文本特征,字符文本特征对应于区域中的一个字符;第二特征确定模块,被配置为针对每个区域,基于区域的视觉特征和多个字符文本特征,确定区域的中的字符的字符视觉语义特征;以及字符识别模块,被配置为基于字符视觉语义特征,对字符进行识别。
在本公开的第三方面中,提供了一种电子设备,包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开的第一方面的方法。
在本公开的第四方面中,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。
在本公开的第五方面中,提供了一种计算机程序产品,包括计算机程序指令,该计算机程序指令被处理器实现如本公开的第一方面的方法。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素。附图用于更好地理解本方案,不构成对本公开的限定,其中:
图1示出了本公开的一些实施例能够在其中实现的视觉特征增强的字符识别的系统100的示例的示意图;
图2示出了本公开实施例的包括字符的图像的示例性图像200;
图3示出了根据本公开的一些实施例的用于视觉特征增强的字符识别的过程300的流程图;
图4示出了根据本公开的一些实施例的用于确定字符视觉语义特征的过程400的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110666440.0/2.html,转载请声明来源钻瓜专利网。