[发明专利]文本识别方法、模型的训练方法及装置在审
| 申请号: | 202210198346.1 | 申请日: | 2022-03-01 |
| 公开(公告)号: | CN114663886A | 公开(公告)日: | 2022-06-24 |
| 发明(设计)人: | 王昆;余威 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V10/774 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 马姣琴;臧建明 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 识别 方法 模型 训练 装置 | ||
1.一种文本识别方法,包括:
对获取到的待识别图像进行光学字符识别,得到所述待识别图像的初始的文字;
对所述初始的文字进行分析处理,得到所述初始的文字的类别属性,若所述初始的文字的类别属性表征所述初始的文字为错误的文字,则对所述错误的文字进行纠错处理,得到用于纠正所述错误的文字的正确的文字;
根据所述初始的文字和所述正确的文字,生成所述待识别图像的文本内容。
2.根据权利要求1所述的方法,其中,所述初始的文字的数量为多个;对所述初始的文字进行分析处理,得到所述初始的文字的类别属性,包括:
对各初始的文字逐一进行分析处理,得到各初始的文字各自对应的类别属性。
3.根据权利要求2所述的方法,其中,每一初始的文字具有位置属性;对各初始的文字逐一进行分析处理,得到各初始的文字各自对应的类别属性,包括:
根据各初始的文字各自对应的位置属性,依次确定各初始的文字各自对应的类别属性。
4.根据权利要求2-3任一项所述的方法,其中,对所述初始的文字进行分析处理,得到所述初始的文字的类别属性,包括:
将所述初始的文字输入至预先训练的文字位判别器,输出所述初始的文字的类别属性;
其中,所述文字位判别器是基于初始化模型参数训练得到的,所述初始化模型参数是基于第一样本数据集训练得到的,所述第一样本数据集中包括初始的兴趣点名称文本、以及对所述初始的兴趣点名称文本进行修改得到的变体的兴趣点名称文本,所述变体的兴趣点名称文本中至少包括一个错误的文字。
5.根据权利要求1-4任一项所述的方法,其中,对所述错误的文字进行纠错处理,得到用于纠正所述错误的文字的正确的文字,包括:
对所述初始的文字中的错误的文字进行掩码处理;
对掩码处理后的初始的文字进行预测,得到候选集,并从所述候选集中获取所述正确的文字;其中,所述候选集中包括用于替换所述错误的文字的纠错文字。
6.根据权利要求5所述的方法,其中,所述纠错文字的数量为多个;从所述候选集中获取所述正确的文字,包括:
获取所述错误的文字的字体结构属性,并获取每一纠错文字的字体结构属性,其中,所述字体结构属性用于表征文字的笔画内容和/或笔画顺序;
根据所述错误的文字的字体结构属性、以及各纠错文字各自对应的字体结构属性,从各纠错文字中确定所述正确的文字。
7.根据权利要求6所述的方法,其中,根据所述错误的文字的字体结构属性、以及各纠错文字各自对应的字体结构属性,从各纠错文字中确定所述正确的文字;包括:
针对每一纠错文字的字体结构属性,计算该纠错文字的字体结构属性与所述错误的文字的字体结构属性之间的相似度;
根据各相似度从各纠错文字中确定所述正确的文字。
8.根据权利要求7所述的方法,其中,根据各相似度从各纠错文字中确定所述正确的文字,包括:
从各相似度中确定最大的相似度;
从所述候选集中提取所述最大的相似度对应的纠错文字,并将所述最大的相似度对应的纠错文字确定为所述正确的文字。
9.根据权利要求5-8任一项所述的方法,其中,对掩码处理后的初始的文本进行预测,得到候选集,包括:
将所述掩码处理后的初始的文字输入至预先训练的掩码语言召回模型,输出所述候选集;
其中,所述掩码语言召回模型是基于第二样本数据集训练生成的,所述第二样本数据集中包括样本兴趣点名称文本。
10.根据权利要求1-9任一项所述的方法,其中,根据所述初始的文字和所述正确的文字,生成所述待识别图像的文本内容,包括:
将所述正确的文字替换所述初始的文字中的错误的文字,得到所述待识别图像的文本内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210198346.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种蒸汽烤箱
- 下一篇:模型训练及图像处理方法、介质、装置和计算设备





