[发明专利]文字识别方法及装置有效
申请号: | 201711332707.2 | 申请日: | 2017-12-13 |
公开(公告)号: | CN108021918B | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 张水发 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 北京尚伦律师事务所 11477 | 代理人: | 代治国 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 识别 方法 装置 | ||
1.一种文字识别方法,其特征在于,包括:
获取字块序列,所述字块序列中包括多个字块;
根据预设神经网络,识别出字块序列中每个字块对应的至少一个文字及每个文字的识别概率;
根据所述至少一个文字和预设散列表,将所述字块序列按语义分割为多个子序列,并确定每个子序列对应的至少一个文字组合;其中,所述文字组合包括对应子序列的每个字块所对应的一个文字,所述预设散列表包括文字的各个词组;
根据所述每个子序列对应的至少一个文字组合和所述每个文字的识别概率,确定所述字块序列的文字;
其中,所述根据所述至少一个文字和预设散列表,将所述字块序列按语义分割为多个子序列,并确定每个子序列对应的至少一个文字组合包括:
获取未分割字块中前i个字块的m个组合;所述i和m是正整数;所述字块序列包括未分割字块和已分割字块,所述已分割字块已被分为k个子序列;所述k是子序列的序列号;
获取所述字块序列中第j个字块对应的n个文字;所述第j个字块是所述未分割字块中第i+1个字块;所述j是小于或等于字块序列的字块个数的正整数;
将所述n个文字与所述m个组合一一组合,得到所述未分割字块中前i+1个字块的m*n个新组合;其中,所述第i+1个字块的文字作为每个新组合中的最后一个文字;
判断所述预设散列表中的词组是否包括所述m*n个新组合中任一个新组合;
当所述预设散列表中的词组包括w个新组合时,将所述w个新组合作为所述前i+1个字块的w个组合;所述w是正整数。
2.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个文字和预设散列表,将所述字块序列按语义分割为多个子序列,并确定每个子序列对应的至少一个文字组合还包括:
当所述预设散列表中的词组不包括任一新组合时,将所述前i个字块分为第k+1个子序列,将所述前i个字块的m个组合作为所述第k+1个子序列对应的至少一个文字组合;更新所述字块序列中已分割字块和未分割字块;其中,更新后的已分割字块包括所述前i个字块,所述第j个字块作为更新后的未分割字块的第1个字块。
3.根据权利要求2所述的方法,其特征在于,所述根据所述每个子序列对应的至少一个文字组合和所述每个文字的识别概率,确定所述字块序列的文字包括:
从所述每个文字的识别概率中,获取所述第k+1个子序列对应的每个文字组合中文字的识别概率;
根据所述第k+1个子序列对应的每个文字组合中文字的识别概率,计算所述第k+1个子序列对应的每个文字组合的概率;
将概率最高的文字组合的文字作为所述第k+1个子序列的文字。
4.根据权利要求1所述的方法,其特征在于,所述获取字块序列,所述字块序列中包括多个字块包括:
获取文字图片;
将所述文字图片中的文本按字块进行分割,得到所述字块序列。
5.根据权利要求1所述的方法,其特征在于,所述根据预设神经网络,识别出字块序列中每个字块对应的至少一个文字及每个文字的识别概率之后,所述方法还包括:
对于每个字块,获取识别概率最高的n个文字作为相应字块对应的n个文字,所述n是正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711332707.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种市政道路基坑安全防护装置
- 下一篇:一种保温建筑材料的制备方法及其应用