[发明专利]多音字处理方法、装置、电子设备及存储介质在审

申请号：	202110254598.7	申请日：	2021-03-09
公开（公告）号：	CN113052179A	公开（公告）日：	2021-06-29
发明（设计）人：	王田;王晓斐;高群	申请（专利权）人：	安徽淘云科技股份有限公司
主分类号：	G06K9/34	分类号：	G06K9/34
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	熊永强
地址：	230031 安徽省合肥市高新区习友***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	多音字处理方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种多音字处理方法，其特征在于，所述方法包括：

获取扫描图像；

对所述扫描图像进行切行，得到目标图像；

对所述目标图像进行识别，得到所述至少一个注音和所述多个文字；

基于所述至少一个注音，从所述多个文字中确定所述每个注音对应的多音字。

2.根据权利要求1所述的方法，其特征在于，在所述至少一个注音与所述多个文字分别位于相邻行时；

所述对所述扫描图像进行切行，得到目标图像，包括：

对所述扫描图像进行切行，得到至少一个中间图像，每个中间图像包括文字行和注音行；

对每个所述中间图像进行切行，得到至少一个目标图像，所述目标图像包括文字图像和注音图像。

3.根据权利要求2所述的方法，其特征在于，所述基于所述至少一个注音，从所述多个文字中确定所述每个注音对应的多音字，包括：

基于所述每个注音的起止坐标和所述每个文字的起止坐标，从所述多个文字中确定每个注音对应的至少一个候选文字；

从所述每个注音对应的至少一个候选文字中确定每个注音对应的多音字。

4.根据权利要求3所述的方法，其特征在于，所述对所述目标图像进行识别，得到所述至少一个注音和所述多个文字，包括：

使用拼音识别模型对所述注音图像进行识别，得到所述注音图像中的多个拼音字母；

将所述拼音字母之间的距离小于或等于阈值的连续相邻的至少一个拼音字母划分为一个注音，得到所述至少一个注音，并记录每个注音的所述起止坐标；

使用文字识别模型对所述文字图像进行识别，得到所述多个文字，并记录每个所述文字的所述起止坐标。

5.根据权利要求3或4所述的方法，其特征在于，所述注音的起止坐标与所述候选文字的起止坐标全部或部分重叠。

6.根据权利要求1所述的方法，其特征在于，在所述至少一个注音与所述多个文字位于同一行时；

所述对所述目标图像进行识别，得到所述至少一个注音和所述多个文字，包括：

使用文字识别模型对所述目标图像从左到右进行识别，当在文字识别模型下识别出第一符号时，使用拼音识别模型进行识别，当在拼音识别模型下识别出第二符号时，使用文字识别模型进行识别，得到所述多个文字和多个拼音字母；

将所述多个拼音字母中的拼音字母距离小于或等于预设阈值，且连续相邻的至少一个拼音字母划分为一个注音，得到所述至少一个注音，并记录每个注音和每个文字的所述起止坐标。

7.根据权利要求6所述的方法，其特征在于，所述注音的起止坐标与所述候选文字的起止坐标相邻或间隔N，所述N为起止坐标连续相邻的注音数量。

8.根据权利要求5或7所述的方法，其特征在于，所述从所述每个注音对应的至少一个候选文字中确定每个注音对应的多音字，包括：

获取每个候选文字的所有拼音，将所述每个候选文字的所有拼音分别与对应的注音进行匹配；

将与每个注音匹配上的候选文字确定为所述多音字。

9.根据权利要求8所述的方法，其特征在于，所述方法还包括：

将所述每个注音标注为对应的所述多音字的拼音；

将所述多个文字和所述多音字的拼音输入翻译模块和/或发音模块。

10.一种多音字处理装置，其特征在于，所述装置包括：

获取单元，用于获取扫描图像；

切行单元，用于对所述扫描图像进行切行，得到目标图像，所述目标图像中包括至少一个注音和多个文字；

识别单元，用于对所述目标图像进行识别，得到所述至少一个注音和所述多个文字；

确定单元，用于基于所述至少一个注音，从所述多个文字中确定所述每个注音对应的多音字。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安徽淘云科技股份有限公司，未经安徽淘云科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110254598.7/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载