[发明专利]多音字处理方法、装置、电子设备及存储介质在审
申请号: | 202110254598.7 | 申请日: | 2021-03-09 |
公开(公告)号: | CN113052179A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 王田;王晓斐;高群 | 申请(专利权)人: | 安徽淘云科技股份有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 230031 安徽省合肥市高新区习友*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多音 字处理 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种多音字处理方法、装置、电子设备及存储介质,该方法包括:获取扫描图像,对所述扫描图像进行切行,得到目标图像,对所述目标图像进行识别,得到所述至少一个注音和所述多个文字,基于所述至少一个注音,从所述多个文字中确定所述每个注音对应的多音字。本申请通过扫描和识别文本中的注音来确定文本中的多音字,能够解决无法识别文本中的多音字注音的问题,提高文本的识别效果。
技术领域
本申请涉及计算机技术领域,尤其涉及一种多音字处理方法、装置、电子设备及存储介质。
背景技术
随着电子技术的发展,电子设备的种类也越来越丰富。扫描笔又名微型扫描仪或手刮式扫描笔,是一种手持式的电子设备。将扫描笔的笔尖扫过书刊、报纸上的文字时,通过内置的光学字符识别(Optical Character Recognition,OCR)模块能够对书刊、报纸上的文字进行识别、存储、编辑等操作。对于识别到的文字,扫描笔通过内置的发音(Text ToSpeech,TTS)模块和翻译模块,能够将文字读出来并进行翻译。多音字,是指一个字有两个或两个以上的读音,不同的读音表义不同,用法不同,词性也往往不同。读音有区别词性和词义的作用;根据使用情况不同,读音也不同,读音有区别用法的作用。
在学生的课本和学习资料中,会存在大量标有注音的多音字,但是现有的扫描笔技术方案中,仅支持文字的扫描与识别,无法识别出待扫描文本中对多音字的注音。因而在这种情形中,扫描笔无法准确的实现语音的合成,无法正确理解语义,无法基于此进行准确的翻译。
发明内容
本申请实施例提出了一种多音字处理方法装置、电子设备及存储介质,能够支持注音的扫描和识别,从而提高文本的识别效果。
第一方面,本申请实施例提供一种多音字处理方法,所述方法包括:
获取扫描图像;
对所述扫描图像进行切行,得到目标图像;
对所述目标图像进行识别,得到所述至少一个注音和所述多个文字;
基于所述至少一个注音,从所述多个文字中确定所述每个注音对应的多音字。
第二方面,本申请实施例提供一种多音字处理装置,所述装置包括:
获取单元,用于获取扫描图像;
切行单元,用于对所述扫描图像进行切行,得到目标图像,所述目标图像中包括至少一个注音和多个文字;
识别单元,用于对所述目标图像进行识别,得到所述至少一个注音和所述多个文字;
确定单元,基于所述至少一个注音,从所述多个文字中确定所述每个注音对应的多音字
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面的任一方法中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面的任一方法中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面的任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽淘云科技股份有限公司,未经安徽淘云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110254598.7/2.html,转载请声明来源钻瓜专利网。