[发明专利]文本发音获取方法、装置和电子设备有效
| 申请号: | 202010267829.3 | 申请日: | 2020-04-08 |
| 公开(公告)号: | CN111506736B | 公开(公告)日: | 2023-08-08 |
| 发明(设计)人: | 钱璟;郭辰阳;吕继根;邵英杰;张野 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/216;G06F40/289;G10L15/16;G10L15/187 |
| 代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 黄灿;胡永芳 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 发音 获取 方法 装置 电子设备 | ||
1.一种文本发音获取方法,其特征在于,包括:
获取待预测文本;
利用预测模型对所述待预测文本的发音进行预测,获得所述待预测文本的文本发音,所述预测模型的训练样本包括目标字的发音,以及所述目标字的释义信息;
所述训练样本还包括如下一项或多项:
包括所述目标字的训练文本中各字的发音,以及所述训练文本的释义信息;
所述训练文本中目标字的发音,以及目标字的位置坐标;
所述训练文本中目标字的发音,以及伴侣字的部首和所述部首的坐标差;
所述训练文本中目标字的发音,以及伴侣字的释义特征;
所述训练文本中目标字的发音,以及伴侣字的坐标差。
2.根据权利要求1所述的文本发音获取方法,其特征在于,所述利用预测模型对所述待预测文本的发音进行预测,获得所述待预测文本的文本发音,包括:
利用预测模型对所述待预测文本的发音进行预测,获得至少两个发音,以及所述至少两个发音的各发音对应的发音得分;
根据所述待预测文本进行第一网络搜索,获得第一搜索结果,所述第一搜索结果包括所述待预测文本的至少一个发音;
若所述第一搜索结果中第一发音出现的次数与所述第一搜索结果中所有发音出现的次数之和的比值大于预设阈值,则根据所述至少两个发音和所述第一发音确定所述待预测文本的文本发音,其中,所述第一发音为所述第一搜索结果中出现次数最多的发音。
3.根据权利要求2所述的文本发音获取方法,其特征在于,所述若所述第一搜索结果中第一发音出现的次数与所述第一搜索结果中所有发音出现的次数之和的比值大于预设阈值,则根据所述至少两个发音和所述第一发音确定所述待预测文本的文本发音,包括:
若所述第一发音与所述第一搜索结果中所有发音出现的次数之和的比值大于预设阈值,且所述第一发音与所述至少两个发音中的第二发音相同,则调整所述至少两个发音中各发音对应的发音得分;
将所述至少两个发音中最高的发音得分对应的发音确定为所述待预测文本的文本发音。
4.根据权利要求1所述的文本发音获取方法,其特征在于,所述利用预测模型对所述待预测文本的发音进行预测,获得所述待预测文本的文本发音,包括:
对所述待预测文本的释义信息进行第二网络搜索,获得第二搜索结果;
对所述第二搜索结果进行信息抽取,并将抽取获得的抽取信息确定为所述待预测文本的释义信息;
基于所述待预测文本的释义信息,利用所述预测模型对所述待预测文本的发音进行预测,获得所述待预测文本的文本发音。
5.根据权利要求3所述的文本发音获取方法,其特征在于,所述若所述第一发音与所述第一搜索结果中所有发音出现的次数之和的比值大于预设阈值,且所述第一发音与所述至少两个发音中的第二发音相同,则调整所述至少两个发音中各发音对应的发音得分,包括:
若所述第一发音与所述第一搜索结果中所有发音出现的次数之和的比值大于预设阈值,且所述第一发音与所述至少两个发音中最高的发音得分对应的第二发音相同,则将所述待预测文本与所述第一发音的对应关系存入数据集中,所述数据集中的数据用于对所述预测模型进行更新;
调整所述至少两个发音中各发音对应的发音得分。
6.一种文本发音获取装置,其特征在于,包括:
第一获取模块,用于获取待预测文本;
第二获取模块,用于利用预测模型对所述待预测文本的发音进行预测,获得所述待预测文本的文本发音,所述预测模型的训练样本包括目标字的发音,以及所述目标字的释义信息;
所述训练样本还包括如下一项或多项:
包括所述目标字的训练文本中各字的发音,以及所述训练文本的释义信息;
所述训练文本中目标字的发音,以及目标字的位置坐标;
所述训练文本中目标字的发音,以及伴侣字的部首和所述部首的坐标差;
所述训练文本中目标字的发音,以及伴侣字的释义特征;
所述训练文本中目标字的发音,以及伴侣字的坐标差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010267829.3/1.html,转载请声明来源钻瓜专利网。





