[发明专利]发音预测方法、装置、设备及存储介质在审
申请号: | 202210305723.7 | 申请日: | 2022-03-23 |
公开(公告)号: | CN114662478A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 金波 | 申请(专利权)人: | 京东科技信息技术有限公司 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F16/632;G06F40/205;G10L13/04;G10L13/047;G10L13/08;G10L25/30 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发音 预测 方法 装置 设备 存储 介质 | ||
本公开提供一种发音预测方法、装置、设备及存储介质,涉及语音处理技术领域。该方法包括:获取待处理字符序列中待处理字符;若确定待处理字符为多音字,根据待处理字符序列获得预设数量个目标片段,目标片段包括待处理字符,和/或目标片段包括待处理字符序列中连续的至少两个字符;将各个目标片段与第一词典中的词分别进行匹配,获得各个目标片段对应的第一特征值;根据各个目标片段对应的第一特征值获得待处理字符的预设数量维度的第一特征向量;根据待处理字符的第一特征向量和待处理字符的词嵌入向量获得待处理字符的输入向量;将待处理字符的输入向量输入第一神经网络模型,获得待处理字符的发音预测结果,提高了语音合成播报内容的准确性。
技术领域
本公开涉及语音处理技术领域,具体而言,涉及一种发音预测方法、装置、电子设备及可读存储介质。
背景技术
随着人工智能的高速发展,语音合成技术应用越来越广泛,尤其在人工智能客服机器人等场景中,会使用语音合成的声音,用机器人播报出来和客户进行交互。在实际应用场景中,用户对机器人对话的准确程度、拟人程度要求越来越高。因此如何提高人机交互过程中语音合成播报内容的准确性是要解决的问题之一。
在语音合成技术中,多音字是其中重要环节。如何确定多音字在不同的上下文场景中的不同发音,以提高人机交互过程中语音合成播报内容的准确性,成为语音合成技术中亟待解决的问题。
在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种发音预测方法、装置、电子设备及可读存储介质,能够确定多音字在不同的上下文场景中的不同发音,至少在一定程度上提高了人机交互过程中语音合成播报内容的准确性。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一方面,提供一种发音预测方法,包括:获取待处理字符序列中的待处理字符;若确定所述待处理字符为多音字,根据所述待处理字符序列获得预设数量个目标片段,其中,所述目标片段包括所述待处理字符,和/或所述目标片段包括所述待处理字符序列中连续的至少两个字符;将各个所述目标片段与第一词典中的词分别进行匹配,获得各个所述目标片段对应的第一特征值;根据各个所述目标片段对应的第一特征值获得所述待处理字符的第一特征向量,所述第一特征向量的维度为所述预设数量;根据所述待处理字符的第一特征向量和所述待处理字符的词嵌入向量获得所述待处理字符的输入向量;将所述待处理字符的输入向量输入第一神经网络模型,获得所述待处理字符的发音预测结果。
根据本公开的一实施例,根据所述待处理字符序列获得预设数量个目标片段,包括:将所述待处理字符序列中所述待处理字符的上文和/或下文与所述待处理字符合并,获得所述目标片段。
根据本公开的一实施例,将所述待处理字符序列中所述待处理字符的上文和/或下文与所述待处理字符合并,获得所述目标片段,包括:若所述待处理字符在所述待处理字符序列中没有上文,将预设补位字符与所述待处理字符合并,获得所述目标片段,或若所述待处理字符在所述待处理字符序列中没有下文,将预设补位字符与所述待处理字符合并,获得所述目标片段。
根据本公开的一实施例,所述第一词典中的词包括目标词及其对应的发音类别编号,所述目标词包括至少一个多音字;将各个所述目标片段与第一词典中的词分别进行匹配,获得各个所述目标片段对应的第一特征值,包括:将各个所述目标片段与所述第一词典中的词分别进行匹配,若所述目标片段与所述目标词匹配成功,则获得所述目标片段对应的第一特征值为所述目标词对应的发音类别编号。
根据本公开的一实施例,将各个所述目标片段与第一词典中的词分别进行匹配,获得各个所述目标片段对应的第一特征值,还包括:若所述目标片段与所述第一词典中的任一目标词都未匹配成功,则获得所述目标片段对应的第一特征值为预设数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技信息技术有限公司,未经京东科技信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210305723.7/2.html,转载请声明来源钻瓜专利网。