[发明专利]韵律边界标注方法、装置、设备、介质及程序产品在审
申请号: | 202210555616.X | 申请日: | 2022-05-19 |
公开(公告)号: | CN115116428A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 余剑威;王琰;戴子茜 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L13/10 | 分类号: | G10L13/10;G06F40/205;G06F40/289 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 韵律 边界 标注 方法 装置 设备 介质 程序 产品 | ||
本申请公开了一种韵律边界标注方法、装置、设备、介质及程序产品,涉及机器学习领域。该方法包括:获取目标文本和目标音频,以字符为分析粒度提取目标文本的文本韵律特征表示;以及,以发声内容为分析基础提取目标音频的音频韵律特征表示;将文本韵律特征表示和音频韵律特征表示进行融合,得到融合韵律特征表示;基于所述融合韵律特征表示对目标文本进行韵律边界预测,得到与目标文本等长的韵律边界标注结果。通过对融合韵律特征表示进行韵律边界预测,提高了对目标文本进行韵律边界标注的准确度;且以字符为粒度对目标文本进行分析和预测韵律边界,提高了韵律边界标注结果的细粒度,从而进一步提高了对目标文本进行韵律边界标注的准确度。
技术领域
本申请实施例涉及机器学习领域,特别涉及一种韵律边界标注方法、装置、设备、介质及程序产品。
背景技术
语音合成(Text-to-speech,TTS)系统是一种可以将任意输入文本转换成相应语音的计算机系统,在语音合成系统中,需要对输入文本的韵律边界进行预测。精确的韵律边界可以使得输入文本合成的语音更贴近人声,表达更为自然和准确。因此,精确标注了韵律边界的训练数据对于构建一个高质量的语音合成系统至关重要。
相关技术中,韵律边界标注方法通常是从文本内容中提取相关特征信息,然后对这些相关特征信息进行特征分析,从而对文本内容的韵律边界进行预测。
然而,上述相关技术中的韵律边界标注方法的准确度较低。
发明内容
本申请实施例提供了一种韵律边界标注方法、装置、设备、介质及程序产品,能够提高韵律边界标注的准确度。所述技术方案如下:
一方面,提供了一种韵律边界标注方法,所述方法包括:
获取目标文本和目标音频,所述目标文本的文本内容与所述目标音频的音频内容匹配,所述目标文本为待进行韵律边界识别的文本;
以字符为分析粒度提取所述目标文本的文本韵律特征表示;以及,以发声内容为分析基础提取所述目标音频的音频韵律特征表示;
将所述文本韵律特征表示和所述音频韵律特征表示进行融合,得到融合韵律特征表示;
基于所述融合韵律特征表示对所述目标文本进行韵律边界预测,得到与所述目标文本等长的韵律边界标注结果,所述韵律边界标注结果中包括以字符为粒度在所述目标文本上的进行划分的韵律边界。
另一方面,提供了一种韵律边界标注装置,所述装置包括:
数据获取模块,用于获取目标文本和目标音频,所述目标文本的文本内容与所述目标音频的音频内容匹配,所述目标文本为待进行韵律边界识别的文本;
特征提取模块,用于以字符为分析粒度提取所述目标文本的文本韵律特征表示;以及,用于以发声内容为分析基础提取所述目标音频的音频韵律特征表示;
特征融合模块,用于将所述文本韵律特征表示和所述音频韵律特征表示进行融合,得到融合韵律特征表示;
特征分析模块,用于基于所述融合韵律特征表示对所述目标文本进行韵律边界预测,得到与所述目标文本等长的韵律边界标注结果,所述韵律边界标注结果中包括以字符为粒度在所述目标文本上的进行划分的韵律边界。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现本申请实施例中任一所述的韵律边界标注方法。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行以实现本申请实施例中任一所述的韵律边界标注方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210555616.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耐高温降噪弹性胶及其制备工艺
- 下一篇:一种工业建筑空气调节系统