[发明专利]基于人工智能的语音处理方法及其装置有效
申请号: | 201710855048.4 | 申请日: | 2017-09-20 |
公开(公告)号: | CN107657947B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 孔德威 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/05;G10L15/06;G10L15/14 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于人工智能的语音处理方法及其装置,其中,方法包括:采集语音进行切分,形成多个语音片段,识别每个语音片段,获取语音片段的识别文本片段,按照识别文本片段的顺序,从当前识别文本片段对应的原始文本中,确定当前识别文本片段的原始文本片段,对原始文本片段以及原始文本片段对应的语音片段进行拼接,得到句子文本和句子文本对应的句子语音,生成句子文本的拼音,并根据拼音形成音子序列,将音子序列与句子语音进行对齐,获取音子边界,利用句子文本、句子语音、拼音以及音子边界,形成用于对语音合成模型进行训练的目标数据。由此,实现自动对语音进行切分以及标注,形成准确率较高的用于对语音合成模型进行训练的标注数据。 | ||
搜索关键词: | 基于 人工智能 语音 处理 方法 及其 装置 | ||
【主权项】:
一种基于人工智能的语音处理方法,其特征在于,包括:采集语音进行切分,形成多个语音片段,识别每个语音片段,获取所述语音片段的识别文本片段;按照识别文本片段的顺序,从当前识别文本片段对应的原始文本中,确定当前识别文本片段的原始文本片段;对原始文本片段以及原始文本片段对应的语音片段进行拼接,得到句子文本和所述句子文本对应的句子语音;生成所述句子文本的拼音,并根据所述拼音形成音子序列,将所述音子序列与所述句子语音进行对齐,获取音子边界;利用所述句子文本、所述句子语音、所述拼音以及所述音子边界,形成用于对语音合成模型进行训练的目标数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710855048.4/,转载请声明来源钻瓜专利网。
- 上一篇:制备成型声学结构的方法
- 下一篇:嵌入式音频终端及其语音交互方法