[发明专利]基于音色的音频转换方法及装置在审
申请号: | 201711008258.6 | 申请日: | 2017-10-25 |
公开(公告)号: | CN107767879A | 公开(公告)日: | 2018-03-06 |
发明(设计)人: | 齐路;颜钊;张姗姗 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G10L21/007 | 分类号: | G10L21/007;G10L25/24 |
代理公司: | 北京市立方律师事务所11330 | 代理人: | 刘延喜 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 音色 音频 转换 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,特别是涉及一种基于音色的音频转换方法及装置。
背景技术
在日常的生活交流中,一个人的声音往往就是他的身份名片,听到自己熟悉人的声音后,就可辨认出这个人。声音转换是声音信号处理领域近年来新兴的研究分支,声音转换技术是指在保持语义内容不变的情况下,通过改变一个原说话人的语音个性特征,使他说的话被听者认为是目标说话人说的话,由于可以将一个发音人的声音转换为另一个发音人的声音,使人听起来像是另一个人的声音,有着广泛的应用前景,如用户可以将自己的声音转换成所喜欢明星的声音,或转换成用户自己熟悉人的声音。
对于现有技术中的语音转换处理,通常是经过调整原说话人的语速或语调,从而实现将原说话人的声音转换为目标说话人的声音,虽然经过上述转换处理之后,可以使转换后的语音与目标说话人的语速、语调相对匹配,但其转换得到的语音相比较于目标说话人的声音,还是存在一定的差异,无法实现相对完美的语音转换。
发明内容
本发明提供基于音色的音频转换方法及装置,以实现对待转换音频信息的转换处理,提高对音频信息的转换精准度,进而提升以及丰富用户的使用体验感受。
本发明提供了一种基于音色的音频转换方法,包括:
获取待转换音频信息和目标音频标识信息;
对所述待转换音频信息进行特征提取,得到待转换特征信息;
根据预设的音色转换处理模块对所述待转换特征信息进行音色转换,将所述待转换特征信息转换为与所述目标音频标识信息对应的目标音频信息音色相同的目标特征信息,得到与所述目标音频信息音色相同的音频信息。
优选地,所述对所述待转换音频信息进行特征提取,得到待转换特征信息,包括:
对所述待转换音频信息进行声学特征提取得到待转换声学特征信息,并对所述待转换音频信息进行音素特征提取得到待转换音素特征信息。
优选地,所述对所述待转换音频信息进行声学特征提取得到待转换声学特征信息,包括:
对所述待转换音频信息进行声学特征提取,得到该待转换音频信息的梅尔频率倒谱系数MFCC特征信息;
对所述MFCC特征信息进行分帧处理,得到各帧对应的MFCC特征信息。
优选地,所述对所述待转换音频信息进行音素特征提取得到待转换音素特征信息,包括:
对所述待转换音频信息进行音素特征提取,得到该待转换音频信息的音素序列,其中,该音素序列为由构成该待转换音频信息的各音素组成的序列。
优选地,所述根据预设的音色转换处理模块对所述待转换特征信息进行音色转换,将所述待转换特征信息转换为与所述目标音频标识信息对应的目标音频信息音色相同的目标特征信息,包括:
获取预先存储的对应于所述目标音频标识信息的目标音频信息,提取所述目标音频特征信息对应的目标音频特征信息;
根据预设的音色转换处理模块对得到的待转换特征信息进行音色转换,将所述待转换特征信息转换为目标特征信息;
将所述目标特征信息与所述目标音频特征信息进行比对,确定二者匹配度;若匹配度大于预设阈值时,确定所述目标特征信息与所述目标音频特征信息匹配,得到与所述目标音频标识信息对应的目标音频信息音色相同的目标特征信息。
优选地,还包括:
采集所述待转换音频信息;
并根据用户的指示信息将该待转换音频信息通过数据上传请求发送到服务器,以使所述服务器根据接收到的待转换音频信息对所述音色转换处理模块中的样本数据进行更新。
优选地,所述将该待转换音频信息通过数据上传请求发送到服务器时,包括如下任意一种发送条件:
实时向服务器发送数据上传请求;
每隔预设时间段向服务器发送数据上传请求;
待转换音频信息的数量达到预设阈值时向服务器发送数据上传请求。
优选地,还包括:
接收服务器发送的更新指示,所述更新指示中携带有音色转换处理模块的更新信息;
根据所述音色转换处理模块的更新信息更新存储的该预设的音色转换处理模块。
优选地,所述待转换音频信息为用户上传的音频或本地存储的音频或云端存储的音频。
本发明还提供了一种基于音色的音频转换装置,包括:
获取单元,用于获取待转换音频信息和目标音频标识信息;
处理单元,用于对所述待转换音频信息进行特征提取,得到待转换特征信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711008258.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音控制方法、装置和终端设备
- 下一篇:一种混凝土浇筑废料处理回收系统