[发明专利]一种声音复刻方法、装置、设备及介质在审
申请号: | 202110676209.X | 申请日: | 2021-06-18 |
公开(公告)号: | CN115497480A | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 陈维强;王月岭;高雪松;孟卫明;王彦芳;田羽慧;杜兆臣 | 申请(专利权)人: | 海信集团控股股份有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L15/18;G10L15/22;G10L15/26 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 杜晶 |
地址: | 266555 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声音 方法 装置 设备 介质 | ||
本申请公开了一种声音复刻方法、装置、设备及介质,由于本申请实施例中,在接收到语音信息后,基于该接收到的语音信息确定用户的身份信息,并根据预先保存的身份信息与模型的对应关系,确定该目标身份信息对应的训练完成的目标模型,进而基于该训练完成的目标模型确定第一文本信息对应的目标音频数据,从而实现了可以基于不同的用户的声音进行声音复刻,提高了声音复刻的多样化,提高了用户体验。
技术领域
本申请涉及智能音箱技术领域,尤其涉及一种声音复刻方法、装置、设备及介质。
背景技术
伴随着信息化的快速发展,越来越多的智能音箱都采用声音复刻的方式来实现智能音箱模仿特定的音色讲故事,从而提高用户的体验。
现有技术中,一般都是基于预先设置的人物的声音进行声音复刻,也就是说,无论在哪个家庭,哪种场景都是以该预先设定的人物的声音在进行输出。具体的过程包括:将需要复刻的文本输入到统一的训练完成的模型中确定声学序列,然后根据输出的声学序列形成针对该预先设置的人物的声音复刻的音频文件并输出,其中,该音频文件可以用于讲故事等。
但是,若将该方案应用于家庭等拥有很多成员的场景,若一直基于该预先设置的人物的声音进行声音复刻,则导致声音复刻不够多样化,影响用户体验。
发明内容
本申请提供了一种声音复刻方法、装置、设备及介质,用以解决现有技术中基于该预先设置的人物的声音进行声音复刻,导致声音复刻不够多样化,影响用户体验问题。
本申请提供了一种声音复刻方法,所述方法包括:
根据接收到的语音信息,确定用户的目标身份信息;
根据预先保存的身份信息与模型的对应的关系,确定所述目标身份信息对应的训练完成的目标模型;
获得第一文本信息,基于所述训练完成的目标模型,获得所述第一文本信息对应的目标音频数据并输出。
进一步地,所述根据接收到的语音信息,确定用户的目标身份信息包括:
识别所述语音信息的声纹信息;
根据所述声纹信息以及预先保存的声纹信息与用户身份的对应关系,确定所述用户的目标身份信息。
进一步地,所述根据接收到的语音信息,确定用户的目标身份信息包括:
识别所述语音信息的第二文本信息,对所述第二文本信息进行语义解析;
根据所述语义解析的结果,确定所述用户的目标身份信息。
进一步地,所述根据所述语义解析的结果,确定所述用户的目标身份信息之前,所述方法还包括:
根据所述语义解析的结果,确定所述语音信息对应的应用场景是否为第一应用场景;
若是,则进行根据所述语义解析的结果,确定所述用户的目标身份信息的操作。
进一步地,所述识别所述语音信息的第二文本信息之后,所述方法还包括:
将所述第二文本信息以及所述语音信息添加到所述目标模型对应的训练集中,以通过所述第二文本信息以及所述语音信息对所述目标模型继续训练。
进一步地,所述将所述第二文本信息以及所述语音信息添加到所述目标模型对应的训练集中之前,所述方法还包括:
确定所述语音信息是否满足预设的噪声条件,若是,则进行将所述第二文本信息以及所述语音信息添加到所述目标模型对应的训练集中的操作。
进一步地,所述获得第一文本信息包括:
接收文本信息选择指令,所述文本信息选择指令中携带被选择的文本信息的标识信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信集团控股股份有限公司,未经海信集团控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110676209.X/2.html,转载请声明来源钻瓜专利网。