[发明专利]一种声音复刻方法、装置、设备及介质在审

申请号：	202110676209.X	申请日：	2021-06-18
公开（公告）号：	CN115497480A	公开（公告）日：	2022-12-20
发明（设计）人：	陈维强;王月岭;高雪松;孟卫明;王彦芳;田羽慧;杜兆臣	申请（专利权）人：	海信集团控股股份有限公司
主分类号：	G10L17/00	分类号：	G10L17/00;G10L15/18;G10L15/22;G10L15/26
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	杜晶
地址：	266555 山东省青***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种声音方法装置设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种声音复刻方法、装置、设备及介质，由于本申请实施例中，在接收到语音信息后，基于该接收到的语音信息确定用户的身份信息，并根据预先保存的身份信息与模型的对应关系，确定该目标身份信息对应的训练完成的目标模型，进而基于该训练完成的目标模型确定第一文本信息对应的目标音频数据，从而实现了可以基于不同的用户的声音进行声音复刻，提高了声音复刻的多样化，提高了用户体验。

技术领域

本申请涉及智能音箱技术领域，尤其涉及一种声音复刻方法、装置、设备及介质。

背景技术

伴随着信息化的快速发展，越来越多的智能音箱都采用声音复刻的方式来实现智能音箱模仿特定的音色讲故事，从而提高用户的体验。

现有技术中，一般都是基于预先设置的人物的声音进行声音复刻，也就是说，无论在哪个家庭，哪种场景都是以该预先设定的人物的声音在进行输出。具体的过程包括：将需要复刻的文本输入到统一的训练完成的模型中确定声学序列，然后根据输出的声学序列形成针对该预先设置的人物的声音复刻的音频文件并输出，其中，该音频文件可以用于讲故事等。

但是，若将该方案应用于家庭等拥有很多成员的场景，若一直基于该预先设置的人物的声音进行声音复刻，则导致声音复刻不够多样化，影响用户体验。

发明内容

本申请提供了一种声音复刻方法、装置、设备及介质，用以解决现有技术中基于该预先设置的人物的声音进行声音复刻，导致声音复刻不够多样化，影响用户体验问题。

本申请提供了一种声音复刻方法，所述方法包括：

根据接收到的语音信息，确定用户的目标身份信息；

根据预先保存的身份信息与模型的对应的关系，确定所述目标身份信息对应的训练完成的目标模型；

获得第一文本信息，基于所述训练完成的目标模型，获得所述第一文本信息对应的目标音频数据并输出。

进一步地，所述根据接收到的语音信息，确定用户的目标身份信息包括：

识别所述语音信息的声纹信息；

根据所述声纹信息以及预先保存的声纹信息与用户身份的对应关系，确定所述用户的目标身份信息。

进一步地，所述根据接收到的语音信息，确定用户的目标身份信息包括：

识别所述语音信息的第二文本信息，对所述第二文本信息进行语义解析；