[发明专利]角色拆分方法、装置、电子设备及存储介质在审
申请号: | 202211636617.3 | 申请日: | 2022-12-14 |
公开(公告)号: | CN115941993A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 李娜;李海;刘俊晖;谢丹铭 | 申请(专利权)人: | 成都爱奇艺智能创新科技有限公司 |
主分类号: | H04N21/233 | 分类号: | H04N21/233;H04N21/439;H04N21/81;H04N21/434;G10L17/02 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 舒云 |
地址: | 610096 四川省成都市(四川)自*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 角色 拆分 方法 装置 电子设备 存储 介质 | ||
本发明实施例涉及一种角色拆分方法、装置、电子设备及存储介质,包括:从录制的原始视频中提取出群杂音频数据,所述群杂音频数据至少包括两个或两个以上群杂角色对应的语音数据;从所述群杂音频数据中提取出多个语音数据片段;提取每个所述语音数据片段的声纹特征;根据每个所述语音数据片段的声纹特征,确定每个所述语音数据片段对应的角色数据。由此,可以实现对多个群杂角色的语音数据进行角色拆分,这能够为后续应用,例如在AI智能配音项目中,为不同的群杂角色也模拟出不同的音色提供了实现基础,从而能够提高观众对AI配音影视的观影体验。
技术领域
本发明实施例涉及视频处理领域,尤其涉及一种角色拆分方法、装置、电子设备及存储介质。
背景技术
AI智能配音项目是指:使用少数(甚至是一个)配音员将整部影视中所有角色的台词录制完成,然后通过AI变声技术将配音员的音色转换为多个音色,再经过精细的后期制作形成AI配音影视。
由此可见,在AI智能配音项目中,角色拆分是一个很重要的工作阶段。所谓角色拆分就是将不同角色的语音数据分配到不同的音轨,以实现后续将不同音轨上的语音数据转换为不同的音色。
然而,目前的角色拆分技术只能够将重要角色的语音数据拆分出来,而将所有群杂角色的语音数据统一分配到一个音轨上,这就导致在AI配音影视中,多个群杂角色的音色相同,尤其是在群杂角色之间进行对话时,由于音色相同,因此观众听起来像是同一个群杂角色在自己跟自己对话,极大影响了观众的观影体验。
发明内容
鉴于此,为解决目前的角色拆分技术只能够将重要角色的语音数据拆分出来,而将所有群杂角色的语音数据统一分配到一个音轨上,导致在AI配音影视中,多个群杂角色的音色相同的技术问题,本发明实施例提供一种角色拆分方法、装置、电子设备及存储介质。
第一方面,本发明实施例提供一种角色拆分方法,包括:
从录制的原始视频中提取出群杂音频数据,所述群杂音频数据至少包括两个或两个以上群杂角色对应的语音数据,所述群杂角色指所述原始视频中除主角色以外的其他角色;
从所述群杂音频数据中提取出多个语音数据片段;
提取每个所述语音数据片段的声纹特征;
根据每个所述语音数据片段的声纹特征,确定每个所述语音数据片段对应的角色数据。
在一可能的实施方式中,所述从录制的原始视频中提取出群杂音频数据,包括:
获取所述原始视频的台词剧本;
从所述台词剧本中确定群杂角色对应台词的发声时间段;
从录制的原始视频中,提取所述发声时间段内的音频数据确定为所述群杂音频数据。
在一可能的实施方式中,所述根据每个所述语音数据片段的声纹特征,确定每个所述语音数据片段对应的角色数据,包括:
根据每个所述语音数据片段的声纹特征,对多个所述语音数据片段进行分类;
为同一类别中的所述语音数据片段确定相同的角色数据,为不同类别中的所述语音数据片段确定不同的角色数据。
在一可能的实施方式中,所述根据每个所述语音数据片段的声纹特征,对多个所述语音数据片段进行分类,包括:
从所述多个语音片段中选择不属于任一类别的语音片段作为当前语音片段;
确定所述当前语音片段的声纹特征与不属于任一类别的其他语音片段的声纹特征之间的相似度;
若所述相似度大于或等于预设的相似度阈值,则将所述其他语音片段与所述当前语音片段归入同一类别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都爱奇艺智能创新科技有限公司,未经成都爱奇艺智能创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211636617.3/2.html,转载请声明来源钻瓜专利网。