[发明专利]直播数据处理方法、装置、电子设备及可读存储介质在审
申请号: | 201910368522.X | 申请日: | 2019-05-05 |
公开(公告)号: | CN110062267A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 徐子豪;刘炉 | 申请(专利权)人: | 广州虎牙信息科技有限公司 |
主分类号: | H04N21/426 | 分类号: | H04N21/426;H04N21/431;H04N21/439;H04N21/442;H04N21/4788;H04N21/488 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 杨奇松 |
地址: | 511400 广东省广州市番禺区南村镇万博二*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 直播 音色 风格转换 语音数据 可读存储介质 电子设备 目标网络 数据处理 风格 互动 虚拟 互动数据流 互动效果 接收终端 网络参数 音频内容 并发 观众 播放 转换 申请 网络 学习 | ||
1.一种直播数据处理方法,其特征在于,应用于直播提供终端,所述方法包括:
解析接收到的音色转换请求得到目标音色风格;
获取具有所述目标音色风格的第一语音数据,并将所述第一语音数据输入到预先训练的网络参数学习模型中,得到所述目标音色风格对应的目标网络参数;
将预存的风格转换网络的网络参数调整为所述目标网络参数,并根据调整后的风格转换网络对主播输入的第二语音数据进行风格转换,得到具有所述目标音色风格的第三语音数据;
根据所述第三语音数据生成虚拟直播形象的直播互动数据流,并发送给直播接收终端进行播放。
2.根据权利要求1所述的直播数据处理方法,其特征在于,所述将所述第一语音数据输入到预先训练的网络参数学习模型中,得到所述目标音色风格对应的目标网络参数的步骤,包括:
提取所述第一语音数据对应的参考风格特征图;
将所述参考风格特征图输入到所述网络参数学习模型中,得到所述目标音色风格对应的目标网络参数。
3.根据权利要求1所述的直播数据处理方法,其特征在于,所述根据调整后的风格转换网络对主播输入的第二语音数据进行风格转换,得到具有所述目标音色风格的第三语音数据的步骤,包括:
提取所述第二语音数据的音频特征图,所述音频特征图包括内容特征图;
通过所述调整后的风格转换网络对所述内容特征图进行处理,得到具有所述目标音色风格的风格转换特征图;
对所述内容特征图和所述风格转换特征图进行特征反转换,得到具有该目标音色风格的第三语音数据。
4.根据权利要求1-3中任意一项所述的直播数据处理方法,其特征在于,所述网络参数学习模型利用至少一种音色风格的第一语音样本和任意主播的第二语音样本基于深度学习的神经网络训练获得,其中,所述至少一种音色风格包括所述目标音色风格。
5.根据权利要求1-3中任意一项所述的直播数据处理方法,其特征在于,所述在从接收到的音色转换请求中获得目标音色风格之前,所述方法还包括:
预先根据训练样本训练得到所述网络参数学习模型,具体包括:
获取训练样本,所述训练样本包括至少一种音色风格的第一语音样本和任意主播的第二语音样本,其中,所述至少一种音色风格包括所述目标音色风格;
从所述任意主播的第二语音样本中提取对应的内容特征样本图;
针对每种音色风格,从该音色风格的第一语音样本中提取对应的风格特征样本图;
根据所述内容特征样本图和每种音色风格对应的风格特征样本图对元学习网络进行训练,得到所述网络参数学习模型,并存储在所述直播提供终端中。
6.根据权利要求5所述的直播数据处理方法,其特征在于,所述根据所述内容特征样本图和每种音色风格对应的风格特征样本图对元学习网络进行训练的步骤,包括:
将每种音色风格对应的风格特征样本图输入到所述元学习网络中,得到每种音色风格的风格网络参数;
根据每种音色风格的风格网络参数对预设的风格转换网络的网络参数进行调整,并将所述内容特征样本图输入到调整后的风格转换网络中,得到对应的风格转换特征样本图;
根据每种音色风格的风格特征样本图和对应的风格转换特征样本图调整所述元学习网络的网络参数,得到所述网络参数学习模型。
7.根据权利要求6所述的直播数据处理方法,其特征在于,所述根据每种音色风格的风格特征样本图和对应的风格转换特征样本图调整所述元学习网络的网络参数的步骤,包括:
计算每种音色风格的风格特征样本图和对应的风格转换特征样本图之间的损失函数值;
根据所述损失函数值更新所述元学习网络的网络参数后迭代训练,直到所述元学习网络满足训练终止条件时,输出训练得到的网络参数学习模型。
8.根据权利要求7所述的直播数据处理方法,其特征在于,所述训练终止条件包括以下条件中的至少一种:
所述损失函数值不再下降;
所述损失函数值低于设定值;
迭代训练次数达到设定次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙信息科技有限公司,未经广州虎牙信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910368522.X/1.html,转载请声明来源钻瓜专利网。