[发明专利]虚拟主播的直播方法、装置及系统有效

专利信息
申请号: 202310361605.2 申请日: 2023-04-07
公开(公告)号: CN116095357B 公开(公告)日: 2023-07-04
发明(设计)人: 王英;张青辉 申请(专利权)人: 世优(北京)科技有限公司
主分类号: H04N21/2187 分类号: H04N21/2187;H04N21/2343;H04N21/81;G06V40/16;G10L15/02
代理公司: 暂无信息 代理人: 暂无信息
地址: 100020 北京市朝阳*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 虚拟 直播 方法 装置 系统
【权利要求书】:

1.一种虚拟主播的直播方法,其特征在于,包括:

实时捕捉现实主播的面部动作数据和语音数据,对所述面部动作数据进行分析,得到所述现实主播的口型数据;

对所述语音数据进行分析,得到与所述语音数据对应的文字内容以及语音特征,对所述文字内容进行处理,将处理后的所述文字内容转换为音素序列;

基于所述音素序列和所述语音特征,对所述口型数据进行调整;

基于调整后的所述口型数据来生成用于直播的直播视频流,并将所述直播视频流推流至终端设备;

其中,基于所述音素序列和所述语音特征,对所述口型数据进行调整,包括:将所述音素序列中的每个音素与所述语音特征进行配对,得到所述每个音素对应的语音特征;基于所述每个音素对应的语音特征,计算所述每个音素对应的口型参数,其中,所述口型参数包括以下至少之一:嘴唇的形状、嘴唇的张合程度、舌头的位置、喉咙的位置、和嘴唇的运动速度;基于所述口型参数,对所述口型数据进行调整;

其中,所述口型数据是采用以下公式计算得到的:

其中,F(t)表示在时间t时刻生成的基于语音的口型数据,N表示参与计算的音素个数;Ai表示第i个音素的幅值;ti表示第i个音素的起始时间;σ表示第i个音素的标准差;D(t-ti)表示第i个音素的时长;Ki(t-ti)表示第i个音素的口型调整系数,用于模拟不同的口型调整方式;Ci表示发音者个体差异系数;Pi(t)表示第i个音素的谐波峰频率;Gi表示第i个音素的喉咙和口腔形态学特征系数,用于模拟不同的口腔和喉咙的形态的调整方式。

2.根据权利要求1所述的方法,其特征在于,对所述语音数据进行分析,得到与所述语音数据对应的文字内容以及语音特征,包括:

对所述语音数据进行预处理,通过数字信号处理技术来分析预处理后的所述语音数据,以从预处理后的所述语音数据中提取出所述语音特征,其中,所述语音特征包括所述语音数据的频谱信息、频率信息和语速信息;

通过语音识别技术来分析预处理后的所述语音数据,以从预处理后的所述语音数据中提取出对应的所述文字内容。

3.根据权利要求2所述的方法,其特征在于,对所述语音数据进行预处理,通过数字信号处理技术来分析预处理后的所述语音数据,包括:

对所述语音数据进行去噪处理,并对去噪处理后的所述语音数据进行分帧,得到多帧语音数据片;

通过所述数字信号处理技术,对每帧语音数据片进行频域分析,得到所述每帧语音数据片的频谱信息和频率信息,并对所述每帧语音数据片进行时域分析,得到所述每帧语音数据片的语速信息。

4.根据权利要求3所述的方法,其特征在于,在对所述口型数据进行调整之前,所述方法还包括:

针对所述每帧语音数据片,将所述每帧语音数据片的音素序列和所述每帧语音数据片的语音特征对应,计算所述每帧语音数据片的音素序列和所述每帧语音数据片的语音特征之间的距离,得到帧对齐误差;

基于所述帧对齐误差,使用动态规划算法将所述每帧语音数据片的语音特征对齐到所述每帧语音数据片的音素序列中。

5.根据权利要求1所述的方法,其特征在于,基于所述每个音素对应的语音特征,计算所述每个音素对应的口型参数,包括:

基于所述每个音素对应的语音特征中的频率信息,计算音高,并基于所述音高来确定所述嘴唇的张合程度,其中,所述音高越大,嘴唇张开的程度越大;

基于所述每个音素对应的语音特征中的频谱信息,计算出所述频谱信息中的两个或多个峰值频率之间的能量分布,以确定所述舌头的位置;

基于所述每个音素对应的语音特征中的频谱信息,计算出所述频谱信息中的共振峰的位置,并根据所述共振峰的位置计算出所述喉咙的位置;

基于所述每个音素对应的语音特征中的语速信息,计算出所述嘴唇的运动速度;

基于所述每个音素的发音特点,确定所述嘴唇的形状。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于世优(北京)科技有限公司,未经世优(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310361605.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top