[发明专利]一种基于AIGC的音频媒体系统在审
| 申请号: | 202310513308.5 | 申请日: | 2023-05-09 |
| 公开(公告)号: | CN116484047A | 公开(公告)日: | 2023-07-25 |
| 发明(设计)人: | 肖轶;李林;槐福满;张蜀光 | 申请(专利权)人: | 北京兰姆达科技有限公司 |
| 主分类号: | G06F16/68 | 分类号: | G06F16/68;G06F16/65;G06F16/64;G06F16/632;H04N21/439;H04N21/81 |
| 代理公司: | 北京一诺通成知识产权代理事务所(普通合伙) 16145 | 代理人: | 孔巍 |
| 地址: | 100102 北京市朝*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 aigc 音频 媒体 系统 | ||
1.一种基于AIGC的音频媒体系统,其特征在于:包括音频内容管理平台和TTS系统/AIGC工具,所述音频内容管理平台集成了有声内容音频文件,通过对所述音频内容管理平台的音频内容的ASR处理生成内容标签元数据,通过对所述音频内容管理平台的音频内容中相同主播的媒体内容进行声音特征分析,利用现有成熟的AI算法工具提取媒体内容的音色、语速、方言、情感等信息数据标签,形成声音数字画像,所述声音数字画像和内容标签元数据信息结合生成dummy虚拟声音数字主播,所述dummy虚拟声音数字主播通过TTS系统/AIGC工具生成音频元数据管理系统。
2.根据权利要求1所述的一种基于AIGC的音频媒体系统,其特征在于:所述内容标签元数据包括音转文之后的商业化内容的分类标签、时间标签、商业化特性标签等信息。
3.根据权利要求2所述的一种基于AIGC的音频媒体系统,其特征在于:所述虚拟声音数字主播具有音频内容属性和主播声音特点。
4.根据权利要求3所述的一种基于AIGC的音频媒体系统,其特征在于:所述TTS系统/AIGC工具有多个相对成熟的服务平台包括阿里、腾讯、IBM、讯飞等服务平台。
5.根据权利要求4所述的一种基于AIGC的音频媒体系统,其特征在于:所述dummy虚拟声音数字主播进行内容无缝对接融合,并实现可剥离可定制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京兰姆达科技有限公司,未经北京兰姆达科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310513308.5/1.html,转载请声明来源钻瓜专利网。





