专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果198个,建议您升级VIP下载更多相关专利
  • [发明专利]语音风格迁移模型的训练方法、装置、设备及存储介质-CN202110192901.5有效
  • 孙奥兰;王健宗;程宁 - 平安科技(深圳)有限公司
  • 2021-02-20 - 2023-10-17 - G10L25/24
  • 本申请涉及人工智能技术领域,公开了一种语音风格迁移模型的训练方法、装置、设备及存储介质,该方法包括:通过基于预置神经网络模型,根据第一梅尔语谱信息和第二梅尔语谱信息得到第一更新参数;将第一梅尔语谱信息和第二梅尔语谱信息输入到预置分类器,得到对应第一风格奖励参数;通过第二梅尔语谱信息确定第一内容奖励参数;根据第一风格奖励参数和第一内容奖励参数,获取第二更新参数;通过第一更新参数和第二更新参数对预置神经网络模型的模型参数进行更新生成对应的语音风格迁移模型,实现音频到音频的风格迁移,且分类器可以实现细粒度的风格迁移,还从风格奖励和内容奖励两个维度完成源音频到目标音频的转换,无需收集大量目标音频语料。
  • 语音风格迁移模型训练方法装置设备存储介质
  • [发明专利]一种虚拟音色转换方法、装置、系统及存储介质-CN202310968082.8在审
  • 郭丹丹 - 平安银行股份有限公司
  • 2023-07-31 - 2023-10-13 - G10L25/24
  • 本发明提供了一种虚拟音色转换方法、装置、系统及存储介质,涉及金融科技技术领域。所述虚拟音色转换方法包括:基于目标音色向客户端推送服务应答信息;根据人工客服转接指令连接对应人工客服端;获取交互语音数据实时进行转换,得到与交互语音数据对应的转换语音数据;将转换语音数据推送至所述客户端。本发明的虚拟音色转换方法能够保留说话人的语速语调语音内容,对于实时对话场景仅进行音色迁移,不需将语音转成文本,再将文本转换为语音,缩短了转换时长且提升响应速度;将人工客服和AI外呼机器人音色统一,做到无感人机切换,大大提升客户体验。
  • 一种虚拟音色转换方法装置系统存储介质
  • [发明专利]音色模板定制方法及其装置、设备、介质、产品-CN202111092287.1有效
  • 黄杰雄 - 广州酷狗计算机科技有限公司
  • 2021-09-17 - 2023-09-22 - G10L25/24
  • 本申请公开音色模板定制方法及其装置、设备、介质、产品,所述方法包括:获取音频采样数据,从中提取出人声发音部分相对应的梅尔频谱信息;调用预训练至收敛状态的音色提取模型从所述梅尔频谱信息中提取出表征该音频采样数据的音源对象的音色的向量矩阵集,该向量矩阵集包括时域上的多个向量矩阵;求取所述向量矩阵集中多个向量矩阵之间的均值向量矩阵作为该音源对象的声纹特征信息;生成所述音源对象相对应的音色模板,所述音色模板包括音源对象的命名标识及由该命名标识所指向的所述声纹特征信息。本申请能够从音频数据中有效地综合并抽象出表征音源对象的音色的声纹特征信息,有助于辅助音乐创作。
  • 音色模板定制方法及其装置设备介质产品
  • [发明专利]一种音频文件的声场分析方法及装置-CN202210879403.2有效
  • 夏妍;林锋 - 镁佳(北京)科技有限公司
  • 2022-07-25 - 2023-09-19 - G10L25/24
  • 本发明提供了一种音频文件的声场分析方法及装置,其中,音频文件的声场分析方法包括:获取待识别音频文件;将待识别音频文件划分为若干音频数据,并对每一音频数据进行合成器含量计算,得到合成器含量计算结果;对待识别音频文件进行伴奏人声比计算,得到伴奏人声比计算结果;判断合成器含量计算结果是否满足合成器含量阈值,以及伴奏人声比计算结果是否满足伴奏人声比阈值;当合成器含量计算结果、伴奏人声比计算结果分别满足各自阈值时,判定待识别音频文件的声场属性为声场窄。在准确计算得到合成器含量以及伴奏人声比的同时,还可以将音频文件的空间感进行有效表征,进而通过音频文件的内在属性对音频文件的调节进行准确指导。
  • 一种音频文件声场分析方法装置
  • [发明专利]音频生成方法、声码器、电子设备及存储介质-CN202310923000.8在审
  • 张斌 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2023-07-25 - 2023-09-05 - G10L25/24
  • 本申请公开一种音频生成方法、声码器、电子设备及存储介质。音频生成方法由神经网络型声码器实施,该音频生成方法包括:获取待生成音频的梅尔谱图;将所述梅尔谱图输入神经网络型声码器,其中所述神经网络型声码器包括基频提取模块、波发生模块和生成器网络模块;由所述基频提取模块从所述梅尔谱图中提取多个音频帧的基频音调值,由所述波发生模块将多个所述基频音调值对应的周期性波信号进行融合得到融合声源信号,由所述生成器网络模块利用融合声源信号和梅尔谱图生成目标音频。根据本申请实施例,能够提高音频音质和自然度。
  • 音频生成方法声码电子设备存储介质
  • [发明专利]性别识别模型处理方法、装置、计算机设备及存储介质-CN202310368697.7在审
  • 陶民泽 - 平安健康保险股份有限公司
  • 2023-04-06 - 2023-08-22 - G10L25/24
  • 本申请实施例属于人工智能领域,涉及一种性别识别模型处理方法、装置、计算机设备及存储介质,方法包括:获取带有性别标签的训练语音,获取其基频参数和梅尔频率复合特征,梅尔频率复合特征包括梅尔频率倒谱系数及其对应的一阶差分参数和二阶差分参数;将基频参数和梅尔频率复合特征输入初始性别识别模型,得到预测性别;基于基频参数确定假设性别,并根据性别标签、假设性别和预测性别所构成的性别组合类型计算模型损失,以根据模型损失调整模型,直至训练停止得到性别识别模型;将待识别用户的用户语音输入性别识别模型,得到性别识别结果。本申请还涉及区块链技术,训练语音可存储于区块链中本申请提高了性别识别的准确性。
  • 性别识别模型处理方法装置计算机设备存储介质
  • [发明专利]基于自注意力的音频美化方法、装置、设备及存储介质-CN202310614023.0在审
  • 张旭龙;王健宗;程宁;季圣鹏 - 平安科技(深圳)有限公司
  • 2023-05-26 - 2023-08-18 - G10L25/24
  • 本发明公开了一种基于自注意力的音频美化方法,该方法包括获取待处理音频;获取音频模型,对所有待处理音频进行内容提取,得到音频内容;对所有待处理音频进行音色提取,得到音频音色;对所有所述待处理音频进行能量提取,得到音频能量;将音频内容、音频音色和音频能量进行连接,得到音频特征;通过音频模型编码端对音频特征进行编码处理,得到编码特征;获取标准音频特征以及音频音高,通过音频模型解码端对标准音频特征、编码特征以及音频音高进行解码,得到美化音频。本发明通过在训练过程中采用训练加测试,使得整体的模型具有轻量化。通过引入位置嵌入和注意力机制,提高了模型的鲁棒性。引入能量特征并隐形表示,改善了音频质量。
  • 基于注意力音频美化方法装置设备存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top