“合成音频”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网_专利查询网

首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

专利名称

专利名称
专利号码
专利分类
申请人
公布日期

农业化学；冶金建筑机械工程区域搜索

主分类

B 作业；运输

C 化学；冶金

D 纺织；造纸

E 固定建筑物

F 机械工程、照明、加热

专利下载VIP

公布日期

2023-10-24 公布专利

2023-10-20 公布专利

2023-10-17 公布专利

2023-10-13 公布专利

2023-10-10 公布专利

2023-10-03 公布专利

2023-09-29 公布专利

2023-09-26 公布专利

2023-09-22 公布专利

2023-09-19 公布专利

专利权人

国家电网公司

华为技术有限公司

中兴通讯股份有限公司

三星电子株式会社

中国石油化工股份有限公司

鸿海精密工业股份有限公司

松下电器产业株式会社

上海交通大学

钻瓜专利网为您找到相关结果647420个，建议您升级VIP下载更多相关专利

[发明专利]语音合成模型训练方法、语音合成方法和装置-CN201911096995.5在审
发明人：胡大盟 -专利权人：北京地平线机器人技术研发有限公司
申请日： 2019-11-11 - 公布日： 2021-05-11 - 主分类号： G10L13/02 文献下载
摘要：本申请实施例公开了一种语音合成模型训练方法、语音合成方法、装置存储介质和电子设备，其中，语音合成模型训练方法包括：从音频库中提取音频文件的声学特征、音频波形点；对所述音频文件的所述音频波形点、所述音频文件上采样后的所述声学特征分别进行编码，并对编码后的所述音频文件的所述音频波形点、所述音频文件上采样后的所述声学特征进行拼接，得到拼接特征；将所述拼接特征输入到预设神经网络中进行训练；在训练过程中对所述预设神经网络中的网络参数进行迭代更新，在迭代终止后得到语音合成模型。采用语音合成模型训练方法训练得到的语音合成模型，其合成的语音发音更自然，与真实的人类语音更相近。
语音合成模型训练方法装置

[发明专利]一种语音合成方法、计算机设备及可读存储介质-CN202211640789.8在审
发明人：孟廷;方昕;吴明辉 -专利权人：科大讯飞股份有限公司
申请日： 2022-12-20 - 公布日： 2023-04-28 - 主分类号： G10L13/02 文献下载
摘要：本申请提供语音合成方法、设备及存储介质，包括：接收云端的待合成文本以及所述待合成文本对应的第一音频流、音素信息，其中所述待合成文本包括若干字符，所述音素信息包括音素；基于第一音频流进行音频播放，并在接收异常时，确定当前播放的音素以及中断点音素；将待合成文本进行语音合成得到第二音频流，并确定目标音素，其中，所述目标音素为静音音素，且位置在所述当前播放的音素与所述中断点音素之间；以所述目标音素为拼接点，将所述第一音频流与所述第二音频流进行拼接得到目标音频流，并基于所述目标音频流进行音频播放。本申请旨在提高语音合成的连续性以及实现韵律的一致性。
一种语音合成方法计算机设备可读存储介质

[发明专利]文本到语音的转换处理方法、装置及电子设备-CN202010106336.1在审
发明人：杜慷;陈孝良;冯大航 -专利权人：北京声智科技有限公司
申请日： 2020-02-21 - 公布日： 2020-06-19 - 主分类号： G10L13/08 文献下载
摘要：其中方法包括：获取待转换的目标文本；将目标文本输入端对端从文本到语音系统，获得初始合成音频；利用预设的纠错模型，查找初始合成音频中的错误字段；对初始合成音频中的错误字段进行修复，得到可用合成音频；将可用合成音频作为目标文本转换得到的音频输出通过本公开的方案，在音频合成模型后新增一个纠错过程，对合成音频进行评估、定位和纠错，将错误句子中的错误字替换为新的备选字，并在语音数据库中找到替换字的波形信息与原句拼接，从而得到新的、完整的无错漏字的语音合成语句
文本语音转换处理方法装置电子设备

[发明专利]一种语音合成模型、模型的训练方法以及语音合成方法-CN202111165153.8在审
发明人：司马华鹏;毛志强;田晓晖 -专利权人：宿迁硅基智能科技有限公司
申请日： 2021-09-30 - 公布日： 2022-01-11 - 主分类号： G10L13/02 文献下载
摘要：本发明公开了一种语音合成模型、模型的训练方法以及语音合成方法，语音合成模型包括：嵌入模块、时长预测模块、能量预测模块、音高预测模块、情感强度预测模块、编码器、特征组合模块以及解码器。对该模型进行训练包括：获取多条情感音频以及与每条情感音频对应的文本；分析情感音频，提取情感音频对应的音素；获取情感音频的真实特征；将真实特征、情感音频对应的音素以及文本输入至初始化语音合成模型完成训练。通过训练完成的语音模型完成语音合成，包括：获取目标情感音频对应的音素以及目标文本；将目标情感音频对应的音素以及目标文本输入至语音合成模型中，得到目标声学特征；将目标声学特征还原成目标文本对应的音频。
一种语音合成模型训练方法以及

[发明专利]合成视频的方法和装置-CN201810427553.3有效
发明人：梁衍鹏 -专利权人：广州酷狗计算机科技有限公司
申请日： 2018-05-07 - 公布日： 2020-09-04 - 主分类号： H04N5/262 文献下载
摘要：本公开是关于一种合成视频的方法和装置，属于电子技术领域。所述方法包括：确定进行音频采集的音频单元时长；基于音频单元时长，确定采集到的每个音频单元对应的时间戳；基于采集到的每个音频单元对应的时间戳和采集到的每个图像单元对应的时间戳，对音频单元和图像单元进行合成，得到合成视频数据。采用本公开，在基于音频单元的时间戳和图像单元的时间戳，将音频单元和图像单元合成时，不会出现音频和图像不同步的现象。
合成视频方法装置

[发明专利]音频合成方法、装置、计算机设备和存储介质-CN201910580115.5有效
发明人：张可一鸣 -专利权人：上海元笛软件有限公司
申请日： 2019-06-28 - 公布日： 2022-07-08 - 主分类号： G10L19/02 文献下载
摘要：本申请涉及一种音频合成方法、装置、计算机设备和存储介质。所述方法包括：获取初始音频；识别初始音频中的节奏点，根据节奏点在初始音频中标注音效区域；获取与音效区域对应的音效音频，将音效音频中的音效合成到初始音频中的音效区域，得到合成音频。
音频合成方法装置计算机设备存储介质

[发明专利]虚假音频检测-CN202180080979.6在审
发明人：乔尔·肖尔;阿兰纳·福斯特·斯洛克姆 -专利权人：谷歌有限责任公司
申请日： 2021-11-11 - 公布日： 2023-08-04 - 主分类号： G10L25/30 文献下载
摘要：一种用于确定合成语音的方法(600)包括接收表征由用户设备(102)获得的流式音频(118)中的语音的音频数据(120)。该方法还包括使用经训练的自监督模型(210)生成多个音频特征向量(212)，每个音频特征向量表示音频数据的一部分的音频特征。该方法还包括使用浅鉴别器模型(222)基于多个音频特征向量中的每个音频特征向量的对应音频特征，生成指示音频数据中合成语音的存在的得分(224)。该方法还包括确定得分是否满足合成语音检测阈值。当得分满足合成语音检测阈值时，该方法包括确定用户设备获得的音频数据中的语音包括合成语音。
虚假音频检测

[实用新型]一种存储信息的可视对讲机-CN201720446679.6有效
发明人：刘斌 -专利权人：广州联方信息技术有限公司
申请日： 2017-04-26 - 公布日： 2018-01-30 - 主分类号： H04N7/18 文献下载
摘要：本实用新型提供了一种存储信息的可视对讲机，所述存储信息的可视对讲机包括控制模块、视频采集模块、音频采集模块、视频与音频合成校正模块、识别模块、存储模块、信号发射模块、信号接收模块、视频输出模块、音频输出模块；所述控制模块与视频采集模块、音频采集模块、视频与音频合成校正模块连接；所述视频采集模块与视频音频合成校正模块连接；所述音频采集模块和视频与音频合成校正模块连接；所述视频与音频合成校正模块与存储模块、识别模块、视频输出模块、音频输出模块连接；所述识别模块与存储模块连接；所述信号发射模块与存储模块连接；所述信号接收模块与存储模块连接；所述视频输出模块与存储模块连接；所述音频输出模块与存储模块连接。
一种存储信息可视对讲机

[发明专利]视频合成方法、装置、终端及存储介质-CN201811392903.3有效
发明人：郭劭泽 -专利权人：北京达佳互联信息技术有限公司
申请日： 2018-11-21 - 公布日： 2020-06-09 - 主分类号： H04N21/845 文献下载
摘要：本公开是关于一种视频合成方法、装置、终端及存储介质，属于视频处理领域。所述方法包括：获取至少一个视频片段；根据所述至少一个视频片段的视频内容和片段数量，获取与所述视频内容适配的目标音频，所述目标音频的音频变化点的数量大于或等于所述片段数量减一，所述音频变化点是指音频中音频特征变化符合预设条件的时间点；根据所述目标音频中所包括的音频变化点，将所述至少一个视频片段与所述目标音频合成得到视频文件。本公开提供的这种将至少一个视频片段合成配有目标音频的视频合成方式，能够提高视频合成效率。
视频合成方法装置终端存储介质

[发明专利]数据处理方法、装置及设备-CN202310651826.3在审
发明人：顾艳梅;王志铭 -专利权人：支付宝（杭州）信息技术有限公司
申请日： 2023-06-02 - 公布日： 2023-10-03 - 主分类号： G10L17/02 文献下载
摘要：本说明书实施例提供了一种数据处理方法、装置及设备，其中，该方法包括：接收待检测的目标音频数据，通过预先训练的检测模型对目标音频数据进行频谱提取处理，得到与目标音频数据对应的目标频谱数据，并通过预先训练的检测模型对目标频谱数据进行音频合成处理，得到与目标音频数据对应的合成音频数据，通过预先训练的检测模型分别对目标音频数据和合成音频数据进行声纹提取处理，得到与目标音频数据对应的第一声纹特征向量，以及与合成音频数据对应的第二声纹特征向量，基于第一声纹特征向量和第二声纹特征向量之间的相似度，对目标音频数据为合成数据或非合成数据进行判断，得到针对目标音频数据的检测结果。
数据处理方法装置设备

[发明专利]语音合成方法、装置、电子设备和存储介质-CN202210749829.6在审
发明人：贺来朋;周鸿斌;叶剑豪;吕翔;印晶晶;汤宗锦;浦晟骄;赵光程;卢恒 -专利权人：上海喜马拉雅科技有限公司
申请日： 2022-06-28 - 公布日： 2022-10-11 - 主分类号： G10L13/02 文献下载
摘要：本发明涉及语音处理技术领域，提供一种语音合成方法、装置、电子设备和存储介质。电子设备预存有用户的标识及其对应的音色特征和预设转换模型；获取用户输入的待合成文本和用户的标识，并基于用户的标识获取对应的音色特征和预设转换模型；然后利用预设合成模型对待合成文本进行语音合成，得到待转换音频；再利用预设转换模型基于音色特征对待转换音频进行音色转换，得到符合用户音色的音频。通过预设合成模型得到包含文本内容的音频，并通过预设转换模型将该音频进行音色转换得到包含文本内容且符合用户音色的音频。从而提升了合成效果和音频质量。
语音合成方法装置电子设备存储介质

[发明专利]一种语音风格迁移方法、装置、电子设备及存储介质-CN202111262784.1在审
发明人：赵情恩 -专利权人：北京百度网讯科技有限公司
申请日： 2021-10-28 - 公布日： 2022-01-21 - 主分类号： G10L13/02 文献下载
摘要：具体实现方案为：提取待迁移的目标音频的声谱特征和音素时长特征，对待合成音素序列进行内容特征提取和音素时长预测，得到各待合成音素的内容特征和预测基本时长，基于目标音频的音素时长特征调整待合成音素的预测基本时长，得到待合成音素的目标时长，基于目标音频的声谱特征、各待合成音素的内容特征和目标时长，得到具有目标音频风格的目标声谱，并对其进行音频转换，得到合成音频。应用本公开，使得音频迁移效果更好，提高了音频迁移准确度。
一种语音风格迁移方法装置电子设备存储介质

[实用新型]音频处理设备-CN201320800119.8有效
发明人：陈殿玉;亢鹤凯;周东锋;袁玉强;袁文辉;穆攀;吴金峰 -专利权人：昆腾微电子股份有限公司
申请日： 2013-12-06 - 公布日： 2014-07-02 - 主分类号： H04B1/20 文献下载
摘要：本实用新型涉及一种音频处理设备。所述音频处理设备包括：有线接收器，用于采用有线的方式接收第一音频信号；无线接收器，用于采用无线的方式接收第二音频信号；音频合成器，用于对所述第一音频信号和所述第二音频信号进行合成处理，得到第三音频信号；音频输出器，用于输出所述第三音频信号；所述有线接收器、所述无线接收器、所述音频合成器和所述音频输出器封装在一个壳体内。本实用新型可以将混音器与无线接收机合成在一个设备中，方便使用。
音频处理设备

[发明专利]语音合成模型的确定方法、装置、设备和存储介质-CN202110831297.6有效
发明人：陆嘉盛;高正坤;孙晨曦;孙涛 -专利权人：北京百度网讯科技有限公司
申请日： 2021-07-22 - 公布日： 2022-05-27 - 主分类号： G10L13/047 文献下载
摘要：本公开提供了一种语音合成模型的确定方法、装置、设备和存储介质，涉及计算机技术领域，具体涉及语音合成、深度学习等人工智能领域。语音合成模型的确定方法包括：基于待采用语音合成模型，对文本进行处理，以获得所述文本对应的音频；若所述音频的音频指标不符合预设标准，更新所述待采用语音合成模型，直至所述音频指标符合所述预设标准；基于所述音频指标符合所述预设标准时的待采用语音合成模型，确定最终语音合成模型。本公开可以提高语音合成模型的确定速度。
语音合成模型确定方法装置设备存储介质

[发明专利]基于FPGA的音频处理器及音频处理方法-CN201910423748.5在审
发明人：常锋;何斌;张延迟 -专利权人：北京中版超级立体信息科技有限公司
申请日： 2019-05-21 - 公布日： 2020-11-24 - 主分类号： G06F3/16 文献下载
摘要：本发明涉及一种基于FPGA的音频处理器及音频处理方法，该音频处理器包括：音频输入模块，包括光纤输入端口、计算机输入端口和网络输入端口，分别用于接收相应通道的数字音频信号；音频选择模块，其对音频输入模块接收的音频信号进行选择并输出给下级模块；音效合成模块，其对音频选择模块输出的音频信号进行合成；音频输出模块，其将音效合成模块合成的音频信号进行输出。本发明利用现场可编程门阵列FPGA芯片进行音频处理，可接收多种渠道的数字音频信号，在传输高采样率、多通道数字音频信号时，保证传输的连续性及稳定性。
基于 fpga 音频处理器处理方法

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：76009968。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

400-8765-105周一至周五 9:00-18:00

版权所有钻瓜科技（天津）有限公司津ICP备15000985号津公网安备 12019202000206号http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top