专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果647420个,建议您升级VIP下载更多相关专利
  • [发明专利]语音合成模型训练方法、语音合成方法和装置-CN201911096995.5在审
  • 胡大盟 - 北京地平线机器人技术研发有限公司
  • 2019-11-11 - 2021-05-11 - G10L13/02
  • 本申请实施例公开了一种语音合成模型训练方法、语音合成方法、装置存储介质和电子设备,其中,语音合成模型训练方法包括:从音频库中提取音频文件的声学特征、音频波形点;对所述音频文件的所述音频波形点、所述音频文件上采样后的所述声学特征分别进行编码,并对编码后的所述音频文件的所述音频波形点、所述音频文件上采样后的所述声学特征进行拼接,得到拼接特征;将所述拼接特征输入到预设神经网络中进行训练;在训练过程中对所述预设神经网络中的网络参数进行迭代更新,在迭代终止后得到语音合成模型。采用语音合成模型训练方法训练得到的语音合成模型,其合成的语音发音更自然,与真实的人类语音更相近。
  • 语音合成模型训练方法装置
  • [发明专利]一种语音合成方法、计算机设备及可读存储介质-CN202211640789.8在审
  • 孟廷;方昕;吴明辉 - 科大讯飞股份有限公司
  • 2022-12-20 - 2023-04-28 - G10L13/02
  • 本申请提供语音合成方法、设备及存储介质,包括:接收云端的待合成文本以及所述待合成文本对应的第一音频流、音素信息,其中所述待合成文本包括若干字符,所述音素信息包括音素;基于第一音频流进行音频播放,并在接收异常时,确定当前播放的音素以及中断点音素;将待合成文本进行语音合成得到第二音频流,并确定目标音素,其中,所述目标音素为静音音素,且位置在所述当前播放的音素与所述中断点音素之间;以所述目标音素为拼接点,将所述第一音频流与所述第二音频流进行拼接得到目标音频流,并基于所述目标音频流进行音频播放。本申请旨在提高语音合成的连续性以及实现韵律的一致性。
  • 一种语音合成方法计算机设备可读存储介质
  • [发明专利]一种语音合成模型、模型的训练方法以及语音合成方法-CN202111165153.8在审
  • 司马华鹏;毛志强;田晓晖 - 宿迁硅基智能科技有限公司
  • 2021-09-30 - 2022-01-11 - G10L13/02
  • 本发明公开了一种语音合成模型、模型的训练方法以及语音合成方法,语音合成模型包括:嵌入模块、时长预测模块、能量预测模块、音高预测模块、情感强度预测模块、编码器、特征组合模块以及解码器。对该模型进行训练包括:获取多条情感音频以及与每条情感音频对应的文本;分析情感音频,提取情感音频对应的音素;获取情感音频的真实特征;将真实特征、情感音频对应的音素以及文本输入至初始化语音合成模型完成训练。通过训练完成的语音模型完成语音合成,包括:获取目标情感音频对应的音素以及目标文本;将目标情感音频对应的音素以及目标文本输入至语音合成模型中,得到目标声学特征;将目标声学特征还原成目标文本对应的音频
  • 一种语音合成模型训练方法以及
  • [发明专利]合成视频的方法和装置-CN201810427553.3有效
  • 梁衍鹏 - 广州酷狗计算机科技有限公司
  • 2018-05-07 - 2020-09-04 - H04N5/262
  • 本公开是关于一种合成视频的方法和装置,属于电子技术领域。所述方法包括:确定进行音频采集的音频单元时长;基于音频单元时长,确定采集到的每个音频单元对应的时间戳;基于采集到的每个音频单元对应的时间戳和采集到的每个图像单元对应的时间戳,对音频单元和图像单元进行合成,得到合成视频数据。采用本公开,在基于音频单元的时间戳和图像单元的时间戳,将音频单元和图像单元合成时,不会出现音频和图像不同步的现象。
  • 合成视频方法装置
  • [发明专利]虚假音频检测-CN202180080979.6在审
  • 乔尔·肖尔;阿兰纳·福斯特·斯洛克姆 - 谷歌有限责任公司
  • 2021-11-11 - 2023-08-04 - G10L25/30
  • 一种用于确定合成语音的方法(600)包括接收表征由用户设备(102)获得的流式音频(118)中的语音的音频数据(120)。该方法还包括使用经训练的自监督模型(210)生成多个音频特征向量(212),每个音频特征向量表示音频数据的一部分的音频特征。该方法还包括使用浅鉴别器模型(222)基于多个音频特征向量中的每个音频特征向量的对应音频特征,生成指示音频数据中合成语音的存在的得分(224)。该方法还包括确定得分是否满足合成语音检测阈值。当得分满足合成语音检测阈值时,该方法包括确定用户设备获得的音频数据中的语音包括合成语音。
  • 虚假音频检测
  • [实用新型]一种存储信息的可视对讲机-CN201720446679.6有效
  • 刘斌 - 广州联方信息技术有限公司
  • 2017-04-26 - 2018-01-30 - H04N7/18
  • 本实用新型提供了一种存储信息的可视对讲机,所述存储信息的可视对讲机包括控制模块、视频采集模块、音频采集模块、视频与音频合成校正模块、识别模块、存储模块、信号发射模块、信号接收模块、视频输出模块、音频输出模块;所述控制模块与视频采集模块、音频采集模块、视频与音频合成校正模块连接;所述视频采集模块与视频音频合成校正模块连接;所述音频采集模块和视频与音频合成校正模块连接;所述视频与音频合成校正模块与存储模块、识别模块、视频输出模块、音频输出模块连接;所述识别模块与存储模块连接;所述信号发射模块与存储模块连接;所述信号接收模块与存储模块连接;所述视频输出模块与存储模块连接;所述音频输出模块与存储模块连接。
  • 一种存储信息可视对讲机
  • [发明专利]视频合成方法、装置、终端及存储介质-CN201811392903.3有效
  • 郭劭泽 - 北京达佳互联信息技术有限公司
  • 2018-11-21 - 2020-06-09 - H04N21/845
  • 本公开是关于一种视频合成方法、装置、终端及存储介质,属于视频处理领域。所述方法包括:获取至少一个视频片段;根据所述至少一个视频片段的视频内容和片段数量,获取与所述视频内容适配的目标音频,所述目标音频音频变化点的数量大于或等于所述片段数量减一,所述音频变化点是指音频音频特征变化符合预设条件的时间点;根据所述目标音频中所包括的音频变化点,将所述至少一个视频片段与所述目标音频合成得到视频文件。本公开提供的这种将至少一个视频片段合成配有目标音频的视频合成方式,能够提高视频合成效率。
  • 视频合成方法装置终端存储介质
  • [发明专利]数据处理方法、装置及设备-CN202310651826.3在审
  • 顾艳梅;王志铭 - 支付宝(杭州)信息技术有限公司
  • 2023-06-02 - 2023-10-03 - G10L17/02
  • 本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:接收待检测的目标音频数据,通过预先训练的检测模型对目标音频数据进行频谱提取处理,得到与目标音频数据对应的目标频谱数据,并通过预先训练的检测模型对目标频谱数据进行音频合成处理,得到与目标音频数据对应的合成音频数据,通过预先训练的检测模型分别对目标音频数据和合成音频数据进行声纹提取处理,得到与目标音频数据对应的第一声纹特征向量,以及与合成音频数据对应的第二声纹特征向量,基于第一声纹特征向量和第二声纹特征向量之间的相似度,对目标音频数据为合成数据或非合成数据进行判断,得到针对目标音频数据的检测结果。
  • 数据处理方法装置设备
  • [实用新型]音频处理设备-CN201320800119.8有效
  • 陈殿玉;亢鹤凯;周东锋;袁玉强;袁文辉;穆攀;吴金峰 - 昆腾微电子股份有限公司
  • 2013-12-06 - 2014-07-02 - H04B1/20
  • 本实用新型涉及一种音频处理设备。所述音频处理设备包括:有线接收器,用于采用有线的方式接收第一音频信号;无线接收器,用于采用无线的方式接收第二音频信号;音频合成器,用于对所述第一音频信号和所述第二音频信号进行合成处理,得到第三音频信号;音频输出器,用于输出所述第三音频信号;所述有线接收器、所述无线接收器、所述音频合成器和所述音频输出器封装在一个壳体内。本实用新型可以将混音器与无线接收机合成在一个设备中,方便使用。
  • 音频处理设备
  • [发明专利]基于FPGA的音频处理器及音频处理方法-CN201910423748.5在审
  • 常锋;何斌;张延迟 - 北京中版超级立体信息科技有限公司
  • 2019-05-21 - 2020-11-24 - G06F3/16
  • 本发明涉及一种基于FPGA的音频处理器及音频处理方法,该音频处理器包括:音频输入模块,包括光纤输入端口、计算机输入端口和网络输入端口,分别用于接收相应通道的数字音频信号;音频选择模块,其对音频输入模块接收的音频信号进行选择并输出给下级模块;音效合成模块,其对音频选择模块输出的音频信号进行合成音频输出模块,其将音效合成模块合成音频信号进行输出。本发明利用现场可编程门阵列FPGA芯片进行音频处理,可接收多种渠道的数字音频信号,在传输高采样率、多通道数字音频信号时,保证传输的连续性及稳定性。
  • 基于fpga音频处理器处理方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top