专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果176个,建议您升级VIP下载更多相关专利
  • [发明专利]语音合成方法、装置、可读介质及电子设备-CN202010197182.1有效
  • 殷翔 - 北京字节跳动网络技术有限公司
  • 2020-03-19 - 2023-10-13 - G10L13/033
  • 本公开涉及一种语音合成方法、装置、可读介质及电子设备,包括获取用户输入的待处理声音和目标文本,声音片段含有噪声;从待处理声音中提取待处理频谱数据;根据待处理频谱数据和目标文本生成与待处理声音的音色和目标文本对应的目标频谱数据;根据目标频谱数据合成得到与目标文本对应的目标声音。这样,在用户输入的任意长度且含有噪声的声音片段的情况下也能处理得到清晰的发音,也即提高了对多种SNR信噪比(SIGNAL NOISE RATIO,SNR or S/N)环境下的语音合成的效果,无需用户在无噪声的环境下、按照限定的内容或长时间的语音输入,在保证语音合成效果的前提下大大简化了用户语音合成的复杂度。
  • 语音合成方法装置可读介质电子设备
  • [发明专利]一种标准发音的生成方法及系统-CN202310557452.9在审
  • 刘斌 - 齐鲁师范学院
  • 2023-05-17 - 2023-10-03 - G10L13/033
  • 本申请公开了一种标准发音的生成方法及系统,涉及音频生成的领域,尤其是涉及一种标准发音的生成方法及系统,其包括获取用户说话的语音内容信息、声音特征以及语音情绪信息;建立语言词典以及语言对应网;将获取的用户的语音内容信息进行断句和词语拆解,获取标准发音语句后进行输出;对获取的用户的声音特征进行分析,获取声音的响度特征、音调特征以及音色特征;对获取的用户的语音情绪信息进行分析获取用户的情绪标签,判断获取用户的言语情绪,判断获取用户的语气情绪;获取当前情境下包含用户情绪的具有用户声音特征的标准发音语句。本申请具有生成准确用户特征及情绪的标准发音,以提高不同区域间人员之间语言交流及情感交流的效率的效果。
  • 一种标准发音生成方法系统
  • [发明专利]音频数据的处理方法、装置及服务器-CN202210277099.4在审
  • 刘丽娟 - 北京金山云网络技术有限公司
  • 2022-03-21 - 2023-09-29 - G10L13/033
  • 本发明提供了一种音频数据的处理方法、装置及服务器,涉及音频处理的技术领域,该方法包括:获取待处理音频数据;基于待处理音频数据的音频特征截取待处理音频数据中所包含的至少一个有效音频片段;将至少一个有效音频片段进行合成处理,以得到待处理音频数据对应的有效音频数据。本发明提供的音频数据的处理方法、装置及服务器,根据待处理音频数据的音频特征去截取待处理音频数据中所包含的有效音频片段,这样可以有效切割掉无效的杂音、空频段等数据,使得最终合成处理后得到的有效音频数据包含的都是高质量的有效音频,不仅减少了存储空间,也相应地降低了存储成本,在一定程度上避免了资源浪费的问题。
  • 音频数据处理方法装置服务器
  • [发明专利]语音检测方法、装置、介质以及电子设备-CN202310701621.1在审
  • 王聪;邱楚寒;马泽君 - 北京有竹居网络技术有限公司
  • 2023-06-13 - 2023-09-26 - G10L13/033
  • 本公开涉及一种语音检测方法、装置、介质以及电子设备,涉及计算机技术领域,该方法通过确定待检测语音的基频曲线,根据基频曲线,确定与基频曲线相匹配的等响曲线,根据等响曲线,确定待检测语音对应的目标加权系数,根据待检测语音对应的原始响度参数以及目标加权系数,确定目标响度参数,根据目标响度参数以及预设响度阈值,确定待检测语音的响度检测结果,可以将待检测语音的原始响度参数转换为人耳听到的主观的目标响度参数,并根据目标响度参数以及预设响度阈值,确定响度检测结果,从而获得响度值适用于文本生成语音的应用场景的语音,使得基于文本生成的语音更加准确。
  • 语音检测方法装置介质以及电子设备
  • [发明专利]一种流式的小样本数据音色转换方法、系统-CN202310911244.4在审
  • 张涛;姜兴华;黄灏 - 杭州一知智能科技有限公司
  • 2023-07-24 - 2023-09-12 - G10L13/033
  • 本发明公开了一种流式的小样本数据音色转换方法、系统,属于语音合成技术领域。包括:收集不同说话人的音频数据样本;利用音频数据样本对基于声纹模型的音色转换网络进行预训练,所述的音色转换网络分别提取音频的语义特征和含音色信息的声纹特征,两者以相互独立的方式输入到声学模型中,将声纹特征中的音色信息逐步迁移至语义特征中,生成梅尔频谱图;采用目标说话人的音频数据微调音色转换网络,在所述的微调过程中,仅训练音色编码器参数,其余参数冻结;利用微调后的音色转换网络对音频进行目标说话人音色转换。本发明可以实现小样本数据音色转换,以微调方式降低过拟合程度,但不会降低生成音频的质量。
  • 一种样本数据音色转换方法系统
  • [发明专利]一种语音音色转换方法和系统-CN202310607980.0在审
  • 李雅;韩易辰;高迎明 - 北京邮电大学
  • 2023-05-26 - 2023-09-12 - G10L13/033
  • 本发明提供一种语音音色转换方法和系统,所述方法包括:输入一对训练语音至初始网络模型。利用长短时记忆网络和残差向量量化提取参考音频的音色特征,利用内容向量提取模型去除样本语音的音色,利用基频编码器提取基频特征,利用文本编码器提取样本语音的文本特征。将音色特征、基频特征和文本特征输入先验编码器,将样本语音的线性谱输入后验编码器,利用Flow模型对齐先验编码器和后验编码器的输出,计算概率分布距离作为损失函数,最小化损失以优化各模型的参数。将待转换语音输入训练好的模型中,模型通过声码器输出音色转换后的语音。该方法改进了现有技术中音色未完全转换、生成音色过于机械的问题,可以对任意说话人的音色建模,适用性更广。
  • 一种语音音色转换方法系统
  • [发明专利]一种采用AI拟声的IP广播系统-CN202310928552.8在审
  • 林弟;明德;朱正辉;黄小强 - 广东保伦电子股份有限公司
  • 2023-07-27 - 2023-08-25 - G10L13/033
  • 本发明涉及AI拟声技术领域,尤其涉及一种采用AI拟声的IP广播系统,包括:例句生成模块、声音采集模块、语音合成模块、用以在声音采集模块获取到新注册的用户的原始语音时,语音合成模块根据新注册的用户朗读的若干例句的原始语音生成一针对新注册的用户朗读的例句的拟声语音,以根据单个拟声语音和与单个拟声语音匹配的原始语音的比对结果对生成的拟声语音是否符合预设标准进行判定,判定语音合成模块将新生成的例句逐个合成为拟声语音并分别新生成的各拟声语音进行评级,以根据评级结果判定是否对针对新注册的用户生成的拟声语音的音量或语速进行调节的判定模块,以及,调节模块,有效提高了拟声语音的准确性和与用户的相似性。
  • 一种采用aiip广播系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top