专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果362750个,建议您升级VIP下载更多相关专利
  • [发明专利]基于生成对抗网络的短语音样本补偿方法及存储介质-CN201911067181.9在审
  • 胡章芳;付亚芹 - 重庆邮电大学
  • 2019-11-04 - 2020-12-25 - G10L15/06
  • 本发明请求保护一种基于生成对抗网络的短语音样本补偿方法及存储介质。该方法用于解决说话人识别系统中短语音情况造成的语料数据不充分,进而导致识别率严重降低的问题。它假设长语音分布中含有充分的区分说话人身份信息的特征,从长语音中提取能区分说话人身份的特征作为生成器G和判别器D的条件输入。把短语音作为生成器G的输入,生成器G试图在条件信息的辅助下把短语音补偿成接近真实长语音分布的样本,而鉴别器D试图确定给定的语音是真实的长语音样本还是由生成器补偿的伪语音。本发明完成了短语音样本到补偿语音样本的映射,在使补偿后的语音含有充分声学特征的同时还增加了训练样本的通用性和多样性,从而提高系统鲁棒性,降低说话人识别等错误率。
  • 基于生成对抗网络语音样本补偿方法存储介质
  • [发明专利]一种语音识别方法、装置、设备、存储介质及产品-CN202310218960.4在审
  • 徐延广;马东鹏;项伟 - 百果园技术(新加坡)有限公司
  • 2023-03-07 - 2023-06-06 - G10L15/06
  • 本申请实施例提供了一种语音识别方法、装置、设备、存储介质及产品。本申请实施例提供的技术方案通过利用语音识别模型对待处理语音信息进行分析处理,得到待处理语音信息的识别结果,该语音识别模型为基于过滤处理以及分布平衡处理后的无标注样本音频以及有标注样本音频进行半监督训练得到,语音识别模型,过滤处理以及分布平衡处理后的无标注样本音频分布情况更容易拟合正确标注的音频的分布情况,充分利用无标注音频样本进行语音识别模型的半监督训练,减少人工标注的人力和时间成本,减少大量的无标注样本音频对训练效率和语音识别模型识别准确度的影响,有效提升语音识别模型的训练效率以及语音识别效果。
  • 一种语音识别方法装置设备存储介质产品
  • [发明专利]一种基于语音提取的模型训练方法、装置及设备-CN202111032300.4在审
  • 尹首一;史慧宇;韩慧明;刘雷波;魏少军 - 清华大学
  • 2021-09-03 - 2021-12-07 - G10L15/06
  • 本说明书实施例提供一种基于语音提取的模型训练方法、装置及设备。所述方法包括:获取混合语音样本数据;所述混合语音样本数据为单通道语音信号;所述混合语音样本数据中包括噪声信号、干扰语音信号、混响信号中的至少一种和目标语音信号;构建初始语音提取模型;所述初始语音提取模型包括基于深度神经网络所构建的模型;将所述混合语音样本数据输入所述初始语音提取模型得到预测目标语音;基于所述预测目标语音和预设损失函数对所述初始语音提取模型进行优化,得到语音提取模型;所述语音提取模型用于对单通道语音信号中的目标语音信号进行提取上述方法准确有效地从单通道语音中进行了语音提取,满足了后续语音处理的相关需求。
  • 一种基于语音提取模型训练方法装置设备
  • [发明专利]一种基于人工智能的语音增强方法-CN202310934524.7有效
  • 黄碧娣 - 合肥朗永智能科技有限公司
  • 2023-07-28 - 2023-10-03 - G10L21/0232
  • 本发明涉及语音增强技术领域,公开了一种基于人工智能的语音增强方法,获取纯净语音样本和噪声语音样本,将纯净语音样本和噪声语音样本经过短时傅里叶变换分别得到纯净语音幅度谱和带噪语音幅度谱;分别对纯净语音幅度谱和带噪语音幅度谱进行第一特征提取,得到纯净语音特征和带噪语音特征;将纯净语音特征和带噪语音特征输入神经网络模型中进行训练,得到语音增强模型;获取含噪的待增强语音,对待增强语音进行第二特征提取,得到噪声测试集;将噪声测试集输入语音增强模型中,进行波形重构,并基于含噪的待增强语音的混合相位,得到目标增强语音;本发明达到降噪的效果,有效提升用户体验,同时提高了语音的可懂度及识别准确度。
  • 一种基于人工智能语音增强方法
  • [发明专利]声纹识别模型的训练及声纹识别方法、系统、设备和介质-CN202210633977.1在审
  • 任君;罗超;王清;邹宇 - 携程旅游信息技术(上海)有限公司
  • 2022-06-06 - 2022-07-29 - G10L17/02
  • 本发明公开了一种声纹识别模型的训练及声纹识别方法、系统、设备和介质,该训练方法包括获取若干样本语音,提取样本语音的每个语音帧对应的声学频谱特征,获取声学频谱特征对应的设定数量维度的目标帧特征,基于目标帧特征处理得到样本语音对应的目标语音特征,基于目标语音特征获取样本语音对应的声纹向量,将同一样本语音对应的声学频谱特征作为输入,对应的声纹向量作为输出,训练得到声纹识别模型;实现了有针对性的提取语音中的声纹信息,对语音中每个语音帧的各个维度进行评估,计算语音帧的维度权重,以选择出重要的声纹信息,减少了声纹识别模型的参数量和计算量,加快了模型的推理时间,提高了模型声纹信息的提取精度和准确率。
  • 声纹识别模型训练方法系统设备介质
  • [发明专利]虚拟语音的生成方法、装置、存储介质及电子装置-CN202211676955.X在审
  • 郁祖达;孙见青;梁家恩 - 云知声智能科技股份有限公司
  • 2022-12-26 - 2023-04-18 - G10L13/02
  • 本发明公开了一种虚拟语音的生成方法、装置、存储介质及电子装置。其中,该虚拟语音的生成方法包括:通过获取多个不同的语音文本样本语音属性信息,多个不同的语种语音文本样本中的每个语音文本样本对应一个语种,一个对象;将每个语音文本样本输入多流编码器中,得到每个语音文本样本对应的文本特征;通过文本特征以及语音特征训练基于生成式对抗网络建模的预设语音声学模型,得到生成虚拟语音的目标声学模型,即本发明可支持跨语种数据训练及跨语种发音人的生成,多流编码器能更好的捕捉不同语种中的文本特征,提升虚拟预设生成的灵活性以及可靠性,进而解决了现有技术中,生成虚拟语音的灵活性以及可靠性较低的技术问题。
  • 虚拟语音生成方法装置存储介质电子
  • [发明专利]一种去混响模型训练方法及装置-CN201910346319.2在审
  • 肖龙帅;杨占磊 - 华为技术有限公司
  • 2019-04-26 - 2020-10-30 - G10L15/06
  • 本申请公开了人工智能技术领域中的一种去混响模型训练方法及装置,其中去混响模型训练方法包括:将语音样本中的混响语音样本输入到第一去混响模型进行处理,得到所述混响语音样本对应的去混响语音;将所述混响语音样本对应的去混响语音输入到声学模型,得到所述声学模型输出的第一输出结果;将所述语音样本中的纯净语音样本输入到所述声学模型,得到所述声学模型输出的第二输出结果;计算所述第一输出结果和所述第二输出结果的误差,根据所述误差对所述第一去混响模型的参数进行调整用以避免对已有声学模型产生影响,提高训练得到的去混响模型与声学模型的匹配度,进而提高混响语音识别的准确性。
  • 一种混响模型训练方法装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top