专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果189626个,建议您升级VIP下载更多相关专利
  • [发明专利]语音转换方法、装置和电子设备-CN202011025400.X在审
  • 王锡磊;王文富;孙涛 - 北京百度网讯科技有限公司
  • 2020-09-25 - 2021-01-22 - G10L13/02
  • 本申请公开了语音转换方法、装置和电子设备,涉及语音转换、语音交互、自然语言处理、深度学习技术领域。具体实现方案为:获取第一用户的源语音和第二用户的参照语音;从源语音中提取出第一语音内容信息和第一声学特征;从参照语音中提取出第二声学特征;将第一语音内容信息、第一声学特征和第二声学特征输入至预先训练好的语音转换模型中,得到重构的第三声学特征,预先训练好的语音转换模型根据第三用户的语音训练得到;以及根据第三声学特征合成目标语音。该方法将源语音的第一语音内容信息和第一声学特征、参照语音的第二声学特征输入至预先训练好的语音转换模型中,得到并根据重构的第三声学特征合成目标语音,可缩短语音转换的等待时间。
  • 语音转换方法装置电子设备
  • [发明专利]语音识别方法和装置-CN201910054959.6在审
  • 张仕良;雷鸣 - 阿里巴巴集团控股有限公司
  • 2019-01-21 - 2020-07-28 - G10L15/02
  • 本申请公开了语音识别方法和装置。其中,语音识别方法包括:通过获取待识别的语音数据、及与语音数据对应的图像数据;通过声学特征提取子网络,提取语音数据的声学特征;以及,通过视觉特征提取子网络,从图像数据中提取与语音数据对应的视觉特征;通过声学得分预测子网络,至少根据声学特征和视觉特征,获取语音数据的声学得分;根据声学得分,确定与语音数据对应的文本序列。采用这种处理方式,使得既区分音频和视频在语音识别中的权重,又融合两种模态特征进行声学建模;因此,可以有效提升声学建模的性能及鲁棒性,从而提升语音识别性能及鲁棒性。
  • 语音识别方法装置
  • [发明专利]个性化多声学模型的训练方法、语音合成方法及装置-CN201510684475.1有效
  • 李秀林 - 百度在线网络技术(北京)有限公司
  • 2015-10-20 - 2015-12-23 - G10L13/02
  • 本发明公开了一种用于语音合成的个性化多声学模型的训练方法、语音合成方法及装置,其中,该方法包括:基于训练语音数据的第一声学特征数据和与训练语音数据对应的第一文本标注数据,训练基准声学模型;获取目标用户的语音数据;根据基准声学模型和语音数据,训练第一目标用户声学模型;根据第一目标用户声学模型和第一文本标注数据生成第一文本标注数据的第二声学特征数据;以及基于第一文本标注数据和第二声学特征数据,训练第二目标用户声学模型该实施例的模型训练方法,在训练目标用户声学模型过程中,降低了对目标用户的语音数据的规模的要求,利用少量的用户语音数据就可训练出多个包含目标用户的语音特点的个性化声学模型。
  • 个性化声学模型训练方法语音合成装置
  • [发明专利]声学模型的训练、语音处理方法、装置、设备及存储介质-CN202110946708.6在审
  • 王锡磊 - 北京百度网讯科技有限公司
  • 2021-08-18 - 2021-11-16 - G10L13/047
  • 本公开提供了声学模型的训练、语音处理方法、装置、设备及存储介质,涉及人工智能中的深度学习和语音技术领域。具体实现方案为:获取样本文本和所述样本文本对应的样本语音,所述样本语音中包括多个语音片段,所述样本语音为目标用户的语音;根据所述样本语音,确定所述样本语音语音片段的语音质量;通过待处理的声学模型对所述样本文本进行语音合成处理得到预测语音;根据所述样本语音、所述预测语音、以及所述样本语音语音片段的语音质量,更新所述声学模型的模型参数,所述声学模型为所述目标用户对应的声学模型。通过上述过程,保证了训练后的声学模型的语音合成质量较高。
  • 声学模型训练语音处理方法装置设备存储介质
  • [发明专利]高表现力的语音合成方法和装置-CN201410645715.2有效
  • 李秀林;贾磊;康永国 - 百度在线网络技术(北京)有限公司
  • 2014-11-12 - 2017-10-13 - G10L13/027
  • 本发明实施例公开了一种高表现力的语音合成方法和装置。所述高表现力的语音合成方法包括将输入文本进行处理分析,得到所述输入文本对应的音子序列以及所述音子序列中音子包含的状态的上下文;根据所述状态的上下文,基于维特比算法从所述状态对应的包含至少两个高斯声学模型的高斯混合声学模型中选择一个高斯声学模型,作为合成语音的高斯声学模型;根据所选择的高斯声学模型生成声学参数,并根据生成的声学参数合成语音,包括利用声码器将声学参数来合成语音或者用声学参数指导声学片段的单元挑选来生成语音。本发明实施例提供的高表现力的语音合成方法和装置提高了合成语音的自然度。
  • 表现力语音合成方法装置
  • [发明专利]语音识别方法和装置、存储介质及电子设备-CN202211676144.X在审
  • 邵琪杰;颜京豪;谢磊 - 腾讯科技(深圳)有限公司
  • 2022-12-26 - 2023-10-27 - G10L15/00
  • 本申请公开了一种语音识别方法和装置、存储介质及电子设备。其中,该方法包括:获取待识别语音的文本内容声学向量和口音声学向量,其中,文本内容声学向量包括待识别语音中的T帧语音的文本内容声学特征,口音声学向量包括待识别语音中的T帧语音的口音声学特征;将文本内容声学向量输入第一解码器,得到目标对齐文本向量;将口音声学向量和目标对齐文本向量输入口音分类器,得到待识别语音的口音分类向量;将口音分类向量和文本内容声学向量进行拼接,得到目标拼接表征向量;通过第二解码器,根据目标拼接表征向量,确定从待识别语音中识别到的目标文本内容。本申请解决了相关技术中语音识别的准确率较低的技术问题。
  • 语音识别方法装置存储介质电子设备
  • [发明专利]一种语音识别方法、声学模型的训练方法、装置及设备-CN202210006570.6在审
  • 李思琪;付立 - 京东科技信息技术有限公司
  • 2022-01-04 - 2023-07-14 - G10L15/02
  • 本申请提供一种语音识别方法、声学模型的训练方法、装置及设备。该语音识别方法包括:接收语音识别请求,语音识别请求包括目标语种的待识别语音;对待识别语音提取语音特征并输入第一声学模型,得到声学特征,声学特征包括待识别语音的可能性字符,第一声学模型是根据第一语音样本和第二语音样本,基于神经网络进行训练得到的用于识别语音数据中目标语种的可能性字符的模型,第一语音样本包括人工标定的多个语音样本和对应的目标语种的字符,第二语音样本包括采用第一语音样本训练的第二声学模型标定的多个语音样本和对应的目标语种的字符;根据声学特征确定目标语种的语音识别结果并输出。本申请的方法提高了目标语种的语音识别准确度。
  • 一种语音识别方法声学模型训练装置设备
  • [发明专利]维语语音识别方法和装置-CN201510662027.1有效
  • 王东;殷实;赵梦原;张之勇;张雪薇 - 清华大学
  • 2015-10-14 - 2018-12-28 - G10L15/00
  • 本申请提供了一种维语语音识别的方法和装置,包括:将维语语音帧对应的声学特征作为自适应声学模型中的汉语声学模型的参数输入,经过线性变换和非线性变换将所述汉语声学模型下的维语语音帧对应的声学特征变换到汉语声学模型的高维非线性特征空间分布;将所述维语语音帧对应的汉语声学模型的高维非线性特征空间分布作为自适应声学模型中的维语声学模型的参数输入到所述维语声学模型中,训练所述维语声学模型,获得重构的自适应声学模型;使用遗传算法或者穷举算法筛选所述重构的自适应声学模型,获得最优自适应声学模型;使用所述最优自适应声学模型进行维语语音的识别,从而解决了维语语料不足和语音识别准确率低的问题。
  • 语音识别方法装置
  • [发明专利]语音转换方法、系统、装置及存储介质-CN201980003189.0有效
  • 王若童;汤志超;黄东延;谢杰斌;赵之源;刘洋;熊友军 - 深圳市优必选科技股份有限公司
  • 2019-12-24 - 2023-05-23 - G10L21/013
  • 本申请公开了一种语音转换方法,所述方法包括:获取待转换语音,提取所述待转换语音声学特征;从源向量池中获取与所述待转换语音对应的源向量,从目标向量池中选取目标语音对应的目标向量;将所述待转换语音声学特征、所述待转换语音对应的源向量和所述目标语音对应的目标向量作为语音转换模型的输入,获取所述语音转换模型输出的目标语音声学特征;采用声码器对所述目标语音声学特征进行转换得到目标语音。通过语音转换模型得到目标语音声学特征,再对目标语音声学特征进行转换得到目标语音,使得单个语音转换模型能够进行多对多的语音转换,同时可以解决因存放模型而产生额外成本的问题。此外,还提出了一种语音转换系统、装置及存储介质。
  • 语音转换方法系统装置存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top