专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果78个,建议您升级VIP下载更多相关专利
  • [发明专利]语音识别方法、系统、设备和介质-CN201811068321.X有效
  • 张仕良;雷鸣 - 阿里巴巴集团控股有限公司
  • 2018-09-13 - 2023-10-27 - G10L15/08
  • 一种语音识别方法、系统、设备和介质,包括:提取接收到的语音信号的声学特征;将所述语音信号的声学特征输入至语音识别模型组件,以便所述语音识别模型组件对所述语音信号进行识别处理;获取所述语音识别模型组件输出的、所述语音信号对应的语音序列;其中,所述语音识别模型组件是基于多个前馈神经网络模块构建、并通过时序分类优化函数形成的损失函数进行模型训练而生成的模型组件。采用本发明实施例后,能够提高声学模型语音识别的实时性。
  • 语音识别方法系统设备介质
  • [发明专利]语音识别方法、设备和存储介质-CN202310680032.X在审
  • 史莫晗;杜志浩;陈谦;俞帆;张仕良;李泱泽;张结;戴礼荣 - 阿里巴巴(中国)有限公司
  • 2023-06-08 - 2023-09-29 - G10L15/20
  • 本申请提供一种语音识别方法、设备和存储介质,方法包括:通过语音识别编码器获取语音信号对应的第一向量表示,通过说话者编码器获取语音信号对应的第二向量表示,通过文本编码器对语音识别解码器已经输出的前n‑1个字进行编码处理,得到第n‑1个字对应的第三向量表示。将第一向量表示、第二向量表示和第三向量表示输入说话者解码器中,获得第n个字对应的说话者向量表示,根据该说话者向量表示分别与多个说话者的画像特征向量之间的相关性系数,确定第n个字对应的说话者。将第一向量表示、前n‑1个字以及相关性系数对多个说话者的画像特征向量的加权和,输入语音识别解码器,获得第n个字,提高了各个字对应的说话者识别结果的准确性。
  • 语音识别方法设备存储介质
  • [发明专利]语音识别方法及装置-CN201811102464.8有效
  • 张仕良;雷鸣;刘媛;李威 - 阿里巴巴集团控股有限公司
  • 2018-09-20 - 2023-09-12 - G10L15/02
  • 本发明公开了一种语音识别方法及装置。其中,该方法包括:获取待识别语音;对待识别语音进行特征提取,得到待识别语音对应的声学特征;通过解码器中的语言模型和声学模型对声学特征进行解码,识别出待识别语音对应的文字序列,其中,声学模型采用的建模单元是基于字符和音节构建的,语言模型用于表征文字序列发生的概率。本发明解决了相关技术中采用声韵母作为中文语音识别系统声学模型的建模单元,导致识别出的汉字存在大量错误的技术问题。
  • 语音识别方法装置
  • [发明专利]流式语音识别的方法、训练语音识别模型的方法及装置-CN202310594605.7在审
  • 舒钰淳;罗浩能;张仕良 - 阿里巴巴(中国)有限公司
  • 2023-05-22 - 2023-08-29 - G10L15/26
  • 本申请实施例公开了一种流式语音识别的方法、训练语音识别模型的方法及装置。其中方法包括:获取语音音频流;将利用第一时长单元对语音音频流进行分块得到的连续第一音频分块输入第一语音识别模型,得到各第一音频分块的识别结果用以展示;获取对语音音频流进行编码得到的各帧的隐向量,利用隐向量预测语音音频流对应的第一序列,第一序列包含语音音频流中各帧的权重值;利用第一序列对语音音频流进行切分得到连续的第二音频分块;将连续的第二音频分块输入第二语音识别模型,得到各第二音频分块的识别结果,利用各第二音频分块的识别结果更新已展示的对应第一音频分块的识别结果。本申请改善了实时语音识别的显示效果,提升用户体验。
  • 语音识别方法训练模型装置
  • [发明专利]语音识别模型训练及语音识别方法、设备和存储介质-CN202310640179.6在审
  • 安柯宇;石宪;张仕良 - 阿里巴巴(中国)有限公司
  • 2023-05-31 - 2023-08-01 - G10L15/06
  • 本发明提供一种语音识别模型训练及语音识别方法、设备和存储介质,该方法包括:获取语音样本对应的多个音频帧和参考文字序列。根据编码网络确定多个音频帧对应的多个第一特征向量,以及根据预测网络确定多个文字对应的多个第二特征向量。根据多个第一特征向量和边界感知模型,确定多个音频帧与多个文字的对应关系。确定多个音频帧对应的第一待融合特征向量和多个文字对应的第二待融合特征向量。将第一待融合特征向量和第二待融合特征向量输入融合网络,以根据融合网络的预测输出信息和参考文字序列确定目标损失,并基于目标损失更新语音识别模型和边界感知模型的参数。本发明可以降低语音识别模型的训练开销。
  • 语音识别模型训练方法设备存储介质
  • [发明专利]语音唤醒检测方法、装置、设备以及存储介质-CN201810637168.1有效
  • 陈梦喆;雷鸣;高杰;张仕良;刘勇;姚海涛 - 阿里巴巴集团控股有限公司
  • 2018-06-20 - 2023-06-30 - G10L15/22
  • 本公开提出了一种语音唤醒检测方法、装置、设备以及存储介质。将多帧音频数据中目标帧附近预定范围内的音频数据帧,与目标帧一并输入至声学模型组件,声学模型组件为前馈序列记忆神经网络模型组件,声学模型组件的输出为目标帧以及预定范围内的音频数据帧中的至少一帧音频数据的状态识别结果;将多帧音频数据中位于目标帧之后且未对其进行处理的单帧音频数据,作为下一个目标帧,并迭代地使用声学模型组件对之后多个目标帧进行处理;以及将多帧音频数据中多个帧的音频数据的状态识别结果与预设唤醒词进行比对,以识别多帧音频数据是否为唤醒指令。由此,在降低设备端资源的占用的同时,还可以保证良好的唤醒性能,满足唤醒所需的实时性的要求。
  • 语音唤醒检测方法装置设备以及存储介质
  • [发明专利]训练语音识别模型的方法、语音识别方法及对应装置-CN202211679185.4在审
  • 安柯宇;张仕良 - 阿里巴巴达摩院(杭州)科技有限公司
  • 2022-12-26 - 2023-05-05 - G10L15/06
  • 本申请实施例公开了一种训练语音识别模型的方法、语音识别方法及对应装置,涉及机器学习技术领域。其中方法包括:获取包括多个训练样本的训练数据,所述训练样本包括音频以及该音频被标注的文本标签序列;利用所述训练数据训练基于深度学习模型的语音识别模型;在所述训练中,语音识别模型利用音频中各音频单元的音频表示识别所述音频对应的文本序列,其中在进行所述识别时还依据针对所述音频已经识别得到的文本对应的文本表示序列,所述文本表示序列中被添加有扰动;训练目标包括最小化所述语音识别模型针对音频识别得到的文本序列与对应文本标签序列之间的差异。本申请能够提高语音识别的鲁棒性。
  • 训练语音识别模型方法对应装置
  • [发明专利]流式语音识别的方法及对应装置-CN202211680216.8在审
  • 杨叶新;张仕良;宫博 - 阿里巴巴达摩院(杭州)科技有限公司
  • 2022-12-26 - 2023-05-02 - G10L15/34
  • 本申请实施例公开了一种流式语音识别的方法及对应装置。其中方法包括:获取语音音频流;将利用第一时长单元对语音音频流进行分块得到的连续第一音频分块输入第一语音识别模型,得到各第一音频分块的识别结果用以展示;以及,将利用第二时长单元对语音音频流进行分块得到的连续第二音频分块输入第二语音识别模型,得到各第二音频分块的识别结果,其中第一时长单元小于第二时长单元,第二时长单元小于句子对应的音频时长;利用第二音频分块的识别结果更新对应第一音频分块的识别结果用以展示。本申请将识别结果的更新跳变限制在一个更小的范围内,从而改善了实时语音识别的显示效果,提升用户体验。
  • 语音识别方法对应装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top