专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果101个,建议您升级VIP下载更多相关专利
  • [发明专利]一种语音识别方法、装置、设备及存储介质-CN202310641362.8在审
  • 茆廷志;万根顺;王磊奇;张景宣;高建清;潘嘉;刘聪;胡国平 - 科大讯飞股份有限公司
  • 2023-05-31 - 2023-09-29 - G10L15/22
  • 本发明提供了一种语音识别方法、装置、设备及存储介质,语音识别方法包括:获取指定领域的目标语音和目标视频,其中,目标语音为目标视频的视频画面内容的解说语音;从目标视频的视频画面中检测实体,得到第一目标实体;从指定领域的知识图谱中获取第一目标实体的知识信息;辅以第一目标实体的知识信息,对目标语音进行语音识别,得到目标语音的语音识别结果。本发明从解说语音的特点出发,提出从目标视频的视频画面中检测实体,并从知识图谱中获取检测出的实体的知识信息,进而辅以获得的实体知识信息对目标语音进行识别,在对目标语音进行识别时,辅以从目标视频的视频画面中检测出的实体的知识信息,能够获得较为准确的语音识别结果。
  • 一种语音识别方法装置设备存储介质
  • [发明专利]一种语音识别方法、装置、设备及存储介质-CN202310641371.7在审
  • 茆廷志;万根顺;邢秀萍;张景宣;高建清;潘嘉;刘聪;胡国平 - 科大讯飞股份有限公司
  • 2023-05-31 - 2023-09-15 - G10L15/22
  • 本发明提供了一种语音识别方法、装置、设备及存储介质,语音识别方法包括:获取目标语音和目标视频,其中,目标语音为目标视频的视频内容的解说语音;对目标语音提取声学特征,得到目标语音的声学特征,并对目标视频提取含视频内容信息的视觉特征,得到目标视频的视觉特征;根据目标语音的声学特征并辅以目标视频的视觉特征,确定目标语音的语音识别结果。考虑到目标语音为目标视频的视频内容的解说语音,其与目标视频的视频内容具有一定的相关性,本发明对目标视频提取含视频内容信息的视觉特征,辅以视觉特征对解说语音进行语音识别,在对目标语音即解说语音进行语音识别时,辅以含视频内容信息的视觉特征,能够获得较为准确的语音识别结果。
  • 一种语音识别方法装置设备存储介质
  • [发明专利]标点添加方法、服务器和客户端设备-CN202310445263.2在审
  • 金泽群;许丽;万根顺;熊世富;高建清;潘嘉;刘聪 - 科大讯飞股份有限公司
  • 2023-04-21 - 2023-08-22 - G06F40/166
  • 本发明提供一种标点添加方法、服务器和客户端设备,涉及自然语言处理技术领域,该方法包括:接收客户端设备发送的待添加标点的初始文本,并提取初始文本的文本特征;基于用户行为特征、文本特征和标点预测模型确定初始文本的标点预测结果;基于标点预测结果为初始文本添加标点,得到目标文本,并将目标文本发送给客户端设备;其中,用户行为特征用于表征用户的标点添加习惯;标点预测模型是基于不同用户的带标点样本文本和带标点样本文本对应的用户行为样本特征,对初始标点预测模型进行训练得到的。本发明提供的技术方案能够实现个性化的文本标点预测,得到与用户标点使用习惯相匹配的带标点文本,个性化程度高。
  • 标点添加方法服务器客户端设备
  • [发明专利]语音识别方法、语音识别模型训练方法、设备和介质-CN202310460643.3在审
  • 张文辉;万根顺;田定书;高建清;潘嘉;刘聪;胡国平 - 科大讯飞股份有限公司
  • 2023-04-25 - 2023-08-18 - G10L15/06
  • 本申请公开了一种语音识别方法、语音识别模型训练方法、设备和介质,该方法包括:获取待识别语音并获取经训练的语音识别模型;语音识别模型包括编码网络和解码网络;在利用编码网络对待识别语音进行编码的各个阶段中,先在目标语音属性下分类得到待识别语音所属的预测属性类别,再基于目标语音属性下预测属性类别进行编码,得到第一编码特征;基于解码网络对第一编码特征进行解码,得到待识别语音的识别文本;其中,语音识别模型至少基于第一损失进行调整,第一损失表征在目标语音属性下,样本语音标注的预设属性类别与被语音识别模型进行识别所得到的样本属性类别之间的差异。通过上述方式,本申请能够在提升语音识别准确率的同时,减少成本。
  • 语音识别方法模型训练设备介质
  • [发明专利]音频识别方法和音频识别模型的训练方法-CN202211718321.6在审
  • 郭顺杰;万根顺;熊世富;高建清;潘嘉;刘聪 - 科大讯飞股份有限公司
  • 2022-12-29 - 2023-06-06 - G10L15/06
  • 本申请提供一种音频识别方法和音频识别模型的训练方法,所述音频识别方法,包括:获取待识别的音频数据;利用预先训练的音频识别模型,对所述待识别的音频数据进行音频识别处理,得到与所述音频数据对应的文本数据;其中,所述音频识别模型基于对第一音频识别模型中与音频识别任务相关的模型参数进行掩码梯度更新获得;所述第一音频识别模型通过利用包含文本伪标签的第一音频数据和包含文本标签的第二音频数据,对初始音频识别模型进行音频识别训练获得,所述文本伪标签由所述初始音频识别模型对所述第一音频数据进行音频识别而确定。
  • 音频识别方法模型训练
  • [发明专利]语音识别模型的训练、语音识别方法、装置、设备及介质-CN202211635640.0在审
  • 李明;万根顺;熊世富;高建清;潘嘉;刘聪 - 科大讯飞股份有限公司
  • 2022-12-19 - 2023-05-26 - G10L15/06
  • 本发明提供一种语音识别模型的训练、语音识别方法、装置、设备及介质,其中方法包括:确定非流式识别分支和流式识别分支;获取所述非流式识别分支进行语音识别时提取的样本语音中各帧的第一语音特征,以及所述流式识别分支进行语音识别时提取的所述样本语音中各帧的第二语音特征;对所述各帧的第一语音特征进行聚类,得到多个第一特征簇;将所述各帧的第二语音特征划分至所述多个第一特征簇,并基于所述第二语音特征所属的第一特征簇,确定特征提取损失;基于所述特征提取损失,对所述流式识别分支进行参数迭代,得到所述语音识别模型。本发明提供的方法、装置、电子设备及存储介质,进一步提高流式识别分支的语音识别结果的可靠性和准确性。
  • 语音识别模型训练方法装置设备介质
  • [发明专利]时序采样方法及装置、语音识别方法及装置-CN202211584850.1在审
  • 牛怡珺;万根顺;熊世富;高建清;潘嘉;刘聪 - 科大讯飞股份有限公司
  • 2022-12-09 - 2023-05-05 - G10L15/06
  • 本申请提供了一种时序采样方法及装置、语音识别方法及装置,涉及人工智能技术领域。该时序采样方法包括:获取目标语音数据;基于目标语音数据,利用采样模型,确定目标语音数据的时序采样结果,其中,采样模型包括l层下采样网络和l层上采样网络,每层下采样网络包括并联的skip模块和下采样模块,每层上采样网络包括并联的skip模块和上采样模块,采样模型用于基于每层下采样网络的skip模块和下采样模块以及每层上采样网络的skip模块和上采样模块,为目标语音数据匹配采样模型中的最优采样路径,l为大于1的正整数。通过本申请中的时序采样方法,能够提升对语音数据的声学特征的学习能力、以及建模粒度的适配度。
  • 时序采样方法装置语音识别
  • [发明专利]语音识别、语音识别模型训练方法、装置、介质及设备-CN202211637702.1在审
  • 徐启航;万根顺;熊世富;高建清;潘嘉;刘聪 - 科大讯飞股份有限公司
  • 2022-12-16 - 2023-04-25 - G10L15/02
  • 本申请实施例公开了一种语音识别、语音识别模型训方法、装置、存储介质及设备,该方法包括:通过在语音识别模型的编码网络模块中加入混合专家网络和嵌入模块,利用嵌入模块对目标语音数据的目标声学特征序列进行语音特征提取处理,以得到目标语音嵌入特征,将目标语音嵌入特征和目标声学特征序列输入至混合专家网络的神经网络模块中进行编码处理,使得混合专家网络的神经网络模块中可以得到与语言相关的特征和目标声学特征序列,提高混合专家网络的神经网络模块的输出结果的准确性,将输出结果输入至解码网络模块中进行解码处理,以得到目标语音数据的识别文本,可提高各种语言混说场景中的语音识别的准确率。
  • 语音识别模型训练方法装置介质设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top