[发明专利]语音处理方法、模型训练方法、界面显示方法及设备在审

专利信息
申请号: 201911134195.8 申请日: 2019-11-19
公开(公告)号: CN112825248A 公开(公告)日: 2021-05-21
发明(设计)人: 袁园;胡于响;姜飞俊 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G10L15/08 分类号: G10L15/08;G10L15/02;G10L15/26;G10L15/06;G10L15/30;G10L25/78
代理公司: 北京太合九思知识产权代理有限公司 11610 代理人: 柴艳波;刘戈
地址: 英属开曼群岛大开*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 处理 方法 模型 训练 界面 显示 设备
【权利要求书】:

1.一种语音处理方法,其特征在于,包括:

对采集到的待识别语音进行语音识别,得到声学信息和文本信息;

根据所述声学信息和所述文本信息,利用训练好的检测模型获得检测结果;其中,所述检测模型包括第一网络、第二网络以及第三网络;所述第一网络用于对所述声学信息进行特征提取,得到声学特征;所述第二网络用于对所述文本信息进行特征提取,得到文本特征;所述第三网络用于融合所述声学特征和所述文本特征,得到融合特征;并根据所述融合特征,检测所述待识别语音是否结束;

根据所述检测结果,执行相应操作。

2.根据权利要求1所述的方法,其特征在于,融合所述声学特征和所述文本特征,得到融合特征,包括:

拼接所述声学特征和所述文本特征,得到拼接特征;

根据所述拼接特征,确定融合特征。

3.根据权利要求1所述的方法,其特征在于,根据所述拼接特征,确定融合特征,包括:

根据所述拼接特征,预测所述声学特征对应的第一权重以及所述文本特征对应的第二权重;

根据所述声学特征、所述文本特征、所述第一权重以及所述第二权重,确定所述融合特征。

4.根据权利要求1至3中任一项所述的方法,其特征在于,对所述文本信息进行特征提取,得到文本特征,包括:

获取多个文本单元各自对应的第一向量;其中,所述文本信息由所述多个文本单元按序组成;

针对每一个文本单元,综合所述多个文本单元各自对应的第一向量,通过上下文语义融合得到每一个文本单元对应的第二向量;

根据所述多个文本单元各自对应的第二向量,确定所述文本特征。

5.根据权利要求4所述的方法,其特征在于,所述多个文本单元中包括第一文本单元;

针对所述第一文本单元,综合所述多个文本单元各自对应的第一向量,通过上下文语义融合得到所述第一文本单元对应的第二向量,包括:

分别对所述多个文本单元各自对应的第一向量进行特征提取,得到所述多个文本单元各自对应的第三向量;

根据所述多个文本单元中各文本单元对应的第一向量,计算所述多个文本单元中各文本单元与所述第一文本单元的语义相关性;

根据所述语义相关性以及所述多个文本单元各自对应的第三向量,确定所述第一文本单元对应的第二向量。

6.根据权利要求4所述的方法,其特征在于,在对所述文本信息进行特征提取,得到文本特征的步骤之前,还包括:

在所述文本信息的开始位置处添加第一字符,在所述文本信息的结束位置处添加第二字符,得到处理后的文本信息;

其中,所述处理后的文本信息由所述多个文本单元按序组成;其中,所述多个文本单元中排在首位的为所述第一字符;所述多个文本单元中排在末位的为所述第二字符。

7.根据权利要求5所述的方法,其特征在于,根据所述多个文本单元各自对应的第二向量,确定所述文本特征,包括:

将所述第一字符对应的第二向量作为所述文本特征。

8.根据权利要求1至3中任一项所述的方法,其特征在于,所述待识别语音中包括多个音频帧;

所述声学信息中包括所述多个音频帧各自对应的帧向量;

对所述声学信息进行特征提取,得到声学特征,包括:

堆叠所述多个音频帧各自对应的帧向量,得到音频矩阵;

对所述音频矩阵进行卷积处理,得到至少一个卷积后矩阵;

根据所述至少一个卷积后矩阵,得到所述声学特征。

9.根据权利要求1至3中任一项所述的方法,其特征在于,根据所述融合特征,检测所述待识别语音是否结束,包括:

根据所述融合特征,对所述待识别语音进行分类;

根据分类结果,确定所述待识别语音是否结束。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911134195.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top