[发明专利]语音处理方法、模型训练方法、界面显示方法及设备在审
| 申请号: | 201911134195.8 | 申请日: | 2019-11-19 |
| 公开(公告)号: | CN112825248A | 公开(公告)日: | 2021-05-21 |
| 发明(设计)人: | 袁园;胡于响;姜飞俊 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/02;G10L15/26;G10L15/06;G10L15/30;G10L25/78 |
| 代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 柴艳波;刘戈 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 处理 方法 模型 训练 界面 显示 设备 | ||
本申请实施例提供一种语音处理方法、模型训练方法、界面显示方法及设备。其中,方法包括:对采集到的待识别语音进行语音识别,得到声学信息和文本信息;根据声学信息和文本信息,利用训练好的检测模型获得检测结果;检测模型包括第一网络、第二网络以及第三网络;第一网络用于对声学信息进行特征提取,得到声学特征;第二网络用于对文本信息进行特征提取,得到文本特征;第三网络用于融合声学特征和文本特征,得到融合特征;并根据融合特征,检测待识别语音是否结束;根据检测结果,执行相应操作。本申请实施例提供的检测语音是否结束的方式更加合理、更加智能,在缩短智能终端的响应时间的同时,还可降低中断用户语音的次数,提高用户体验。
技术领域
本申请涉及计算机技术领域,尤其涉及一种语音处理方法、模型训练方法、界面显示方法及设备。
背景技术
随着科技的不断发展,带有语音交互功能的智能终端,例如:智能音箱逐渐出现在人们的视野中。
在日常使用过程中,用户需要通过唤醒词唤醒智能音箱,唤醒后的智能音箱开启麦克风对周围环境进行音频采集,采集完之后对采集到的音频进行语音识别,根据语音识别结果进行响应。而现有技术中,智能音箱通常是在检测到用户静默的时长达到设定时长后,就认为用户语音已经结束,也即采集完毕,进而执行后续识别、响应等操作。
然而,这种检测语音是否结束的方法很容易出现智能音箱响应慢或中断用户语音等问题。
发明内容
鉴于上述问题,提出了本申请以提供一种解决上述问题或至少部分地解决上述问题的语音处理方法、模型训练方法、界面显示方法及设备。
于是,在本申请的一个实施例中,提供了一种语音处理方法。该方法包括:
对采集到的待识别语音进行语音识别,得到声学信息和文本信息;
根据所述声学信息和所述文本信息,利用训练好的检测模型获得检测结果;其中,所述检测模型包括第一网络、第二网络以及第三网络;所述第一网络用于对所述声学信息进行特征提取,得到声学特征;所述第二网络用于对所述文本信息进行特征提取,得到文本特征;所述第三网络用于融合所述声学特征和所述文本特征,得到融合特征;并根据所述融合特征,检测所述待识别语音是否结束;
根据所述检测结果,执行相应操作。
在本申请的另一实施例中,提供了一种模型训练方法。该模型训练方法,包括:
获取样本语音对应的样本声学信息和样本文本信息;
根据所述样本声学信息和样本文本信息,利用检测模型获得实际检测结果;其中,所述检测模型包括第一网络、第二网络以及第三网络;所述第一网络用于对所述样本声学信息进行特征提取,得到样本声学特征;所述第二网络用于对所述样本文本信息进行特征提取,得到样本文本特征;所述第三网络用于融合所述样本声学特征和所述样本文本特征,得到样本融合特征;根据所述样本融合特征,检测所述样本语音是否结束;
根据所述实际检测结果以及所述样本语音对应的期望检测结果,对所述检测模型进行参数优化;
其中,所述检测模型用于识别待识别语音是否结束。
在本申请的另一实施例中,提供了一种适于服务端的语音处理方法。该语音处理方法,包括:
接收到客户端发送的检测请求后,对所述客户端发送来的其采集到的待识别语音进行语音识别,得到声学信息和文本信息;
根据所述声学信息和所述文本信息,利用训练好的检测模型获得检测结果;其中,所述检测模型包括第一网络、第二网络以及第三网络;所述第一网络用于对所述声学信息进行特征提取,得到声学特征;所述第二网络用于对所述文本信息进行特征提取,得到文本特征;所述第三网络用于融合所述声学特征和所述文本特征,得到融合特征;根据所述融合特征,检测所述待识别语音是否结束;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911134195.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:售货机、售货机包装方法及装置
- 下一篇:感应人体的灯控系统





