[发明专利]一种语音处理方法、装置、设备及介质、程序产品在审
申请号: | 202110455104.1 | 申请日: | 2021-04-26 |
公开(公告)号: | CN113178187A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 齐建永 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L15/26 |
代理公司: | 北京信远达知识产权代理有限公司 11304 | 代理人: | 姚莹丽 |
地址: | 101299 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 装置 设备 介质 程序 产品 | ||
本申请提供了一种语音处理方法,该方法包括:语音通信系统的发送端采集用户的语音,然后对用户的语音进行识别,获得识别结果,该识别结果中至少包括发音提示信息,接着向语音通信系统的接收端发送识别结果,以使接收端根据识别结果进行语音合成,从而得到不包括背景噪音的语音。如此,该方法实现了100%消除背景噪音,并且不会损失语音信号,保障了语音质量。
技术领域
本申请涉及语音通信技术领域,尤其涉及一种语音处理方法、装置、设备以及计算机可读存储介质、计算机程序产品。
背景技术
随着通信技术的迅猛发展,语音通信逐渐成为一种主流的通信方式。语音通信具体是指用户通过电子设备发送语音实现与对端用户交流的通信方式。目前,语音通信过程中通常存在背景噪音,该背景噪音对用户的语音产生干扰,降低了用户的沟通效率,影响用户体验。
业界提出了语音降噪算法,以降低背景噪音对语音的干扰。一种语音降噪算法是基于多个麦克风,判断噪音的空间信息,如判断噪音的幅度和相位,然后基于该空间信息进行噪音抑制;另外一种语音降噪算法是基于深度学习方法,对各种噪音进行大量学习,从而建立噪声样本,再从原始的声音信号减除噪音,从而到达降噪,提升语音质量的目的。
然而,上述语音降噪算法依然无法做到100%消除噪音成分。并且,上述降噪算法还会损伤语音信号,降低了语音质量。
发明内容
本申请提供了一种语音处理方法,语音通信系统中的发送端向接收端发送不包括背景噪音的识别结果,接收端根据该识别结果中的发音提示信息进行语音合成,合成语音中不掺杂任何背景噪音,实现100%消除背景噪音,并且该方法不会损伤语音信号,保障了语音质量。本申请还提供了上述方法对应的装置、设备、计算机可读存储介质以及计算机程序产品。
第一方面,本申请提供了一种语音处理方法,应用于语音通信系统,所述系统包括发送端和接收端,所述方法包括:
所述发送端采集用户的语音;
所述发送端对所述用户的语音进行识别,获得识别结果,所述识别结果至少包括发音提示信息;
所述发送端向所述接收端发送所述识别结果,以使所述接收端根据所述识别结果进行语音合成。
在一些可能的实现方式中,所述发送端向所述接收端发送所述识别结果,包括:
所述发送端向所述接收端发送所述识别结果以及所述用户的声纹信息。
在一些可能的实现方式中,所述发音提示信息包括音素;
所述发送端对所述用户的语音进行识别,获得识别结果,包括:
所述发送端通过声学模型对所述用户的语音进行识别,获得所述语音对应的所述音素。
在一些可能的实现方式中,所述发送端还通过所述声学模型获得所述语音对应的所述音素的发音时间或者是发音间隔时间,所述识别结果还包括所述发音时间或者所述发音间隔时间。
在一些可能的实现方式中,所述发音提示信息包括与所述语音具有相同发音的文本信息。
在一些可能的实现方式中,所述文本信息由所述发送端通过声学模型识别音素,然后通过语言模型解码音素得到。
在一些可能的实现方式中,所述方法还包括:
对所述识别结果加密;
所述发送端向所述接收端发送所述识别结果,包括:
所述发送端向所述接收端发送加密后的所述识别结果。
在一些可能的实现方式中,所述方法还包括:
根据所述用户的声纹信息对所述用户的语音进行过滤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110455104.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双重功能层聚合物复合材料及其制备方法
- 下一篇:一种输液器