[发明专利]语音识别的方法、设备和存储介质有效
申请号: | 202210372646.7 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114464184B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 王志超 | 申请(专利权)人: | 北京荣耀终端有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06;G10L15/20;G10L21/0208;G01S5/20;G01S11/14;G01S11/12 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 戴皓 |
地址: | 100095 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 设备 存储 介质 | ||
本申请提供一种语音识别的方法、设备和存储介质,方法应用于智能终端,方法包括:检测唤醒信号;检测到唤醒信号后,测量声源的距离信息,声源的距离信息表示声源到智能终端的距离;根据声源的距离信息优化语音增强算法和语音识别算法,用优化后的语音增强算法和优化后的语音识别算法处理用户语音,得到对应的识别结果。本方案在开始语音识别前根据用户的距离信息优化语音增强算法和语音识别算法,使智能终端的算法能够适应于在多种距离下采集到的语音,改善语音识别的方法在不同距离下输出的识别结果的准确度。
技术领域
本申请涉及语音识别技术领域,尤其涉及一种语音识别的方法、设备和存储介质。
背景技术
语音识别技术已经在人机交互等多种场景中广泛应用。具有语音识别功能的终端设备(简称智能终端)采集用户的语音信号后,利用语音增强算法和语音识别算法处理语音信号,得到识别结果,进而执行识别结果对应的指令。
目前的智能终端仅使用固定的语音增强算法和语音识别算法。这类智能终端的识别结果的准确度会受用户和智能终端间距离影响,例如,用户和智能终端间距离近时识别结果较准确,距离远时识别结果则很不准确。
发明内容
本申请提供了一种语音识别方法、设备和存储介质,以提供一种在多种距离下均能获得准确度较高的识别结果的语音识别方案。
为了实现上述目的,本申请提供了以下技术方案:
本申请第一方面提供一种语音识别的方法,应用于智能终端,所述方法包括:
检测唤醒信号;
检测到所述唤醒信号后,测量声源的距离信息,所述声源的距离信息表示所述声源到所述智能终端的距离;
根据所述声源的距离信息优化语音增强算法,并用优化后的所述语音增强算法处理用户语音,得到增强用户语音,所述用户语音为所述智能终端从所述声源采集到的语音信号;
根据所述声源的距离信息优化语音识别算法,并用优化后的语音识别算法识别所述增强用户语音,得到所述用户语音的识别结果。
本实施例的有益效果在于,在开始语音识别前根据用户的距离信息优化语音增强算法和语音识别算法,使智能终端的算法能够适应于在多种距离下采集到的语音,改善语音识别的方法在不同距离下输出的识别结果的准确度。
在一些可选的实施例中,所述检测唤醒信号,包括:
检测采集到的音频信号是否为语音信号;
若采集到的音频信号为语音信号,检测所述语音信号是否包含预设的唤醒词;
若所述语音信号包括所述唤醒词,确定检测到唤醒信号。
示例性的,上述唤醒词可以是“你好YOYO”,也就是说,若智能终端检测到“你好YOYO”的语音,则确定该语音为唤醒信号。
本实施例的有益效果在于,将特定唤醒词的语音确定为唤醒信号,可以避免附近有人说话时智能终端被频繁地唤醒,从而降低智能终端的功耗。
在一些可选的实施例中,所述检测到所述唤醒信号后,测量声源的距离信息,包括:
计算所述声源的方位;
调用和所述声源的方位匹配的测距传感器测量声源的距离信息。
本实施例的有益效果在于,利用和声源的方位相匹配的测距传感器测量距离信息,可以提高测得的距离信息的准确度。
在一些可选的实施例中,所述语音增强算法包括权重预测估计算法,波束形成算法和增益算法中的任意一种或多种。
在一些可选的实施例中,优化所述权重预测估计算法的过程包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京荣耀终端有限公司,未经北京荣耀终端有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210372646.7/2.html,转载请声明来源钻瓜专利网。