[发明专利]一种应用于检测设备的语音控制系统及方法在审
申请号: | 202210303027.2 | 申请日: | 2022-03-24 |
公开(公告)号: | CN114596857A | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 林永强;林林;汪冰;郭东晓;崔伟亮;周广涛;谭乐俊 | 申请(专利权)人: | 山东省食品药品检验研究院 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/14;G10L15/06;G10L21/02 |
代理公司: | 北京元本知识产权代理事务所(普通合伙) 11308 | 代理人: | 徐苹 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 检测 设备 语音 控制系统 方法 | ||
1.一种应用于检测设备的语音控制方法,其特征在于,包括:
客户端设备中的显示器显示一条或多条语音输入提示,其中所述一条或多条语音输入提示中的每一条语音输入提示对应一个或多个语音控制指令;
拾音设备中的拾音器阵列拾取音频信号,所述拾音器阵列包括多支拾音器;拾音设备中的波束成形器通过对拾音器阵列拾取的音频信号中的子信号进行语音增强处理而从中提取用户的语音信号;
语音设备中的关键词识别器识别预设的关键词;语音设备中的语音识别器用于对语音信号进行语音识别处理,并根据语音信号中被识别的语音内容创建语音控制指令;
所述语音识别器通过与其相连接的客户端设备与检测设备进行通信,所述客户端设备接收语音识别器的语音控制指令进行解析后配置相应的检测设备进行对应的检测操作,检测结果反馈至所述客户端设备并通过其显示器进行显示,同时将检测结果发送到语音设备中的语音合成器,所述语音合成器对检测结果进行语音合成并通过客户端设备中的扬声器进行播报;
控制设备接收与其相连接的所述关键词识别器发送的关键词识别结果;所述控制设备基于该关键词识别结果对与其相连接的波束成形器进行波束成形控制,以便于对拾音器阵列拾取的音频信号中的第n个子信号进行语音增强处理,所述第n个子信号为来自处于相对于拾音器阵列的第n个方位角度的用户所发出的语音信号,其中n为大于0的整数。
2.根据权利要求1所述的语音控制方法,其特征在于,
其中,所述语音识别器对语音信号进行语音识别处理,具体包括:所述语音识别器对其接收到的语音信号进行滤波从而去除其中的冗余信息,利用Mel频率倒谱系数方法进行特征提取,提取得到的特征参数与声学模型进行匹配获得初步识别结果,然后通过语音解码和搜索算法结合字典解析得到最终的语音识别结果。
3.根据权利要求2所述的语音控制方法,其特征在于,
其中,所述声学模型的建模采用隐马尔可夫模型,对预先识别的检测指令相关语音数据进行训练,将训练好的声学模型移植到语音识别器对中;其中,语音识别器的语言模型采用N-Gram模型,通过对检测术语文本信息进行训练获得关键词关联概率。
4.根据权利要求1所述的语音控制方法,其特征在于,
其中,所述控制设备基于该关键词识别结果对与其相连接的波束成形器进行波束成形控制,具体包括:所述控制设备在启动时基于第m位用户在第n个方位角度处发出的语音信号而进行校准,所述控制设备控制并调谐波束成形器的波束方向至从与该方位角度匹配的方向,利用拾音器阵列拾取该方位角度所发出的音频信号,其中m为大于0的整数;所述语音设备接收与其相连接的拾音设备所拾取的音频信号并过滤来自与该方位角度不同方向且超出设定阈值的音频信号;
当第m位用户移动到其他方位角度并发出包含预设关键字的语音信号时,通过关键词识别器识别用户发出的语音中的关键字并由所述控制系统重新进行校准,控制系统控制并调谐波束成形器的波束方向至第m位用户当前移动到的方向角度。
5.根据权利要求2-4任一项所述的语音控制方法,其特征在于,
其中,所述关键词包括所述唤醒词,所述唤醒词由用户预先设置;
在语音设备开始使用语音识别器进行语音识别处理前,所述语音设备首先利用关键词识别器进行唤醒词的识别;当所述关键词识别器识别到用户发出的语音中包含的唤醒词后,所述语音设备响应于唤醒词并激活所述语音识别器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省食品药品检验研究院,未经山东省食品药品检验研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210303027.2/1.html,转载请声明来源钻瓜专利网。