[发明专利]连续语音指令快速识别控制系统在审
申请号: | 202210347366.0 | 申请日: | 2022-04-01 |
公开(公告)号: | CN114664303A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 陈芒 | 申请(专利权)人: | 深圳市轻生活科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/16;G10L15/06;G10L21/0208;G10L25/78 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 赵银萍 |
地址: | 518000 广东省深圳市福田区福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 连续 语音 指令 快速 识别 控制系统 | ||
本发明提供连续语音指令快速识别控制系统,包括:输入模块与预处理模块连接,通过MIC输入用户控制语音;预处理模块的另一端分别与在线语音识别处理模块、离线语音识别处理模块连接,对用户控制语音进行音频预处理;在线语音识别处理模块通过云端平台对预处理后的语音进行语音识别得到语音输出信息;离线语音识别处理模块通过神经网络RNN模型对预处理后的语音进行语音识别得到语音输出信息;输出模块将在线语音识别处理模块或离线语音识别处理模块得到的语音输出信息输出。本发明通过在线语音识别处理模块和离线语音识别处理模块消除了是否在线的限制,使得离线状态也能够进行语音指令识别,而且还能够快速稳定地针对连续的语音指令进行识别。
技术领域
本发明涉及智能控制技术领域,特别涉及一种连续语音指令快速识别控制 系统。
背景技术
随着计算机的普及和越来越多的智能设备出现,怎么跟这些设备之间建立 一个简单直接的沟通方式成了人们迫切的需求,语音识别技术的出现让人们的 这种需求从梦想变成了现实,实现可以跟机器就行语音交流,语音识别,通常 称为自动语音识别,主要是将人类语音中的词汇内容转换为计算机可读的输入。
目前,在线语音识别普遍都存在着网络不稳定、回馈延时大等问题,离线 语音识别的出现则摆脱了对网络的依赖,但是单次只能识别一条单一的指令, 大大的影响了用户使用产品的体验感,因此,本发明给出了一种连续语音指令 快速识别控制系统,通过在线语音识别处理模块和离线语音识别处理模块消除 了是否在线的限制,使得离线状态也能够进行语音指令识别,而且还能够快速 稳定地针对连续的语音指令进行识别。
发明内容
本发明提供了连续语音指令快速识别控制系统,运用神经网络RNN,解决 现有技术方案中单次只能识别一条单一指令的问题。
本发明提供一种连续语音指令快速识别控制系统,包括:一种连续语音指 令快速识别控制系统,其特征在于,包括:输入模块、预处理模块、在线语音 识别处理模块、离线语音识别处理模块和输出模块;
所述输入模块与所述预处理模块连接,用于通过MIC输入用户控制语音;
所述预处理模块的另一端分别与所述在线语音识别处理模块、离线语音识 别处理模块连接,用于对所述用户控制语音进行音频预处理,得到预处理后的 语音;
所述在线语音识别处理模块,用于通过云端平台对预处理后的语音进行语 音识别得到语音输出信息;
所述离线语音识别处理模块,用于通过神经网络RNN模型对预处理后的语 音进行语音识别得到语音输出信息;
所述输出模块,用于将所述在线语音识别处理模块或所述离线语音识别处 理模块得到的语音输出信息输出。
优选的,所述连续语音指令快速识别控制系统还包括:唤醒模块;当所述 连续语音指令快速识别控制系统在预设时间内未收到用户控制语音时,所述连 续语音指令快速识别控制系统进入休眠状态,当再次使用所述连续语音指令快 速识别控制系统时,通过所述唤醒模块,利用特定唤醒词将处于休眠状态的连 续语音指令快速识别控制系统唤醒进入待命状态。
优选的,所述MIC采用线性双麦克风阵列,所述预处理模块在对所述用户 控制语音进行音频预处理时包括:
通过AD芯片对所述MIC输入的用户控制语音进行采集,获得所述用户控 制语音;
对所述用户控制语音进行分帧处理,将所述用户控制语音按帧划分,获得 多个用户控制语音帧;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市轻生活科技有限公司,未经深圳市轻生活科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210347366.0/2.html,转载请声明来源钻瓜专利网。