[发明专利]能实时分辨环境噪音进行语音识别的机器人在审
申请号: | 201611103797.3 | 申请日: | 2016-12-05 |
公开(公告)号: | CN108154880A | 公开(公告)日: | 2018-06-12 |
发明(设计)人: | 胡扬;邬惠林 | 申请(专利权)人: | 广东大仓机器人科技有限公司;邬惠林 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L25/84 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 523000 广东省东莞市东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 环境噪音 音频数据 机器人 语音识别 分辨 语音识别模块 实时采样 规律性 适应环境变化 音频数据片段 采样片段 人本发明 峰值比 音量 采样 送入 噪音 分析 高峰 更新 发现 | ||
本发明公开了一种能实时分辨环境噪音进行语音识别的机器人,其特征是:所述机器人通过实时采样分析音频数据中代表音量大小的峰值,将长时间、规律性的峰值收录为环境噪音阀值;所述机器人通过实时采样分析音频数据中出现新的长时间、规律性存在的峰值时,将新的峰值更新为新的环境噪音阀值。当所述机器人采样发现,出现了比环境噪音阀值更高峰值的音频数据片段时,才将采样片段送入语音识别模块进行正式的语音识别,直到最新音频数据的峰值比噪音阀值低,视为片段结束。本发明的有益效果是,能够适应环境变化,实时分辨环境噪音,解决了无效的音频数据对语音识别模块的影响,提高了机器人的效率。
技术领域
本发明涉及一种机器人,尤其涉及一种能实时分辨环境噪音进行语音识别的机器人。
背景技术
现有机器人的语音识别模块和命令词识别模块在嘈杂环境下很难正确地识别。虽然上述模块本身自带了降噪、提取语音特征等处理,但是一旦进入了识别状态,模块本身的实时性将会大幅下降,甚至因为无意义的噪音过多而导致识别出错。而对于音频本身进行降噪、提取语音特征等处理后再送入识别系统的方法又过于冗余,对计算机性能要求很高,而且这种方法还存在降噪后音频失真的问题。
发明内容
为了克服上述缺点, 本发明提供了一种能实时分辨环境噪音进行语音识别的机器人。
本发明为实现上述目的所采用的技术方案是:
一种能实时分辨环境噪音进行语音识别的机器人,其特征是:
所述机器人通过实时采样分析音频数据中代表音量大小的峰值,将长时间、规律性的峰值收录为环境噪音阀值;所述机器人通过实时采样分析音频数据中出现新的长时间、规律性存在的峰值时,将新的峰值更新为新的环境噪音阀值。当所述机器人采样发现,出现了比环境噪音阀值更高峰值的音频数据片段时,才将采样片段送入语音识别模块进行正式的语音识别,直到最新音频数据的峰值比噪音阀值低,视为片段结束。
本发明的有益效果是,能够适应环境变化,实时分辨环境噪音,解决了无效的音频数据对语音识别模块的影响,提高了机器人的效率。
附图说明
下面结合附图和实施对本发明进一步说明。图1是本发明的方框图。
图1中,1是采样音频数据,2是判断确定环境噪音阀值,3是再次确定环境噪音阀值
具体实施方式
在图1中,所述机器人通过实时采样音频数据1分析音频数据中代表音量大小的峰值,比如2秒时间、规律性存在的峰值为35,就把35确定为环境噪音阀值2;所述机器人通过实时采样分析音频数据中出现新的2秒时间、规律性存在的峰值45时,将新的峰值45更新为新的环境噪音阀值。当所述机器人采样发现,比环境噪音阀值45更高峰值55的音频数据片段时,才将此采样片段送入语音识别模块进行正式的语音识别5,直到最新音频数据的峰值42比噪音阀值45低,视为片段结束。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,任何未脱离本发明方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东大仓机器人科技有限公司;邬惠林,未经广东大仓机器人科技有限公司;邬惠林许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611103797.3/2.html,转载请声明来源钻瓜专利网。