[发明专利]一种基于鼠标的语音识别人机交互方法有效

专利信息
申请号: 201510165745.8 申请日: 2015-04-09
公开(公告)号: CN104731549B 公开(公告)日: 2017-12-19
发明(设计)人: 徐敏 申请(专利权)人: 安徽咪鼠科技有限公司
主分类号: G06F3/16 分类号: G06F3/16;G06F3/038
代理公司: 铜陵市天成专利事务所34105 代理人: 吴晨亮
地址: 230000 安徽省合肥市高新区*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于鼠标的语音识别人机交互装置及其方法,包括集成语音采集功能的鼠标和集成语音识别功能鼠标驱动程序,鼠标内集成有控制语音识别启动、停止的语音按键、采集语音的专用麦克风、语音编解码芯片、指示识别状态的专用LED指示灯,鼠标通讯用的USB HUB芯片或者RF芯片和鼠标传统功能的鼠标芯片。所述鼠标驱动程序包括离线命令词语音识别模块、离线随意语音转写模块、在线随意语音转写模块、语音识别引擎自动选择模块、语义理解模块和计算机操作控制模块。本发明的有益效果是通过本发明可以在鼠标传统功能基础上充分发挥多种语音识别交互技术的优势特点,降低人机交互的复杂度,提高人机交互效率。
搜索关键词: 一种 基于 鼠标 语音 识别 人机交互 装置 及其 方法
【主权项】:
一种基于鼠标的语音识别人机交互的方法,其特征是它包括具有语音采集功能的鼠标和集成语音识别处理能力的鼠标驱动程序,所述鼠标内集成有鼠标芯片、语音识别按键、麦克风、语音编解码模块和LED指示灯,所述鼠标芯片和语音编解码模块通过USB HUB芯片/RF芯片与计算机内的鼠标驱动程序通信,所述鼠标驱动程序包括离线命令词语音识别模块、离线随意语音转写模块、在线随意语音转写模块、语音识别引擎自动选择模块、语义理解模块和计算机操作控制模块,该方法步骤如下:(1)、在鼠标内集成的麦克风实时采集语音信息,采集到的语音通过语音编解码模块处理后上传至计算机,计算机内安装的鼠标驱动程序实时接收语音信息;(2)、鼠标驱动程序同时检测鼠标上的语音识别按键,当按键按下时,鼠标驱动程序启动录音功能,LED指示灯亮,松开语音识别按键时,录音结束;(3)、在启动录音功能之后启动语音识别引擎自动选择模块,根据特定的逻辑完成离线命令词语音识别模块、离线随意语音转写模块、在线随意语音转写模块之间的自动选择,具体选择逻辑如下:首先判断是否有文本输入的光标聚焦,如果没有文本输入光标聚集,启动离线命令词语音识别模块,将离线命令词语音识别模块返回值作为我们的结果,启动语义理解模块对识别结果进行分析处理,根据分析结果启动计算机操作控制模块完成计算机控制操作;如果有文本输入光标聚集时,启动离线命令词语音识别模块,并判断是否计算机在线,离线时,启动离线随意语音转写模块,在线时,启动在线随意语音转写模块,获得两个识别结果返回值;再判断离线命令词语音识别模块返回的置信度,根据置信度判断,当置信度高于设定的预设值时,则将离线命令词语音识别模块返回值作为我们的结果,启动语义理解模块对识别结果进行分析处理,根据分析结果启动计算机操作控制模块完成计算机控制操作;当置信度低于设定的预设值时,则启动文本输入功能,将在线或离线随意语音转写作为我们的结果,并完成文本输入;(4)、在完成录音和语音识别引擎自动选择模块选择后,将录音信息提交给离线命令词语音识别模块,返回识别结果,LED灯熄灭。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽咪鼠科技有限公司,未经安徽咪鼠科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510165745.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top