[发明专利]一种多媒体设备语音控制系统及方法有效
申请号: | 201210374809.1 | 申请日: | 2012-09-29 |
公开(公告)号: | CN102945672A | 公开(公告)日: | 2013-02-27 |
发明(设计)人: | 王洪智;刘乐元;桑农;刘国华 | 申请(专利权)人: | 深圳市国华识别科技开发有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G06F3/01 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518026 广东省深圳市福田区彩田路西红荔路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种多媒体设备语音控制系统,包括:图像感应模块,采集用户动作图像;图像识别模块,根据用户动作图像确定控制指令类型或状态;语音识别状态管理模块,根据当前的控制指令类型激活或暂停语音识别;拾音模块,采集语音数据;语音识别模块,对采集到的语音数据进行识别,形成控制指令;多媒体功能模块,执行控制指令,向用户提供相应的多媒体功能。本发明还提出一种多媒体设备语音控制方法。本发明结合图像识别和语音识别技术,实现不依赖手持遥控器,不使用近距离拾音模块实现自由便捷的语音控制,有效避免了多媒体设备输出的声音、环境背景声音以及用户的非控制指令语音信号对控制指令语音识别的干扰,实现准确识别用户发出的控制指令。 | ||
搜索关键词: | 一种 多媒体设备 语音 控制系统 方法 | ||
【主权项】:
一种多媒体设备语音控制系统,其特征在于,包括:图像感应模块,采集用户动作图像;图像识别模块,根据用户动作图像确定控制指令类型或状态;语音识别状态管理模块,根据当前的控制指令类型激活或暂停语音识别;拾音模块,采集语音数据;语音识别模块,对采集到的语音数据进行识别,形成控制指令;多媒体功能模块,执行控制指令,向用户提供相应的多媒体功能。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市国华识别科技开发有限公司,未经深圳市国华识别科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210374809.1/,转载请声明来源钻瓜专利网。