[发明专利]一种多媒体设备语音控制系统及方法有效
申请号: | 201210374809.1 | 申请日: | 2012-09-29 |
公开(公告)号: | CN102945672A | 公开(公告)日: | 2013-02-27 |
发明(设计)人: | 王洪智;刘乐元;桑农;刘国华 | 申请(专利权)人: | 深圳市国华识别科技开发有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G06F3/01 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518026 广东省深圳市福田区彩田路西红荔路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多媒体设备 语音 控制系统 方法 | ||
技术领域
本发明涉及语音遥控技术,更具体地说,涉及一种多媒体设备语音控制系统及方法。
背景技术
继手机智能化后,电视、投影仪、游戏机等多种多媒体设备的智能化成为必然趋势。现有多种多媒体设备电视一般配备高性能控制芯片,具有开放式平台和操作系统;可由用户自行安装和卸载应用程序,此类应用程序扩展多媒体设备的功能;支持用户通过网络进行信息浏览和网络社交。以智能电视机为例,电视机不再局限于传统的电视节目播放功能,还通过运行应用程序实现音视频分享,交互娱乐游戏等多种功能。而传统的按键式遥控器已经无法满足多种多媒体功能选择和操作需求。
现有技术提出包括触摸控制、声音控制、手势识别、体感控制等多种人机交互方案以实现智能控制,但由于电视机的使用场景限制和使用习惯问题,仍然没有一种智能控制方式能够完全取代手持遥控器,用户必须借助手持遥控器上的特定功能键和数字键组合来进行操控。例如触摸控制方案需要在借助遥控器上安装的触摸感应模块;手势识别方案其无法快捷地进行常用的节目频道跳转控制:如用户想从当前的1频道切换到55频道,仅采用手势识别方式操作显然不如使用传统遥控器更加快捷;而体感控制方案的问题类似手势识别方案,通常还需要安装价格昂贵的深度图像感应模块才能实现准确的体感控制功能。而现有技术声音识别控制方案的问题在于,一般为清晰地采集用户的声音而在遥控器上安装麦克风模块,仍然需要借助手持遥控器。
随着声音识别技术的发展,声音识别、语义识别等都已经基本达到实用的阶段,而且随着云计算技术的普及,许多基于云服务的语音识别服务商与智能电视结合实现语音控制电视。但目前现有技术方案大多在遥控器上加装麦克风拾音模块,获取用户声音经处理后再传至云端进行识别处理;即使是采用可以远距离拾音的麦克风阵列技术,也存在因电视输出的声音、环境声音干扰和用户的非控制指令语音被错误解读为控制指令等问题,影响语音控制电视机等多媒体设备的效果。
发明内容
本发明要解决的技术问题在于,提出一种多媒体设备语音控制系统。
本发明解决其技术问题所采用的技术方案是提供一种多媒体设备语音控制系统,包括:图像感应模块,采集用户动作图像;图像识别模块,根据用户动作图像确定控制指令类型或状态;语音识别状态管理模块,根据当前的控制指令类型激活或暂停语音识别;拾音模块,采集语音数据;语音识别模块,对采集到的语音数据进行识别,形成控制指令;多媒体功能模块,执行控制指令,向用户提供相应的多媒体功能。
优选地,上述图像识别模块将用户动作图像与预设的图像模版比对,选取与用户动作图像匹配的控制指令类型;若比对结果为找到与用户动作图像匹配的控制指令类型,则认为用户所在位置为目标音源位置,向语音识别状态管理模块发送目标音源所在位置信息、启动语音识别信息和/或控制指令类型;或若未找到与用户动作图像匹配的控制指令类型,则向语音识别状态管理模块发出比对失败信息。
优选地,上述多媒体设备语音控制系统还包括音束形成模块,根据目标音源所在位置信息确定拾音方向和拾音接收角。
优选地,上述拾音模块为阵列拾音模块,包括规则排列的至少一拾音传感器,根据拾音方向和拾音接收角的限定采集目标音源发出的语音信号,进行数字化处理形成语音数据后发送给语音识别模块。
优选地,上述语音识别状态管理模块根据接收到的启动语音识别信息,向语音识别模块发送启动指令及控制指令类型以激活语音识别,向音束形成模块发送目标音源所在位置信息,并控制多媒体功能模块减小多媒体输出声音的音量;或根据接收到的比对失败信息,向语音识别模块发送指令暂停语音识别。
优选地,上述语音识别模块根据来自语音识别状态管理模块的启动指令和控制指令类型,对来自拾音模块的语音数据进行识别,形成属于控制指令类型的控制指令,发送给多媒体功能模块。
优选地,上述语音识别模块包括本地语音识别模块和云端语音识别模块;本地语音识别模块识别语音数据,形成属于控制指令类型的控制指令,发送给多媒体功能模块;云端语音识别模块对本地语音识别模块无法识别的语音数据进行语义识别处理,形成属于控制指令类型的控制指令,发送给多媒体功能模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市国华识别科技开发有限公司,未经深圳市国华识别科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210374809.1/2.html,转载请声明来源钻瓜专利网。