[发明专利]用于识别与语音命令相关联的位置以控制家用电器的方法和系统在审
| 申请号: | 201380076839.7 | 申请日: | 2013-05-28 |
| 公开(公告)号: | CN105308679A | 公开(公告)日: | 2016-02-03 |
| 发明(设计)人: | 章志刚;张岩峰;许军 | 申请(专利权)人: | 汤姆逊许可公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王娟 |
| 地址: | 法国伊西*** | 国省代码: | 法国;FR |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 识别 语音 命令 相关 位置 控制 家用电器 方法 系统 | ||
技术领域
本发明涉及一种用于在家庭环境中识别与语音命令相关联的位置以控制家用电器的方法和系统。更具体地,本发明涉及一种用于使用机器学习方法来识别用户在何处发出语音命令并且然后对与用户在同一房间中的家用电器执行语音命令的动作的方法和系统。
背景技术
如今通过移动电话上的语音命令进行的个人助理应用越来越受欢迎。这种类型的应用使用自然语言处理来回答问题、提出建议、以及通过将请求委托给目的地电视机或STB(机顶盒)来对诸如电视机之类的家用电器执行动作。
然而,在具有一个以上电视机的典型家庭环境中,如果应用仅识别出用户向移动电话说出“打开电视”,那么在没有与说出语音命令的地点相关的适当位置信息的情况下决定应当打开哪个电视机是很含糊的。因此,基于用户命令的背景来确定将要控制哪个电视机的附加方法是必要的。
在本申请中提出的解决方案解决了在家庭环境中存在多个电视机时当前技术的通过语音命令进行的个人助理应用无法正确地识别需要控制哪个电视机的难题。
通过提出利用所记录的“打开电视”语音命令提取特征并且通过用分类方法分析该特征来识别说出“打开电视”的语音命令的地点的方法,所提出的方法能够找到与语音命令相关联的位置并且然后打开同一房间中的电视。
家用电器包括多个电视机、空调设备、照明设备等。
作为相关技术,US20100332668A1公开了一种用于检测电子装置之间的接近度的方法和系统。
发明内容
根据本发明的一方面,提供了一种用于在家庭环境中用语音命令来控制位于指定房间中的家用电器的方法,该方法包括以下步骤:接收由用户进行的语音命令;记录所接收的语音命令;采样所记录的语音命令,以及从所记录的语音命令中提取特征;通过将语音命令的提取的特征与特征参考进行比较来确定房间标签,其中房间标签与特征参考相关联;将房间标签指定给语音命令;以及根据所述语音命令来控制位于指定房间中的家用电器。
根据本发明的另一方面,提供了一种用于在家庭环境中用语音命令来控制位于指定房间中的家用电器的系统,该系统包括:接收器,用于接收由用户进行的语音命令;记录器,用于记录所接收的语音命令;以及控制器,其被配置为:采样所记录的语音命令,以及从所记录的语音命令中提取特征;通过将语音命令的提取的特征与特征参考进行比较来确定房间标签,其中房间标签与特征参考相关联;将房间标签指定给语音命令;以及根据语音命令来控制位于指定房间中的家用电器。
附图说明
根据结合附图的以下描述,本发明的这些和其它方面、特征和优点将变得显而易见,附图中:
图1示出了根据本发明的实施例的在家庭环境中的不同房间中存在一个以上电视机的示例性情况;
图2示出了说明根据本发明的实施例的分类方法的示例性流程图;以及
图3示出了说明根据本发明的实施例的系统的示例性框图。
具体实施方式
在以下描述中,将描述本发明的实施例的各个方面。为了解释的目的,阐述了具体配置和细节,以便提供彻底的理解。然而,对于本领域技术人员而言还将显而易见的是,可以在没有在此呈现的具体细节的情况下实现本发明。
图1示出了在家庭环境101中的不同房间103、105、107、109中存在一个以上电视机111、113、115、117的情况。在家庭环境101下,如果用户119向移动电话121仅指示“打开电视”,则移动电话上基于语音命令系统的个人助理应用不可能确定需要控制哪个电视机。
为了解决该问题,本发明在用户指示“打开电视”的语音命令时考虑周边声学(surroundingacoustic),并且将语音命令与诸如语音特征和命令时间之类的其周边之间的现有相关性应用到语音命令理解中,以便用机器学习方法识别指示语音命令的地点并且然后打开同一房间中的电视。
在本发明中,个人助理应用包括语音分类系统,该语音分类系统结合了三个处理阶段:1.语音记录,2.特征提取和3.分类。已经使用了包括诸如过零率(zero-crossingrate)、信号带宽、频谱质心和信号能量之类的低级别参数的各种信号特征。从自动语音识别器继承的另一组所使用的特征是规定的梅尔倒频谱系数(MFCC:mel-frequencycepstralcoefficients)。这意味着语音分类模块将结合具有节奏和音高内容的表示的标准特征。
1.语音记录
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤姆逊许可公司,未经汤姆逊许可公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380076839.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高稳定性电子自旋存储器
- 下一篇:混合适应性噪音消除的系统和方法





