[发明专利]用于检测语音命令的方法和装置在审
申请号: | 201480013903.1 | 申请日: | 2014-03-12 |
公开(公告)号: | CN105009203A | 公开(公告)日: | 2015-10-28 |
发明(设计)人: | V·塞吉诺哈;P·A·范马尔伯戈特;G·E·威尔逊;W·F·伽侬 | 申请(专利权)人: | 纽昂斯通讯公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/28;G10L25/78;G10L15/08 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 周磊 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 语音 命令 方法 装置 | ||
背景技术
诸如智能电话的许多移动通信设备都装备有语音应答系统(例如,虚拟助理或代理),其可以识别讲话并响应语音命令来执行期望的任务(执行因特网搜索、打电话、提供导航、回答问题、做出建议、安排预约,等等)。但是,在系统被接合并准备好响应来自用户的讲话输入之前,接合语音应答系统常规地需要用户的一个或多个手动动作。例如,用户可能必须激活图标(例如,通过触摸)来启动虚拟助理应用,或者操纵移动设备上的软件或硬件接口控制部来接合语音应答系统(例如,激活麦克风显示图标、按下按钮、激活开关,等等)。
在本文被称为“手动触发”的这种需要用户手的手动动作使与移动设备的交互复杂化,并且在一些情况下,可能是被禁止的(例如,当用户的手被其它事情占用时)。已经实现了语音触发来减少至少一些激活语音应答系统所需的手动动作,以试图一般地提供对语音应答系统的免提(hands-free)访问。但是,常规的语音应答系统在有限的上下文中响应语音触发,例如,当移动设备是活动的(即,醒着的)并且需要显式触发单词或短语来接合移动设备的语音响应能力时。因此,用户必须说出被称为显式语音触发的特定和预定的单词或短语来接合语音应答系统并且常规地只可以当移动设备是活动的时才这样做。即,常规的语音应答系统在移动设备睡眠时是非响应的。
当移动设备在低功率模式下(例如,在睡眠、休眠或空闲模式下)操作时,接合语音应答系统所需的动作通常变得甚至更加广泛。具体地,在语音应答系统可以利用手动动作或显式语音触发被接合之前用户首先需要唤醒移动设备本身。例如,用户可能必须按下按钮来打开显示器和/或启用一个或多个处理器,可能必须操纵一个或多个控制部来使移动设备准备好以供使用,和/或如果移动设备已经在某个时间段不活动那么可能必须输入密码。
因此,唤醒动作会进一步妨碍语音应答系统的使用,妨碍的方式是在正常情况下会很不方便或者恼人并且在其它情况下会是禁止的(例如,当驾驶车辆时,或从事占用用户手的其它任务时)。常规地,这些唤醒动作是不可避免的。而且,为了从低功率模式中接合语音应答系统,一个或多个唤醒动作后面接着必须跟着一个或多个手动和/或显式语音触发来接合语音应答系统以准备好响应用户的讲话。
发明内容
一些实施例包括监视移动设备的声学环境的方法,该方法包括通过移动设备接收来自移动设备的环境的声学输入,在无需接收来自用户的显式触发的情况下检测声学输入是否包括来自用户的语音命令,及发起对检测到的语音命令的响应。
一些实施例包括用指令编码的至少一个计算机可读介质,当指令在该至少一个处理器上被执行时,执行监视移动设备的声学环境以接收来自移动设备的环境的声学输入的方法,该方法包括在无需接收来自用户的显式触发的情况下检测声学输入是否包括来自用户的语音命令,及发起对检测到的语音命令的响应。
一些实施例包括移动设备,该移动设备包括用于接收来自移动设备的环境的声学输入的至少一个输入部、及至少一个处理器,该处理器被配置为在无需接收来自用户的显式触发的情况下检测声学输入是否包括来自用户的语音命令,及发起对检测到的语音命令的响应。
一些实施例包括当移动设备在低功率模式下操作时对移动设备的声学环境监视语音命令的方法,该方法包括当移动设备在低功率模式下操作时接收来自移动设备的环境的声学输入,基于在声学输入上执行多个处理阶段检测声学输入是否包括语音命令,其中多个处理阶段中的至少一个阶段是当移动设备在低功率模式下操作时执行的,并且该方法包括利用至少一个上下文线索来帮助检测声学输入是否包括语音命令。
一些实施例包括用指令编码的至少一个计算机可读介质,当指令在该至少一个处理器上被执行时,执行监视移动设备的声学环境以当移动设备在低功率模式下操作时接收来自移动设备的环境的声学输入的方法,该方法包括基于在声学输入上执行多个处理阶段检测声学输入是否包括语音命令,其中多个处理阶段中的至少一个阶段是当移动设备在低功率模式下操作时执行的,并且该方法包括利用至少一个上下文线索来帮助检测声学输入是否包括语音命令。
一些实施例包括移动设备,该移动设备包括当移动设备在低功率模式下操作时接收来自移动设备的环境的声学输入的至少一个输入部,被配置为基于在声学输入上执行多个处理阶段检测声学输入是否包括语音命令及利用至少一个上下文线索来帮助检测声学输入是否包括语音命令的至少一个处理器,其中多个处理阶段中的至少一个阶段是当移动设备在低功率模式下操作时执行的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纽昂斯通讯公司,未经纽昂斯通讯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480013903.1/2.html,转载请声明来源钻瓜专利网。