[发明专利]人机语音交互装置及其操作方法在审
申请号: | 201880096234.7 | 申请日: | 2018-09-13 |
公开(公告)号: | CN112654960A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 冯津伟;李新国 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;张艳梅 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人机 语音 交互 装置 及其 操作方法 | ||
一种装置,包括:面向前的麦克风,所述面向前的麦克风被配置成接收第一音频信号;面向后的麦克风,所述面向后的麦克风与所述面向前的麦克风相邻并被配置成接收第二音频信号;和控制器,所述控制器包括电路系统,所述电路系统被配置成计算所述第一音频信号与所述第二音频信号的能量比并且在所计算的能量比满足门限条件时唤醒所述装置以进行语音处理。
技术领域
与本公开一致的装置和方法通常涉及音响装置,并且更具体地,涉及从用户接收声音并对这些声音做出响应的装置。
背景技术
人机语音交互装置的操作依靠该装置对由人类用户发出的词的响应。常规的人机语音交互装置(例如,用在智能扬声器中)要求用户说出唤醒词。然而,唤醒词系统会给用户带来总是向人机语音交互装置发出唤醒词以在用户希望该装置操作并提供适当的响应之前首先唤醒该装置的负担。由于要求如此发出唤醒词,所以用户难以具有日常的人对人交互的体验。
用于唤醒人机语音交互装置的另一方法是通过检测靠近装置站立的用户的面部来使用面部检测技术。这种方法将允许用户在不用发出唤醒词的情况下唤醒装置。然而,这种方法遭受一些限制,例如,只要装置检测到人的面部,即使该人无意与该装置交互,该装置也总是处于唤醒模式下。
用于唤醒人机语音交互装置的另一方法是使用麦克风的阵列,例如八个麦克风的阵列,以计算出与该装置交互的用户的距离和摇摄角。仅被检测到为在前近场中的语音可以用于唤醒装置。然而,这种方法也遭受限制,例如,当用户使他的/她的面部从装置移开并与他的/她的朋友交谈时,装置会对非计划中的情形做出响应。此外,为一个用户操作八麦克风阵列会增加计算成本和材料成本两者。
发明内容
根据本公开的一些实施例,提供了一种装置,所述装置包括:面向前的麦克风,所述面向前的麦克风被配置成接收第一音频信号;面向后的麦克风,所述面向后的麦克风与所述面向前的麦克风相邻并被配置成接收第二音频信号;和控制器,所述控制器包括被配置成计算所述第一音频信号与所述第二音频信号的能量比并且在所计算的能量比满足门限条件时对用户做出响应的电路系统。在一些实施例中,所述装置可以在所计算的能量比满足所述门限条件时简单地唤醒以进行语音处理,而不用与所述用户交互。
在所述装置中,所述面向前的麦克风和所述面向后的麦克风中的至少一个可以为心形麦克风或全向麦克风或将声能转换成电信号的任何其他换能器。所述面向后的麦克风的前面可以被定位为与所述面向前的麦克风的后面相邻。
在所述装置中,所述控制器可以还被配置成:分别对所述第一音频信号和所述第二音频信号执行傅立叶变换;分别确定所述第一音频信号在多个频率区间中的每个频率区间中的第一语音信号功率和所述第二音频信号在所述多个频率区间中的每个频率区间中的第二语音信号功率;分别随着时间的推移而累积所述第一信号功率和所述第二信号功率;分别对所述第一语音信号功率和所述第二语音信号功率执行频率加权;并且分别通过跨所述多个频率区间将所述加权的第一语音信号功率和所述加权的第二语音信号功率相加来计算出所述第一音频信号的总音频能量和所述第二音频信号的总音频能量。
在所述装置中,所述面向前的麦克风可以包括多个面向前的心形麦克风;而所述面向后的麦克风可以包括在水平方向上或在垂直方向上与所述多个面向前的心形麦克风交替地布置的多个面向后的心形麦克风。所述多个面向前的心形麦克风和所述多个面向后的心形麦克风可以被交替地布置以形成矩阵阵列。
所述装置还可以包括被配置成通过显示消息来对所述用户做出响应的显示器。所述装置还可以包括被配置成分配由所述用户购买的物品的狭槽。
根据本公开的一些实施例,提供了一种操作装置的方法。所述方法包括:通过所述装置的面向前的麦克风来获得第一音频信号并通过所述装置的面向后的麦克风来获得第二音频信号;计算所述第一音频信号与所述第二音频信号的能量比;以及当所计算的能量比满足门限条件时对用户做出响应。满足所述门限条件的示例是所计算的能量比大于预定门限值。在一些实施例中,所述对用户做出响应可以为简单地唤醒所述装置以进行语音处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880096234.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可拉伸触控面板
- 下一篇:样本分析仪、采样装置及采样方法