[发明专利]一种声控信息检测方法及电子设备有效
申请号: | 201210497151.3 | 申请日: | 2012-11-28 |
公开(公告)号: | CN103856877B | 公开(公告)日: | 2017-11-28 |
发明(设计)人: | 张勇强;陈金山;骆光雨 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | H04R29/00 | 分类号: | H04R29/00 |
代理公司: | 北京同达信恒知识产权代理有限公司11291 | 代理人: | 黄志华 |
地址: | 100085 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声控 信息 检测 方法 电子设备 | ||
技术领域
本发明涉及电子技术领域,尤其涉及一种声控信息检测方法及电子设备。
背景技术
人们在语音通信过程中不可避免地收到来自周围环境的噪声、传输媒质进入的噪声、通信设备内部的噪声乃至其他说话者的干扰。这些干扰噪声使得接收到语音已不是纯净的原始语音信号,而是受污染的带噪语音信号。语音中噪声的存在不仅影响人的厅局,而且会是语音处理系统的性能急剧下降。例如,语音识别已经取得重大进展,但是目前的语音识别系统大都是在无噪声的环境中工作,在有噪声的环境尤其是强噪声环境下,语音识别系统的性能会严重下降。
当语音环境中有多个说话者时,麦克风接收到的是多个语音信号和环境噪声的混叠,这时仅利用语音增强方法无法提取出所需要的语音。如何从混淆语音信号中提取出源语音信号,这就是语音分离的问题。人的听觉系统可在多个讲话者的环境中区分和跟踪自己感兴趣的语音信号,并分辨出自己所需要的声音,这种分辨能力是人体内部语音理解机理所特有的一种感知能力,也就是人类的语音分离能力,称为“鸡尾酒会效应”。在语音和听觉信号处理领域中,如何从多个说话者的混淆语音信号中分离出各个语音源信号或者是提取出人们感兴趣的目标语音,来模仿人类的语音分离能力,成为一个重要的研究问题,这也是语音信号处理中的一个重要研究方向,对语音识别、语音增强等都有非常积极的促进意义。
在多人交互的使用场景中,某些人机交互的应用场景需要以语音为主要交互方式,而且需要知道输入语音是从哪个方向发出的。例如有一个多人交互的游戏,需要能够更完整的模拟声控操作,例如,需要确定声音的声量大小以及声源所处的空间位置。现有技术中提供一种确定声源位置的方案,即利用麦克阵列检测某一平面上的声音方向。但是麦克阵列的方式只能在一个平面上确定声音与检测设备之间的距离,所以检测结果并不能完整的模拟到一个声音操作所要达到的效果。
发明内容
本发明提供一种声控信息检测方法及电子设备,本发明所提供的方法和装置解决现有技术中声音定位的方案,只能在一个平面上确定声音与检测设备之间的距离,所以检测结果并不能完整的模拟到一个声音操作的问题。
本发明提供一种声控信息检测方法,该方法应用于一电子设备中,该电子设备内设置至少三个麦克风,所述至少三个麦克风设置于所述电子设备的不同侧面,所述至少三个麦克风两两组合形成不同方位的多个麦克阵列,该方法包括:
根据麦克阵列检测到的声音信息确定声源相对于麦克阵列的空间位置;
根据所述声源的空间位置确定与声源对应的空间矢量,获取所述空间矢量对应的声控操作指令。
更优化的方案,当检测到多个声源信息,获取所述空间矢量对应的声控操作指令包括:
将多个声源所对应的空间矢量进行矢量叠加,得到叠加矢量;
获取所述叠加矢量对应的声控操作指令。
更优化的方案,根据所述声源的空间位置确定与声源对应的空间矢量包括:
在每个麦克阵列所形成的检测平面中,根据麦克阵列检测到的声音信息确定声源与麦克阵列的距离值以及第一方位;
根据所述距离值以及第一方位确定声源在每个麦克阵列中形成的分矢量;
获取每个声源在多个检测平面所形成的分矢量,将多个分矢量进行矢量叠加生成声源对应的空间矢量。
更优化的方案,根据麦克阵列检测到的声音信息确定声源与麦克阵列的距离值以及第一方位包括:
根据麦克阵列中每个麦克接收到的声音信息,确定声源发出的声音到麦克阵列的时延值,根据所述时延值确定声源与麦克阵列的距离值以及所述声源相对于麦克阵列的第一方位。
更优化的方案,根据麦克阵列检测到的声音信息确定声源相对于麦克阵列的空间位置包括:
检测所述声源到达麦克阵列中每个麦克风的时间差;
根据所述时间差确定所述声源的空间位置。
根据上述方法,本发明还提供一种电子设备,该电子设备内设置至少三个麦克风,所述至少三个麦克风设置于所述电子设备的不同侧面,所述至少三个麦克风两两组合形成不同方位的多个麦克阵列,该电子设备还包括:
空间位置检测单元,用于根据麦克阵列检测到的声音信息确定声源相对于麦克阵列的空间位置;
声控操作单元,用于根据所述声源的空间位置确定与声源对应的空间矢量,获取所述空间矢量对应的声控操作指令。
更优化的方案,当检测到多个声源信息,声控操作单元获取所述空间矢量对应的声控操作指令包括:
将多个声源所对应的空间矢量进行矢量叠加,得到叠加矢量;
获取所述叠加矢量对应的声控操作指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210497151.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:集群通信中的声音信号处理方法和装置
- 下一篇:一种跨屏互动控制方法及装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置