[发明专利]一种用于家庭环境的基于传声器阵列的音频输入系统有效
| 申请号: | 201010622896.9 | 申请日: | 2010-12-29 |
| 公开(公告)号: | CN102164328A | 公开(公告)日: | 2011-08-24 |
| 发明(设计)人: | 付强;国雁萌;应东文;李凯;姜开宇;颜永红 | 申请(专利权)人: | 中国科学院声学研究所 |
| 主分类号: | H04R1/40 | 分类号: | H04R1/40;H04R3/00;G10L21/02 |
| 代理公司: | 北京法思腾知识产权代理有限公司 11318 | 代理人: | 杨小蓉;高宇 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 家庭 环境 基于 传声器 阵列 音频 输入 系统 | ||
技术领域
本发明涉及一种建立在传声器(又称,麦克风)阵列基础上的可以与电视机配套的音频交互系统的输入前端处理方法,具体涉及一种用于家庭环境的基于传声器阵列的音频输入系统/。
背景技术
随着网络的宽带化和家庭网关的普及,以电视机为终端的家庭高清通信和人机交互业务在未来的几年会大量涌现。在市场上,互联网电视的概念从近两年起,已被国内外厂商广泛接受并大量推出相关产品;家庭网关产品随着三网融合的进度加快,更是方兴未艾。而与之相关的高清音频和交互业务却还未取得突破。
电视机做为家庭客厅的中心,也将成为家庭通信和交互的主要终端。而随着宽带业务的增多,如何实现简单直接的人机交互也将成为重要的问题。很显然,通过语音的交互和通信仍然是最自然的方式。人们可以坐在沙发上说话,就能进行可视电话、对电视机进行操作控制、搜索所需信息等业务,不必借助键盘等其他设备等。在语音的输入模式上,以自然的方式提供高信噪比的信号始终是追求的目标。近讲模式的方案,包括耳麦、蓝牙耳机等,虽然能满足高信噪比的输入要求,但仍不是自然的通信模式。随着传输带宽的迅速增加,视频信息的高清化已不是问题,将为视觉感受带来全新的体验。与此同时,高清语音(High Definition Voice)概念的提出,也从听觉角度提出了新的要求。要达到高清语音的效果,不仅仅是编码带宽的增加,即从300-3400Hz扩展到50-7000Hz,而且是一个端到端的概念,即从语音的输入、编码、传输到回放全程的每个环节都需要考虑信号的清晰性和真实性。
随着自动语音识别(ASR)技术的日益成熟,语音人机交互在商业活动和日常生活中的应用逐渐广泛起来。然而,在家庭环境中,ASR技术面临的主要问题之一其在背景干扰、通道失真以及房间混响等复杂环境下的鲁棒性问题还未得到有效的解决。为克服这些因素的影响,目前大多数语音识别系统的解决方案是为用户佩戴靠近嘴边的近讲(close-talk)传声器来提高信噪比。显然,对这种不自然的方式的依赖限制了语音识别技术更广泛地进入日常生活中。
基于多声学信源,如传声器阵列等,的前端处理技术,由于其“空间滤波”特性,为改善或解决这一问题提供了一个良好的途径。国际上,对此问题的研究尚属于较新的领域,大多数的应用集中于车内和房间内的抗噪问题,在研究方法上,主要以波束形成、谷点形成和盲分离为主。
发明内容
本发明的目的在于,克服了近讲(close-talk)传声器带来的不便,为家庭环境中的电视机提供了远讲模式下的高信噪比音频输入系统,即一种用于家庭环境的的基于传声器阵列的音频输入系统。
本发明提出一种基于波束形成的传声器阵列音频输入系统,该系统用于家庭网络,其特征在于,所述的输入系统采用安放在家庭客厅中的电视机所处周边位置,或者内嵌于电视机内的传声器阵列接受来自用户的音频输入,具体包含:
传声器阵列,包含若干传声器阵元用于家庭客厅环境中提取多通道音频信号;
波束形成模块,用于实现目标方向语音定向增强,同时抵制来自其它方向的声源;目标方向可以人为指定,也可以由声源定位模块自动给出;
声源定位模块,用来在噪声背景下确定目标声源的具体位置,为波束形成提供声源位置信息;
目标语音检测模块,依据传声器阵列采集的各通道信号的幅度和相位信息,分析确定目标方向的明显声源,依据确定的目标方向的明显声源信号判断出目标语音段的起止端点,从而实现对目标方向语音信号的端点检测;
回波抵消模块,用于去除电视扬声器的声信号;
后滤波模块,用于消除不相关的扩散背景噪声。
上述技术方案中,所述的波束形成模块的空间滤波包括两类方法:第一类为固定波束形成,采用一组经优化的滤波器以增强处于某特定方向的声源,同时尽可能地抵制来自其他方向的声源;第二类波束形成算法为自适应波束形成,其滤波器系数随输入数据的变化和发生改变。所述的固定波束形成算法包含:延迟相加、超指向性及差分阵列。
上述技术方案中,所述的传声器阵列采用全指向传声器或采用单指向传声器,所述的传声器阵列的拓扑结构为线性一字阵。
本发明基于传声器阵列的音频输入系统还提供了一种基于盲分离的传声器阵列音频输入系统,该系统用于家庭网络,其特征在于,所述的输入系统采用安放在家庭客厅中的电视机所处周边位置,或者内嵌于电视机内的传声器阵列接受来自用户的音频输入,具体包含:
传声器阵列,包含若干传输器阵元,用于从电视机所在的环境中提取多通道音频信号;
回波抵消模块,用于去除电视扬声器的声信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010622896.9/2.html,转载请声明来源钻瓜专利网。





