[发明专利]利用线性麦克风阵列的语音识别方法及系统有效
申请号: | 201611202169.0 | 申请日: | 2016-12-23 |
公开(公告)号: | CN106710603B | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 贺来朋 | 申请(专利权)人: | 云知声(上海)智能科技有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L15/20 |
代理公司: | 上海唯源专利代理有限公司 31229 | 代理人: | 曾耀先 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种利用线性麦克风阵列的语音识别方法,包括如下步骤:利用线性麦克风阵列录制环境的声音以形成音频数据;针对线性麦克风阵列前方的声音获取区域设置波束形成器,利用波束形成器于声音获取区域形成位于中部的主波束区域和位于两侧部的第一噪声波束区域和第二噪声波束区域;将音频数据输入到波束形成器中以获得对应主波束区域的主波束、对应第一噪声波束区域的第一噪声波束、以及对应第二噪声波束区域的第二噪声波束;从主波束中滤除第一噪声波束和第二噪声波束以得到待识别的语音数据;对待识别的语音数据进行语音识别以得到对应的文本数据并输出。本发明计算量小,获取的语音数据质量高,能够提高语音识别的准确率。 | ||
搜索关键词: | 噪声波束 麦克风阵列 语音识别 主波束 波束形成器 语音数据 声音获取 音频数据 区域设置 区域形成 文本数据 计算量 准确率 滤除 录制 输出 | ||
【主权项】:
1.一种利用线性麦克风阵列的语音识别方法,其特征在于,所述方法包括如下步骤:利用线性麦克风阵列录制环境的声音以形成音频数据;针对所述线性麦克风阵列前方的声音获取区域设置波束形成器,利用所述波束形成器于所述声音获取区域形成位于中部的主波束区域和位于两侧部的第一噪声波束区域和第二噪声波束区域;将所述音频数据输入到所述波束形成器中以获得对应所述主波束区域的主波束、对应所述第一噪声波束区域的第一噪声波束、以及对应所述第二噪声波束区域的第二噪声波束;从所述主波束中滤除所述第一噪声波束和所述第二噪声波束以得到待识别的语音数据;对所述待识别的语音数据进行语音识别以得到对应的文本数据并输出;所述声音获取区域包括角度从0°至180°的平面区域,针对所述线性麦克风阵列前方的声音获取区域设置波束形成器,包括:设置用于形成所述第一噪声波束区域的第一波束形成器,将所述第一波束形成器所形成的波束的中心指向所述声音获取区域的20°方向;设置用于形成所述主波束区域的第二波束形成器,将所述第二波束形成器所形成的波束的中心指向所述声音获取区域的90°方向;设置用于形成所述第二噪声波束区域的第三波束形成器,将所述第三波束形成器所形成的波束的中心指向所述声音获取区域的160°方向;设置波束形成器时,每一波束形成器中设置有与所述线性麦克风阵列中的每一麦克风对应连接的滤波器,采用固定波束成形算法为每一波束形成器中的滤波器计算滤波器系数;所述固定波束成形算法包括:yn(k)=xn(k)+vn(k),n=1,2,...,N (式一)![]()
![]()
![]()
![]()
![]()
在式一中,yn(k)是第n个麦克风采集到的音频数据,xn(k)和vn(k)分别是采集到的期望信号和加性噪声;式二中,
是波束形成器的输出,将波束形成器的输出逼近线性麦克风阵列中某个麦克风接收到的期望信号,
是第n个麦克风对应的滤波器系数;在式三中,em(k)表示波束形成器的输出信号与采集到的期望信号的误差,它等于期望信号的误差ex,m(k)与加性噪声的误差ev,m(k)的和;而期望信号的误差ex,m(k)与加性噪声的误差ev,m(k)可以用式四和式五来表示;基于最小化均方误差得到式六和式七,通过最小化
以令加性噪声最小,结合约束ex,m(k)=0以得出最佳滤波器系数hm,o,其中的hm为波束形成器中所有滤波器对应的滤波器系数矩阵,hm,o为波束形成器中所有滤波器对应的最佳的滤波器系数值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声(上海)智能科技有限公司,未经云知声(上海)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611202169.0/,转载请声明来源钻瓜专利网。
- 上一篇:文件处理方法及装置
- 下一篇:一种低成本高容量全固态锂离子电池的制备方法