[发明专利]一种智能语音处理方法有效

专利信息
申请号: 201410081493.6 申请日: 2014-03-05
公开(公告)号: CN103811020A 公开(公告)日: 2014-05-21
发明(设计)人: 王义;魏阳杰;陈瑶;关楠 申请(专利权)人: 东北大学
主分类号: G10L21/0272 分类号: G10L21/0272;G10L15/07
代理公司: 沈阳东大知识产权代理有限公司 21109 代理人: 梁焱
地址: 110819 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 智能 语音 处理 方法
【说明书】:

技术领域

发明属于信息处理技术领域,具体涉及一种智能语音处理方法。

背景技术

据2013年世界卫生组织(WHO)发布的最新评估数据显示,全球目前共有3.6亿人存在不同程度的听力障碍,占全球总人口的5%。助听产品的使用可以有效地补偿听力障碍患者的听力损失,提高他们的生活和工作质量。然而,当今助听系统相关技术的研究仍然集中在噪声抑制和源声音幅值放大两个方面,很少涉及到基于声音特征的建模和多声源自动分离技术。当实际应用场景非常复杂时,例如:聚会时,多个说话人同时发声,甚至是伴有音乐等背景声音,由于助听系统无法从混合后的声音输入中分离出感兴趣的声音对象,简单的声音强度扩大功能只能增加使用者的听力负担甚至伤害,不会带来有效的声音输入和理解。因此,针对当前助听系统的技术缺陷,设计一款具有特定声音对象识别功能的、更加智能化和个性化的新型助听系统,具有非常重要的意义。

发明内容

针对现有技术存在的不足,本发明提出一种智能语音处理方法,以达到保证用户根据自己的需求获得纯净的声音接收和放大,实现助听系统的智能化、互动化和个性化的目的。

一种智能语音处理方法,包括以下步骤:

步骤1、采集样本语音段构建样本语音库,对样本语音进行特征提取,获得特征参数,并对特征参数进行训练;

具体过程如下:

步骤1-1、采集样本语音段,将采集的语音段进行离散化处理,提取语音信号的梅尔频率倒谱系数作为语音信号特征参数,并建立高斯混合模型;

模型公式如下:

p(XIG)=Σi=1Mpibi(X)---(1)]]>

其中,p(XIG)表示样本语音特征参数在模型参数为G的模型中的概率;

G表示高斯混合模型参数集,G={pi,μi,∑i},i=1,2,...,I;

I表示高斯混合模型中单一高斯模型个数;

pi表示第i个单一高斯模型的权重系数,

μi表示第i个单一高斯模型的均值矢量;

i表示第i个单一高斯模型的协方差矩阵;

X表示样本语音特征参数,X={x1,x2,...,xT},T表示特征向量的个数;

bi(X)表示第i个单一高斯模型的密度函数,bi(X)=N(μi,∑i),N(.)表示标准高斯分布的密度函数;

步骤1-2、利用语音信号特征参数训练高斯混合模型;

即采用k均值聚类算法对语音信号特征参数进行聚类,获得高斯混合模型参数集初始值G0={pi0,μi0,∑i0},i=1,2,...,I;并根据获得的高斯混合模型参数集初始值,采用最大期望算法对模型进行估计,进而获得高斯混合模型参数,即完成特征参数的训练;

步骤2、采用M个麦克风组成的麦克风阵列采集被测环境音频信号,确定该环境声音源个数和每个声音源波束到达的方向,即声源到麦克风阵列的入射角度;

具体过程如下:

步骤2-1、采用M个麦克风组成的麦克风阵列采集被测环境的混合音频信号,并对采集的混合音频信号进行离散化处理,获得每个采样点的幅值;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410081493.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top