[发明专利]一种语音信号特征波形的非负矩阵分解方法无效
申请号: | 200610012296.4 | 申请日: | 2006-06-16 |
公开(公告)号: | CN1862661A | 公开(公告)日: | 2006-11-15 |
发明(设计)人: | 鲍长春;张鹏 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00 |
代理公司: | 北京思海天达知识产权代理有限公司 | 代理人: | 张慧 |
地址: | 100022*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种语音信号特征波形的非负矩阵分解方法,属于语音信号处理领域。用非负矩阵分解技术来分解语音信号特征波形的基本思想是:首先对语音特征波形按照语音信号的基音周期(pitch)的大小分为9类,对每类特征波形都按照标准的非负矩阵分解的迭代方法训练出基矩阵W,然后对给定的一帧特征波形,首先按照其基音周期的大小归类,然后取出对应于该类特征波形的已经训练好的基矩阵W,再通过迭代方法获得对应于该帧特征波形的编码矩阵H,至此,该帧特征波形已经近似被分解为基矩阵W和编码矩阵H的乘积。本发明的分解方法具有不会带来额外延时、分解精度比较高、计算复杂度比较低的优点,同时起到了数据压缩的目的。 | ||
搜索关键词: | 一种 语音 信号 特征 波形 矩阵 分解 方法 | ||
【主权项】:
1、一种语音信号特征波形的非负矩阵分解方法,其特征在于,该方法是按以下步骤进行的:A、训练基矩阵W1)首先对语音特征波形按照该帧语音信号的基音周期,即pitch的大小分为9类,如下所示:第1类 20≤pitch<30第2类 30≤pitch<40第3类 40≤pitch<50第4类 50≤pitch<60第5类 60≤pitch<70第6类 70≤pitch<80第7类 80≤pitch<90第8类 90≤pitch<100第9类 100≤pitch≤1202)然后对第一类特征波形选取10000帧左右的实验样本,组成矩阵V,按照标准的非负矩阵分解的迭代方法,训练出基矩阵W,具体步骤如下:(1)对该类特征波形选取10000帧左右的实验样本,构成矩阵V;(2)设置最大迭代次数为N次,N的取值大于10;设置分解阶数为M,M的取值为8~32之间的整数,“分解阶数”这个概念沿用了标准非负矩阵分解方法提出时Seung和Lee所使用的提法,分解阶数设置为M就是说把基矩阵W的列维数设为M;(3)用在[0,1]之间均匀分布的随机数,初始化W、H矩阵中的所有元素;(4)对矩阵W的每一列进行归一化,即每列中的每一个元素都除以该列所有元素的和;(5)设置当前迭代次数为1;(6)如果当前迭代次数小于或者等于最大迭代次数N,则转(7),否则转(8);(7)更新编码矩阵H,随后更新基矩阵W,两个矩阵的更新方式如下,然后把当前迭代次数增加1,转(6);H aμ ← H aμ Σ i W ia V iμ ( WH ) iμ - - - ( 1 ) ]]>H ia ← H ia Σ μ V iμ ( WH ) iμ H aμ - - - ( 2 ) ]]>H ia ← W ia Σ j W ja - - - ( 3 ) ]]> 上述(1)式中所涉及的符号说明如下:(a)Haμ表示矩阵H的第a行第μ列的元素;(b)Wia表示矩阵W的第i行第a列的元素;(c)Viμ表示矩阵V的第i行第μ列的元素;(d)(WH)iμ表示矩阵W与矩阵H相乘后所得矩阵的第i行第μ列的元素;(e)
表示矩阵V的第i行第μ列的元素除以矩阵W与矩阵H相乘后所得矩阵的第i行第μ列的元素;(f)
表示对所有不同的i和μ由
所计算出的所有元素所构成的矩阵中的第μ列,跟W矩阵的第a列,作向量内积;(g)“←”符号表示把“←”右边的矩阵元素赋给“←”左边对应位置的矩阵元素,即完成了H矩阵各个元素的“更新”操作。上述(2)式中所涉及的符号说明如下:(a)Wia表示矩阵W的第i行第a列的元素;(b)Haμ表示矩阵H的第a行第μ列的元素;(c)Viμ表示矩阵V的第i行第μ列的元素;(d)(WH)iμ表示矩阵W与矩阵H相乘后所得矩阵的第i行第μ列的元素;(e)
表示矩阵V的第i行第μ列的元素除以矩阵W与矩阵H相乘后所得矩阵的第i行第μ列的元素;(f)
表示对所有不同的i和μ由
所计算出的所有元素所构成的矩阵中的第i行,跟H矩阵的第a行,作向量内积;(g)“←”符号表示把“←”右边的矩阵元素赋给“←”左边对应位置的矩阵元素,即完成了W矩阵各个元素的“更新”操作。上述(3)式中所涉及的符号说明如下:(a)Wia表示矩阵W的第i行第a列的元素;(b)
表示矩阵W第a列的所有元素求和;(c)
表示矩阵W第i行第a列的元素除以矩阵W第a列所有元素的和;(d)“←”符号表示把“←”右边的矩阵元素赋给“←”左边对应位置的矩阵元素,即完成了W矩阵各个元素的“归一化”操作。(8)结束循环,并保存基矩阵W。3)重复上述方法,分别获得第2~9类特征波形的基矩阵W,总共获得9个分别对应于不同类特征波形的基矩阵;B、获得某一帧给定的特征波形的编码矩阵Ha、对某一帧给定的特征波形,首先根据该帧特征波形按照基音周期的大小分为9类,分类方法和步骤1)中分法相同;b、然后从已经训练好的9个基矩阵中取出对应于该类特征波形的基矩阵W,最后应用现有的非负矩阵分解方法,获得编码矩阵H,获得编码矩阵H的具体步骤如下:(1)把该帧特征波形,视为矩阵V;(2)设置分解阶数为M,M的取值为8~32之间的整数,设置最大迭代次数为10次;(3)用在[0,1]之间均匀分布的随机数,初始化H矩阵中的所有元素;(4)设置当前迭代次数为1;(5)如果当前迭代次数小于或者等于最大迭代次数N,N的取值大于10次,则转(6),否则转(7);(6)更新编码矩阵H,更新方式如下式,然后把当前迭代次数增加1,转(5);H aμ ← H aμ Σ i W ia V iμ ( WH ) iμ - - - ( 4 ) ]]> (4)式中所涉及的符号说明如下:(a)Haμ表示矩阵H的第a行第μ列的元素;(b)Wia表示矩阵W的第i行第a列的元素;(c)Viμ表示矩阵V的第i行第μ列的元素;(d)(WH)iμ表示矩阵W与矩阵H相乘后所得矩阵的第i行第μ列的元素;(e)
表示矩阵V的第i行第μ列的元素除以矩阵W与矩阵H相乘后所得矩阵的第i行第μ列的元素;(f)
表示对所有不同的i和μ由
所计算出的所有元素所构成的矩阵中的第μ列,跟W矩阵的第a列,作向量内积;(g)“←”符号表示把“←”右边的矩阵元素赋给“←”左边对应位置的矩阵元素,即完成了H矩阵各个元素的“更新”操作;(7)结束循环,并保存编码矩阵H;至此,该帧特征波形V,被近似的分解成了两个非负矩阵W、H的乘积,即V≈W×H。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200610012296.4/,转载请声明来源钻瓜专利网。