[发明专利]基于SVM和HMM混合模型的男女说话声音分类方法无效

申请号：	201210541542.0	申请日：	2012-12-13
公开（公告）号：	CN103871413A	公开（公告）日：	2014-06-18
发明（设计）人：	王雷	申请（专利权）人：	上海八方视界网络科技有限公司
主分类号：	G10L17/14	分类号：	G10L17/14
代理公司：	上海申新律师事务所 31272	代理人：	袁亚军
地址：	200941 上海市宝***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 svm hmm 混合模型男女说话声音分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于SVM和HMM混合模型的男女说话声音分类方法，其特征在于，包括：

训练阶段，所述训练阶段通过收集基因频率样本，提取样本特征参数，并将样本特征参数输入SVM训练，通过所述SVM训练得到有男女之分的特征矢量，并将该特征矢量以概率序列的方式输出，再将所述概率序列作为HMM的训练数据，通过HMM的训练得到至少得到两个HMM的参数；

识别阶段，所述识别阶段是指将待测语音文件输入到SVM的分类器中，以得到一个特征序列，将得到的特征序列分别输入至少得到两个HMM参数中算出概率，把最大概率值对应的模型作为识别结果。

2.根据权利要求1所述的基于SVM和HMM混合模型的男女说话声音分类方法，其特征在于，所述样本特征参数包括MFCC。

3.根据权利要求2所述的基于SVM和HMM混合模型的男女说话声音分类方法，其特征在于，对所述MFCC进行了二次特征提取获得它的加权特征和/或一阶/多阶微分特征。

4.根据权利要求3所述的基于SVM和HMM混合模型的男女说话声音分类方法，其特征在于，还包括平均基因频率。

5.根据权利要求4所述的基于SVM和HMM混合模型的男女说话声音分类方法，其特征在于，所述二次特征提取获得它的加权特征所使用到的加权系数采用如下升半正弦函数公式获得：

ri=0.5+0.5×sin(π×ip)]]>

其中i=0，1，至P-1，P为特征阶数，r_i为获得的加权系数。

6.根据权利要求4所述的基于SVM和HMM混合模型的男女说话声音分类方法，其特征在于，所述二次特征提取获得它的一阶微分特征的方法是：

特征向量的一阶微分如下；

Featrue_d(j)_i=Featrue(j)_i-Featrue(j-1)_i

其中i=0，1，…P；J=1，2…，N，P为特征阶数，N为特征向量个数；Feature是原始的特征向量，Featured为原始特征向量的一阶微分；

在一阶微分基础之上，再进行一次微分，就可以得到特征向量的二阶微分；用公式表示为；

Featrue_d(j)_i=Featrue_d(j)_i-Featrue_d(j-1)_i

其中i=0，1，…P.J=1，2…，N，P为特征阶数，N为特征向量个数。

7.根据权利要求2-6任意一项所述的基于SVM和HMM混合模型的男女说话声音分类方法，其特征在于，构造1个SVM分类器，把男性的训练样本标记为+1，女性的训练样本标记为-1，然后考虑到SVM的输出是距离符号+1或者-1，+1表示属于一类，-1表示属于另一类。

8.根据权利要求7所述的基于SVM和HMM混合模型的男女说话声音分类方法，其特征在于，通过sigmoid函数把SVM的输出转换为概率序列。

9.根据权利要求8所述的基于SVM和HMM混合模型的男女说话声音分类方法，其特征在于，用HMM中的Baum-Welch算法估计参数，以完成了HMM1的训练并相应得到HMM1的参数，按照得到HMM1参数的方法，以此类推得到HMM2的参数。

10.根据权利要求9所述的基于SVM和HMM混合模型的男女说话声音分类方法，其特征在于，将所述识别阶段的特征序列分别输入到HMM1和HMM2中，利用HMM模型中的Viterbi计算出概率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海八方视界网络科技有限公司，未经上海八方视界网络科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210541542.0/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载