首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]基于SVM和HMM混合模型的男女说话声音分类方法无效

申请号：	201210541542.0	申请日：	2012-12-13
公开（公告）号：	CN103871413A	公开（公告）日：	2014-06-18
发明（设计）人：	王雷	申请（专利权）人：	上海八方视界网络科技有限公司
主分类号：	G10L17/14	分类号：	G10L17/14
代理公司：	上海申新律师事务所 31272	代理人：	袁亚军
地址：	200941 上海市宝***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 svm hmm 混合模型男女说话声音分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本方法属于语音音频处理技术领域，具体涉及一种基于SVM和HMM混合模型的男女说话声音分类方法。

背景技术

近年来，机器识别人的性别成为了一项研究热点，采用的方法很多，比如人脸、语音等。基于人脸的性别识别有一个缺陷：当光照条件不充分的时候，该方法的识别率会明显降低。

而语音是人类最自然、有效的交流方法。语音性别识别涉及的领域广泛主要包括：信号处理、人工智能、模式识别、声学、语言学、电子技术、通讯理论、神经生理学和神经心理学等众多学科。如何让机器识别人的性别，从而做出更加智能的反应，成为下一代计算机研究的目标。

目前已有的语音性别识别方法很多，比较突出的有：基于隐马尔科夫模型(HMM)的性别识别方法和基于支持向量机(SVM)的性别识别方法。HMM和SVM侧重点不同，HMM处理连续信号更优，但类别区分能力较弱；SVM更适合分类，但具有只适合少量样本和训练时间长等缺点。

发明内容

本发明克服了现有技术的不足，提供一种基于SVM和HMM混合模型的男女说话声音分类方法，使用机器通过学习以达到区分说话人性别的目的。

考虑到现有技术的上述问题，根据本发明的一个方面，为解决上述的技术问题，本发明采用以下技术方案：

一种基于SVM和HMM混合模型的男女说话声音分类方法，包括：

训练阶段，所述训练阶段通过收集基因频率样本，提取样本特征参数，并将样本特征参数输入SVM训练，通过所述SVM训练得到有男女之分的特征矢量，并将该特征矢量以概率序列的方式输出，再将所述概率序列作为HMM的训练数据，通过HMM的训练得到至少得到两个HMM的参数；

识别阶段，所述识别阶段是指将待测语音文件输入到SVM的分类器中，以得到一个特征序列，将得到的特征序列分别输入至少得到两个HMM参数中算出概率，把最大概率值对应的模型作为识别结果。

为了更好地实现本发明，进一步的技术方案是：

根据本发明的一个实施例，所述样本特征参数包括MFCC。

根据本发明的一个实施例，，对所述MFCC进行了二次特征提取获得它的加权特征和/或一阶/多阶微分特征。

根据本发明的一个实施例，还包括平均基因频率。

根据本发明的一个实施例，所述二次特征提取获得它的加权特征所使用到的加权系数采用如下升半正弦函数公式：

ri=0.5+0.5×sin(π×ip)]]>

其中i=0，1，至P-1，P为特征阶数，r_i为获得的加权系数。

根据本发明的一个实施例，所述二次特征提取获得它的一阶微分特征的方法是：

特征向量的一阶微分如下；

Featrue_d(j)_i=Featrue(j)_i-Featrue(j-1)_i

其中i=0，1，…P；J=1，2…，N，P为特征阶数，N为特征向量个数；Feature是原始的特征向量，Featured为原始特征向量的一阶微分；

在一阶微分基础之上，再进行一次微分，就可以得到特征向量的二阶微分；用公式表示为；

Featrue_d_d(j)_i=Featrue_d(j)_i-Featrue_d(j-1)_i

其中i=0，1，…P.J=1，2…，N，P为特征阶数，N为特征向量个数。

根据本发明的一个实施例，构造1个SVM分类器，把男性的训练样本标记为+1，女性的训练样本标记为-1，然后考虑到SVM的输出是距离符号+1或者-1，+1表示属于一类，-1表示属于另一类。

根据本发明的一个实施例，通过sigmoid函数把SVM的输出转换为概率序列。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海八方视界网络科技有限公司，未经上海八方视界网络科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210541542.0/2.html，转载请声明来源钻瓜专利网。

上一篇：氧的清除
下一篇：充气式车辆安全警示器

同类专利

专利分类

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top