[发明专利]声纹识别方法无效

申请号：	201110167146.1	申请日：	2011-06-21
公开（公告）号：	CN102623008A	公开（公告）日：	2012-08-01
发明（设计）人：	吴丽丽	申请（专利权）人：	中国科学院苏州纳米技术与纳米仿生研究所
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/04;G10L15/06;G10L17/00
代理公司：	苏州广正知识产权代理有限公司 32234	代理人：	张利强
地址：	215123 江苏省苏州市***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声纹识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及声纹识别领域。

背景技术

说话人识别和指纹，虹膜，人脸识别等一样，属于生物识别的一种，被认为是最自然的生物特征识别身份鉴定方式，又称“声纹”识别。说话人识别具有采集设备简单，系统价格低廉，容易被人们接受等优点。门禁系统、保险柜、个人设备（汽车、电脑、手机、PDA等）使用权限控制等使用场合，文本相关的说话人确认方法，可以通过说话人语音生物特征和语音内容双方面进行验证，同时短语音即可实现学习和测试过程，具有突出的应用优势。

说话人识别的基本过程为语音采集，特征提取，分类模型。常见的语音特征提取方法是利用语音的短时平稳特性，采用美倒谱变换（MFCC）方法将语音转换为语音特征点集。之后经过学习过程对说话人语音进行建模得到说话人的分类模型。隐马尔可夫模型（HMM）是目前公认的在文本相关的说话人识别中效果最好的建模方法。HMM一方面用隐含的状态对应于声学层相对稳定的发音单位，并通过状态转移和状态驻留来描述发音的变化；另一方面它引入了概率统计模型，用概率密度函数计算语音参数对HMM模型的输出概率，通过搜索最佳状态序列，以最大后验概率为准则找到识别结果。但其存在几个问题：（1）需要更多学习样本。（2）计算复杂度高。（3）得到的模型数据量大。对于资源有限的嵌入式系统，以上问题，限制了算法的使用。因此需要一种新的方法解决上述问题。

发明内容

为了克服现有技术存在的不足，本发明的目的在于提供一种计算量小、识别率好、数据量小的声纹识别方法。

为达到以上目的，本发明提供了一种声纹识别方法，包括如下步骤：

1）语音特征空间建立步骤，将不同背景、不同人声的语音分割为特定长度的语音段，每个语音段做特征变换后得到语音特征点，所有语音段的语音特征点构成语音特征空间；

2）子空间划分步骤，将语音特征空间划分成复数个子空间，划分后的子空间用数据描述，并对各个子空间进行编号，记录每个子空间的数据描述和其对应的序号；

3）训练语句特征提取步骤，将语句经过特征变换得到时序特征点集，每个特征点按照最近邻原则分配入各个子空间，记录每个特征点对应子空间的序号，记录该序号组成的序列，该序列记录为训练语句特征；

4）测试语句特征提取步骤，将语句经过特征变换得到时序特征点集，每个特征点按照最近邻原则分配入各个子空间，记录每个特征点对应子空间的序号，记录该序号组成的序列，该序列记录为测试语句特征；

5）声纹识别步骤，对比训练语句特征与测试语句特征是否相似。

本发明的进一步改进在于，所述的特征变换为美倒谱变换。

本发明的进一步改进在于，所述的美倒谱变换中将语音分割为20ms一帧，10ms帧移取出语音帧，以帧为单位去掉静音，对语音帧作美倒谱变换后，每帧留12个系数，该12个系数构成语音特征点。

本发明的进一步改进在于，所述的步骤2）中采用“K-均值”算法将语音特征空间划分成数个子空间，划分后的数个子空间分别以“K-均值”的中心点记录为该子空间的数据描述。

本发明的进一步改进在于，所述的步骤3）和步骤4）还包括语句特征压缩步骤，将训练语句特征以及测试语句特征的数据进行压缩。

本发明的进一步改进在于，所述的语句特征压缩步骤为：记录子空间的序号以及相同序号的数量，将序号和相同序号的数量作为一组数据进行排列，当相同序号的数量为1时，去掉该组数据，当去掉该组数据后，该数据前方一组数据中的序号和后方一组数据中的序号相同时，则将两组合并，新形成的数据组中，序号为与合并前相同的序号，相同序号的数量为前方一组数据的数量与后方一组数据数量之和。

本发明的有益效果是: 经过上述方法将语音的连续性信息对应为空间标号序列，利用数据量较少的标号序列作为说话人的相似性特征，通过该方法获得的特征数据量小，具有代表性，只需要进行数字序列比对即可得到确认结果，具有计算量小，节省存储资源等优点，克服了基于概率统计的建模方法存在的问题，适合于系统资源有限的嵌入式系统使用。

附图说明

图1本发明一种声纹识别方法语音特征空间建立的流程示意图；

图2本发明一种声纹识别方法特征空间划分流程示意图；

图3本发明一种声纹识别方法中语句特征提取的流程示意图；

图4 本发明一种声纹识别方法中数字序列压缩流程示意图；

图5 本发明一种声纹识别方法的流程示意图。

具体实施方式

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院苏州纳米技术与纳米仿生研究所，未经中国科学院苏州纳米技术与纳米仿生研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201110167146.1/2.html，转载请声明来源钻瓜专利网。