[发明专利]声纹识别方法无效

专利信息
申请号: 201110167146.1 申请日: 2011-06-21
公开(公告)号: CN102623008A 公开(公告)日: 2012-08-01
发明(设计)人: 吴丽丽 申请(专利权)人: 中国科学院苏州纳米技术与纳米仿生研究所
主分类号: G10L15/02 分类号: G10L15/02;G10L15/04;G10L15/06;G10L17/00
代理公司: 苏州广正知识产权代理有限公司 32234 代理人: 张利强
地址: 215123 江苏省苏州市*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 声纹 识别 方法
【说明书】:

技术领域

发明涉及声纹识别领域。     

背景技术

说话人识别和指纹,虹膜,人脸识别等一样,属于生物识别的一种,被认为是最自然的生物特征识别身份鉴定方式,又称“声纹”识别。说话人识别具有采集设备简单,系统价格低廉,容易被人们接受等优点。门禁系统、保险柜、个人设备(汽车、电脑、手机、PDA等)使用权限控制等使用场合,文本相关的说话人确认方法,可以通过说话人语音生物特征和语音内容双方面进行验证,同时短语音即可实现学习和测试过程,具有突出的应用优势。

说话人识别的基本过程为语音采集,特征提取,分类模型。常见的语音特征提取方法是利用语音的短时平稳特性,采用美倒谱变换(MFCC)方法将语音转换为语音特征点集。之后经过学习过程对说话人语音进行建模得到说话人的分类模型。隐马尔可夫模型(HMM)是目前公认的在文本相关的说话人识别中效果最好的建模方法。HMM一方面用隐含的状态对应于声学层相对稳定的发音单位,并通过状态转移和状态驻留来描述发音的变化;另一方面它引入了概率统计模型,用概率密度函数计算语音参数对HMM模型的输出概率,通过搜索最佳状态序列,以最大后验概率为准则找到识别结果。但其存在几个问题:(1)需要更多学习样本。(2)计算复杂度高。(3)得到的模型数据量大。对于资源有限的嵌入式系统,以上问题,限制了算法的使用。因此需要一种新的方法解决上述问题。

发明内容

为了克服现有技术存在的不足,本发明的目的在于提供一种计算量小、识别率好、数据量小的声纹识别方法。

为达到以上目的,本发明提供了一种声纹识别方法,包括如下步骤:

1)语音特征空间建立步骤,将不同背景、不同人声的语音分割为特定长度的语音段,每个语音段做特征变换后得到语音特征点,所有语音段的语音特征点构成语音特征空间;

2)子空间划分步骤,将语音特征空间划分成复数个子空间,划分后的子空间用数据描述,并对各个子空间进行编号,记录每个子空间的数据描述和其对应的序号;

3)训练语句特征提取步骤,将语句经过特征变换得到时序特征点集,每个特征点按照最近邻原则分配入各个子空间,记录每个特征点对应子空间的序号,记录该序号组成的序列,该序列记录为训练语句特征;

4)测试语句特征提取步骤,将语句经过特征变换得到时序特征点集,每个特征点按照最近邻原则分配入各个子空间,记录每个特征点对应子空间的序号,记录该序号组成的序列,该序列记录为测试语句特征;

5)声纹识别步骤,对比训练语句特征与测试语句特征是否相似。

本发明的进一步改进在于,所述的特征变换为美倒谱变换。

本发明的进一步改进在于,所述的美倒谱变换中将语音分割为20ms一帧,10ms帧移取出语音帧,以帧为单位去掉静音,对语音帧作美倒谱变换后,每帧留12个系数,该12个系数构成语音特征点。

本发明的进一步改进在于,所述的步骤2)中采用“K-均值”算法将语音特征空间划分成数个子空间,划分后的数个子空间分别以“K-均值”的中心点记录为该子空间的数据描述。

本发明的进一步改进在于,所述的步骤3)和步骤4)还包括语句特征压缩步骤,将训练语句特征以及测试语句特征的数据进行压缩。

本发明的进一步改进在于,所述的语句特征压缩步骤为:记录子空间的序号以及相同序号的数量,将序号和相同序号的数量作为一组数据进行排列,当相同序号的数量为1时,去掉该组数据,当去掉该组数据后,该数据前方一组数据中的序号和后方一组数据中的序号相同时,则将两组合并,新形成的数据组中,序号为与合并前相同的序号,相同序号的数量为前方一组数据的数量与后方一组数据数量之和。

本发明的有益效果是: 经过上述方法将语音的连续性信息对应为空间标号序列,利用数据量较少的标号序列作为说话人的相似性特征,通过该方法获得的特征数据量小,具有代表性,只需要进行数字序列比对即可得到确认结果,具有计算量小,节省存储资源等优点,克服了基于概率统计的建模方法存在的问题,适合于系统资源有限的嵌入式系统使用。

附图说明

图1本发明一种声纹识别方法语音特征空间建立的流程示意图;

图2本发明一种声纹识别方法特征空间划分流程示意图;

图3本发明一种声纹识别方法中语句特征提取的流程示意图;

图4 本发明一种声纹识别方法中数字序列压缩流程示意图;

图5 本发明一种声纹识别方法的流程示意图。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院苏州纳米技术与纳米仿生研究所,未经中国科学院苏州纳米技术与纳米仿生研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110167146.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top