[发明专利]一种基于呼吸特征的说话人识别方法有效

专利信息
申请号: 201610626034.0 申请日: 2016-08-02
公开(公告)号: CN106297805B 公开(公告)日: 2019-07-05
发明(设计)人: 鲁力;刘玲霜 申请(专利权)人: 电子科技大学
主分类号: G10L17/02 分类号: G10L17/02;G10L17/06
代理公司: 成都弘毅天承知识产权代理有限公司 51230 代理人: 刘东
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于呼吸特征的说话人识别方法,该方法主要包括:输入未知语音片段,通过由梅尔频率倒谱系数MFCC建立的呼吸模板、过零率ZCR和短时能量E来提取未知语音片段中的呼吸音,然后利用消除虚假低谷的边界检测算法剔除呼吸音中的假阳性部分,得到精确分离后的呼吸音,最后利用精确分离后的呼吸音来辨别未知语音片段的说话人是否来自样本说话人以及判断未知语音片段的说话人是否为合法说话人。本发明首次实现了人体呼吸的独特性得到关注和研究,并被有效应用于说话人识别系统,克服了基于呼吸的说话人识别技术的开发利用面临的“呼吸信号的提取”和“呼吸信号处理”两大挑战。因而本发明提供的说话人识别系统简单高效,且识别结果准确可靠。
搜索关键词: 一种 基于 呼吸 特征 说话 识别 方法
【主权项】:
1.一种基于呼吸特征的说话人识别方法,其特征在于包括以下步骤:步骤1:输入呼吸样本集,对呼吸样本集进行分帧处理,得到呼吸帧,通过梅尔频率倒谱系数MFCC将呼吸帧建立为呼吸模板,并计算各呼吸样本集得到的呼吸帧与呼吸模板的相似度,得到其最小值Bm;步骤2:输入未知语音片段,对未知语音片段进行分帧处理,得到未知语音帧,计算每个未知语音帧与呼吸模板的相似度;计算未知语音帧的过零率ZCR以及未知语音帧的短时能量E;根据未知语音帧与呼吸模板的相似度、Bm、未知语音帧的过零率ZCR以及未知语音帧的短时能量E来筛选出未知语音片段中的呼吸音,筛选出的呼吸音组成初步分离后的呼吸音;步骤3:利用消除虚假低谷的边界检测算法检测初步分离后的呼吸音的沉默间隙,根据沉默间隙剔除初步分离后的呼吸音中的假阳性部分,得到精确分离后的呼吸音;步骤4:选取一组样本说话人,采集每个样本说话人的呼吸片段,建立一组说话人样本数据库,若需判定未知语音片段的说话人是否来自样本说话人,进行步骤5;若需判定未知语音片段的说话人是否为合法说话人,进行步骤6;步骤5:计算所述未知语音片段的精确分离后的呼吸音与说话人样本数据库中每个说话人呼吸样本的相似度,取最大相似度对应的样本说话人为未知语音片段的说话人,结束;步骤6:对每一位样本说话人采集测试样本,选取一个测试样本;步骤7:计算选取的测试样本与说话人样本数据库中每个说话人呼吸样本的相似度,取所述测试样本与说话人样本数据库中每个说话人呼吸样本的相似度中的最大值,得到一个最大相似度;步骤8:选取另一个测试样本,重复步骤7,直到得到所有测试样本对应的最大相似度,得到最大相似度组;步骤9:采集合法说话人的语音片段,利用呼吸样本集提取合法说话人的呼吸片段,计算未知语音片段的精确分离后的呼吸音与合法说话人的呼吸片段的相似度;步骤10:若未知语音片段的精确分离后的呼吸音与合法说话人的呼吸片段的相似度大于最大相似度组的最小值,则未知语音片段的说话人被鉴定为合法说话人,反之为非法说话人。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610626034.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top