[发明专利]用音频特征主成分建立的语音群集来识别说话人的方法在审

申请号：	201811118265.6	申请日：	2018-09-26
公开（公告）号：	CN109065059A	公开（公告）日：	2018-12-21
发明（设计）人：	陈永清;陈东风;王贵珊;李瑞娟	申请（专利权）人：	新巴特（安徽）智能科技有限公司
主分类号：	G10L17/08	分类号：	G10L17/08;G10L17/04;G10L17/02
代理公司：	暂无信息	代理人：	暂无信息
地址：	239000 安徽省滁州***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种用音频特征主成分建立的语音群集来识别说话人的方法，该方法是将主成分分析和基于音频特征在主分量空间中的欧几里得距离的层次聚类相结合，具体为：收集不同的训练音频样本集；计算每个样本的时域和频域音频特征；计算出时域和频域音频特征的平均值和标准偏差；通过计算出的数据对训练样本进行主成分分析；将每个音频由音频特征数据沿着上述N个主成分投影的坐标来代表；采用UPGMA聚类分析算法，基于n维空间中的距离对说话人进行聚类。本发明的方法具有速度快，添加新说话人语音方便的特点，用于智能语言教学系统，实现了说话人识别，从未知的多个发言者会话中及时分辨说话人，利于针对性的教学。
搜索关键词：	音频特征主成分分析语音和频群集时域欧几里得距离说话人识别层次聚类教学系统训练样本音频样本智能语言主分量会话聚类算法分辨投影样本教学
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.用音频特征主成分建立的语音群集来识别说话人的方法，其特征在于：所述方法是将主成分分析和基于音频特征在主分量空间中的欧几里得距离的层次聚类相结合，具体包括如下步骤：1)收集不同的训练音频样本集；2)根据Librosa中描述的算法，计算每个样本的时域和频域音频特征；3)分别计算出上述时域和频域音频特征的平均值和标准偏差；4)通过计算出的上述数据对训练样本进行主成分分析，选择出能解释95％方差的前N个分量；5)将每个音频由音频特征数据沿着上述N个主成分投影的坐标来代表；6)采用UPGMA聚类分析算法，基于n维空间中的距离对说话人进行聚类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于新巴特（安徽）智能科技有限公司，未经新巴特（安徽）智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811118265.6/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用音频特征主成分建立的语音群集来识别说话人的方法在审

专利文献下载