[发明专利]基于深度堆栈自编码网络的说话人识别方法在审

申请号：	201811092136.4	申请日：	2018-09-19
公开（公告）号：	CN109346084A	公开（公告）日：	2019-02-15
发明（设计）人：	曾春艳;马超峰;武明虎;叶佳翔;朱莉;王娟;吕松南;朱栋梁;蔡松	申请（专利权）人：	湖北工业大学
主分类号：	G10L17/00	分类号：	G10L17/00;G10L17/02;G10L17/04;G10L17/18;G10L17/22
代理公司：	北京科家知识产权代理事务所(普通合伙) 11427	代理人：	陈娟
地址：	430068***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于深度堆栈自编码网络的说话人识别方法，S1：说话人特征提取；S2：堆栈自编码器的网络设计；S3：说话人识别与决策。本发明与传统说话人识别相比，将深度堆栈自编码网络与说话人识别系统模型相融合，结合堆栈自编码器的多层结构在提高评价模型的表征能力方面的显著效果，本发明的说话人识别方法在存在背景噪声的环境下能够有限提升系统的识别性能，在降低噪声对系统性能影响、提高系统噪声鲁棒性的同时，优化系统结构，使识别实时性得到有效增强。
搜索关键词：	说话人识别堆栈自编码编码器说话人识别系统背景噪声表征能力多层结构降低噪声评价模型识别性能特征提取提升系统网络设计系统性能系统噪声优化系统网络鲁棒性实时性融合决策
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于深度堆栈自编码网络的说话人识别方法，其特征在于，方法步骤如下：S1：说话人特征提取；S2：堆栈自编码器的网络设计；S3：说话人识别与决策。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于湖北工业大学，未经湖北工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811092136.4/，转载请声明来源钻瓜专利网。

上一篇：基于语音识别的销售订单获取方法、装置、设备及介质
下一篇：一种基于声纹识别的监狱监管平台

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于深度堆栈自编码网络的说话人识别方法在审

专利文献下载