[发明专利]一种语音激活检测方法及装置在审

专利信息
申请号: 201711423558.0 申请日: 2017-12-25
公开(公告)号: CN107945793A 公开(公告)日: 2018-04-20
发明(设计)人: 晏青 申请(专利权)人: 广州势必可赢网络科技有限公司
主分类号: G10L15/06 分类号: G10L15/06;G10L15/10;G10L25/24
代理公司: 深圳市深佳知识产权代理事务所(普通合伙)44285 代理人: 王仲凯
地址: 510000 广东省广州市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明实施例公开了一种语音激活检测方法及装置。本发明的语音激活检测并非进行实时检测,而是对一段预置时长的待检测音频数据进行检测处理,因为说话人识别系统的目的是为了辨识说话人身份,并不要求实时处理说话人的语音信息,因此实时性要求低,准确性要求高,所以可以通过积累一段的音频数据以提高准确性,同时提取每一帧待检测音频数据的MFCC特征并进行聚类,传统的算法是实时计算每一帧是否是语音帧,为了保证实时性牺牲了准确性,而通过聚类的相似度计算可以明显区分语音帧和非语音帧,输出一系列聚类标签,通过辨识各个聚类标签内的内容即可分别输出语音帧和非语音帧,提高了准确性,解决了当前的语音激活检测技术的准确率较低的技术问题。
搜索关键词: 一种 语音 激活 检测 方法 装置
【主权项】:
一种语音激活检测方法,其特征在于,包括:S1:获取预置时长的待检测音频数据,对待检测音频数据进行分帧处理;S2:对每一帧待检测音频数据进行MFCC特征提取,获取每一帧待检测音频数据的MFCC特征;S3:将每一帧待检测音频数据的MFCC特征进行聚类分析,获取聚类后的聚类标签及每一个聚类标签对应的待检测音频数据;S4:对各个聚类标签内的待检测音频数据进行辨识获取语音帧对应的聚类标签和非语音帧对应的聚类标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州势必可赢网络科技有限公司,未经广州势必可赢网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711423558.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top