[发明专利]一种语音激活检测方法及装置在审
申请号: | 201711423558.0 | 申请日: | 2017-12-25 |
公开(公告)号: | CN107945793A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 晏青 | 申请(专利权)人: | 广州势必可赢网络科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/10;G10L25/24 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙)44285 | 代理人: | 王仲凯 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种语音激活检测方法及装置。本发明的语音激活检测并非进行实时检测,而是对一段预置时长的待检测音频数据进行检测处理,因为说话人识别系统的目的是为了辨识说话人身份,并不要求实时处理说话人的语音信息,因此实时性要求低,准确性要求高,所以可以通过积累一段的音频数据以提高准确性,同时提取每一帧待检测音频数据的MFCC特征并进行聚类,传统的算法是实时计算每一帧是否是语音帧,为了保证实时性牺牲了准确性,而通过聚类的相似度计算可以明显区分语音帧和非语音帧,输出一系列聚类标签,通过辨识各个聚类标签内的内容即可分别输出语音帧和非语音帧,提高了准确性,解决了当前的语音激活检测技术的准确率较低的技术问题。 | ||
搜索关键词: | 一种 语音 激活 检测 方法 装置 | ||
【主权项】:
一种语音激活检测方法,其特征在于,包括:S1:获取预置时长的待检测音频数据,对待检测音频数据进行分帧处理;S2:对每一帧待检测音频数据进行MFCC特征提取,获取每一帧待检测音频数据的MFCC特征;S3:将每一帧待检测音频数据的MFCC特征进行聚类分析,获取聚类后的聚类标签及每一个聚类标签对应的待检测音频数据;S4:对各个聚类标签内的待检测音频数据进行辨识获取语音帧对应的聚类标签和非语音帧对应的聚类标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州势必可赢网络科技有限公司,未经广州势必可赢网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711423558.0/,转载请声明来源钻瓜专利网。
- 上一篇:语音处理方法和装置
- 下一篇:一种声纹识别与控制的装置