[发明专利]一种防干扰声纹识别方法和系统在审
申请号: | 201610025314.6 | 申请日: | 2016-01-14 |
公开(公告)号: | CN106971724A | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 祝铭明 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02 |
代理公司: | 上海申新律师事务所31272 | 代理人: | 党蕾 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 干扰 声纹 识别 方法 系统 | ||
技术领域
本发明涉及声纹识别技术领域,具体而言,涉及一种防干扰声纹识别方法和系统。
背景技术
随着电子智能设备被广泛的使用,较多的智能设备中开始集成语音控制的功能,对于语音控制而言,声纹识别因为具有唯一性并且不易伪造从而被开发者所注意,声纹识别具体其包括两类,分别是:1)说话人辨认(Speaker Identification)和2)说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的;而后者用以确认某段语音是否是指定的某个人所说的。在不同的应用环境中可能会使用到不同的声纹识别技术或者不同技术的结合。然而,不可否认的是声纹识别还不够完善,比如同一个人的环境中,存在的外部干扰源太多,如噪音,或者混合着多个人的语音,这样存在着声纹识别收到干扰,无论在识别的精度或者识别的效率上都给使用者带来了不好的使用体验。
发明内容
根据现有技术中存在的上述问题,现提供一种防干扰声纹识别方法及系统的技术方案,具体包括:
一种防干扰声纹识别方法,其中,包括:
对获取的语音片段中的语音的声音强度进行分析,将所述声音强度在一预设阈值下的语音进行丢弃;
获取每个未识别声纹中的未识别声纹特征,其中,所述未识别声纹特征中至少包括所述未识别声纹的小波元素;
至少分别根据每个所述未识别声纹特征与声纹识别模型中的标准声纹特征处理得到对应于每个所述未识别声纹的辨别度;
分别判断每个所述辨别度是否大于一预设的标准阈值,并保留所述辨别度大于所述标准阈值的所述未识别声纹;
于被保留的所述未识别声纹中,选择所述辨别度最大的所述未识别声纹并识别为被锁定声纹;
所述小波元素包括实小波元素和/或复小波元素,其中,所述获取未识别声纹中的未识别声纹特征包括:
检测所述未识别声纹中的浊音区间;
在每个所述浊音区间中检测基音区间,并在每个所述基音区间中获取所述声纹特征的所述实小波元素和/或所述复小波元素。
优选的,该防干扰声纹识别方法,其中,在所述提取未识别声纹中的未识别声纹特征之前,还包括:
在对声音强度在一预设阈值下的语音丢弃之后,在保留的语音中提取所述未识别声纹;
至少根据所述未识别声纹特征中的未识别声纹特征向量调整预先构建的标准识别模型中与所述未识别声纹特征向量对应的声纹特征向量参数,
优选的,该防干扰声纹识别方法,其中,所述未识别声纹特征中包括多个所述未识别声纹特征向量,所述标准声纹特征中包括多个所述标准声纹特征向量,其中,所述至少根据所述未识别声纹特征与声纹识别模型中的标准声纹特征处理得到所述未识别声纹的辨别度包括:
处理得到所述未识别声纹特征中的每个所述未识别声纹特征向量与所述标准声纹特征中每个与所述未识别声纹特征向量相对应的所述标准声纹特征向量的向量距离;
根据处理得到的多个所述向量距离处理得到所述未识别声纹特征与所述标准声纹特征的目标距离;
至少利用所述未识别声纹特征与所述标准声纹特征的所述目标距离处理得到所述未识别声纹的辨别度。
优选的,该防干扰声纹识别方法,其中,在采集所述未识别声纹之前,还包括:
采集多个声纹并获取所述多个声纹中每个声纹的背景声纹特征,以构建多个与所述声纹相对应的背景识别模型,其中,所述背景声纹特征中包括多个 背景声纹特征向量;
根据所述背景识别模型构建所述标准识别模型。
优选的,该防干扰声纹识别方法,其中,所述至少利用所述未识别声纹特征与所述标准声纹特征的距离处理得到所述未识别声纹的辨别度包括:
处理得到所述未识别声纹特征分别与多个所述背景识别模型对应的每个所述声纹的所述背景声纹特征的背景距离;
根据多个所述背景距离处理得到距离平均值及距离标准差;
处理得到所述未识别声纹特征与所述标准声纹特征的所述目标距离与所述距离平均值的差值;
处理得到所述差值与所述距离标准差的比值,将所述比值作为所述未识别声纹的所述辨别度。
优选的,该防干扰声纹识别方法,其中,所述在每个所述基音区间中获取所述声纹特征的所述实小波元素和/或所述复小波元素包括:
在每个所述基音区间中获取预定的特征向量,并根据小波滤波器将多个所述基音区间中的所述特征向量划分为预定长度的样本向量,并将所述预定长度的样本向量归一化;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610025314.6/2.html,转载请声明来源钻瓜专利网。