[发明专利]一种声纹识别方法、装置、存储介质、服务器及系统有效
申请号: | 201911360737.3 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111128198B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 叶林勇;肖龙源;李稀敏;蔡振华;刘晓葳 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04;G10L21/0208 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 识别 方法 装置 存储 介质 服务器 系统 | ||
本发明提供一种声纹识别方法,该方法包括:接收交换机通过MRCP协议发送的声纹识别请求,该请求中包含待识别的原始语音数据;利用预设语音去噪算法对原始语音数据进行去噪处理;提取去噪后的语音数据当中的声学特征,并将声学特征输入到训练好的声纹识别模型当中,得到目标声学特征值;将目标声学特征值在预设声纹数据库当中进行匹配,当存在匹配率高于阈值的匹配结果时,判定声纹识别成功。本发明通过MRCP协议来推送原始语音数据,相比于抓包方式,可以减少语音信号的丢包概率,缩短声纹识别时间,提升声纹识别的处理效率,此外还对原始语音数据进行去噪处理,以去除原始语音中的环境噪音,降低声纹识别的误检概率,整体提高声纹识别的可靠性。
技术领域
本发明属于声纹技术领域,尤其涉及一种声纹识别方法、装置、存储介质、服务器及系统。
背景技术
每个人的声音都蕴涵着特有的生物特征,声纹识别是指利用说话人的声音来识别说话人的一种技术手段。声纹识别同指纹识别等技术一样具有高度的安全可靠性,可以应用在所有需要做身份识别的场合。如在银行、证券、保险等金融领域。
声纹识别的前提是需要预先录入用户语音,服务器通过对录入的用户语音进行声学特征提取,以注册该用户的声学特征值,形成声纹数据库,实际在进行声纹识别时,通过前端声音采集设备采集用户的现场语音,服务器对现场语音进行声学特征提取,并将提取的实际声学特征与声纹数据库进行匹配,匹配成功则声纹识别成功。
现有技术当中,目前声纹识别方案中的前端声音采集设备大多为电话或者手机,银行交换机采用抓包方式根据某个用户的手机号码获取语音数据再推送到服务器做声纹识别,环境比较嘈杂,声音直接送入服务器做声纹识别存在误检的概率比较高,且采用抓包的方式提取语音信息,容易丢包且效率低,导致目前声纹识别方案整体可靠性较差。
发明内容
本发明实施例的目的在于提供一种声纹识别方法、装置、存储介质、服务器及系统,旨在解决现有技术当中声纹识别方案可靠性差的技术问题。
本发明实施例是这样实现的,一种声纹识别方法,所述方法包括:
接收交换机通过MRCP协议发送的声纹识别请求,所述声纹识别请求当中包含待识别的原始语音数据;
利用预设语音去噪算法对所述原始语音数据进行去噪处理;
提取去噪后的语音数据当中的声学特征,并将所述声学特征输入到训练好的声纹识别模型当中,得到目标声学特征值;
将所述目标声学特征值在预设声纹数据库当中进行匹配,当存在匹配率高于阈值的匹配结果时,判定声纹识别成功。
更进一步的,所述将所述目标声学特征值在预设声纹数据库当中进行匹配的步骤包括:
根据预设匹配算法,将所述目标声学特征值与所述预设声纹数据库当中的每一预设声学特征值进行匹配打分;
从所有打分值当中提取最高打分值;
判断所述最高打分值是否大于所述阈值;
若是,则判定存在所述匹配率高于阈值的匹配结果。
更进一步的,所述预设匹配算法为欧拉距离公式。
更进一步的,在所述判定声纹识别成功的步骤之后,还包括:
通过所述MRCP协议向所述交换机反馈声纹识别结果。
更进一步的,所述利用预设语音去噪算法对所述原始语音数据进行去噪处理的步骤包括:
利用改进的LMS自适应滤波算法去除所述原始语音数据当中的环境噪声。
更进一步的,所述提取去噪后的语音数据当中的声学特征的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911360737.3/2.html,转载请声明来源钻瓜专利网。