[发明专利]一种声纹鉴定比对推荐方法、装置、电子设备及存储介质在审
申请号: | 202210169791.5 | 申请日: | 2022-02-23 |
公开(公告)号: | CN114648994A | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 张广学;肖龙源;李稀敏;叶志坚 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/06;G10L17/14;G10L17/16;G10L17/18;G10L15/02;G10L15/04;G10L15/26;G10L25/24;G10L25/30;G10L25/51 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 连耀忠 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 鉴定 推荐 方法 装置 电子设备 存储 介质 | ||
1.一种声纹鉴定比对推荐方法,其特征在于,包括:
获取样本语音和检材语音;
将样本语音和检材语音输入语音识别系统,语音识别系统识别出样本语音的文本和相应音素,以及检材语音的文本和相应的音素;
根据识别出的样本语音和检材语音的文本,基于词典进行结巴分词,获取样本语音和检材语音的文本中相同的词组和单字,记录词组和单字相应起始和结束位置,截取相应的语音段,组成第一语音段;
根据识别出的样本语音和检材语音的音素,获取样本语音和检材语音相同的三音素,并记录相应起始和结束位置,截取相应的语音段,组成第二语音段;
对于第一语音段和第二语音段,通过推荐算法,计算各语音段的推荐指数;
选取第一语音段推荐指数最高的语音段和第二语音段推荐指数最高的语音段,组成新音频;
通过对新音频进行自动声纹识别来区分同一性推荐和非同一性推荐。
2.根据权利要求1所述的一种声纹鉴定比对推荐方法,其特征在于,语音识别系统识别出样本语音的文本和相应音素,以及检材语音的文本和相应的音素,具体为:
从语音中获取声学特征;包括但不限于,线性预测编码和梅尔频率倒谱系数;
采用LSTM+CTC神经网络声学模型将声学特征转化为音素;
基于深度神经网络的语言模型将音素转化为词组和单字。
3.根据权利要求1所述的一种声纹鉴定比对推荐方法,其特征在于,对于第一语音段和第二语音段,通过推荐算法,计算各语音段的推荐指数,所述推荐指数基于推荐指标,所述推荐指标包括:语音内容一致性,频谱清晰度,共振峰个数指标,上下文一致性,语速一致性。
4.根据权利要求3所述的一种声纹鉴定比对推荐方法,其特征在于,所述推荐指标具体为:
语音内容一致性:计算语音段的频谱余弦相似度;
频谱清晰度:计算语音段的宽带语谱图峰值部分的谐波能量标准差;
共振峰个数指标:统计语音段共振峰的个数,并换算成指数;
上下文一致性:计算语音段音素的上下文一致性,即元音音素出现位置的前一个和后一个辅音/静音是否相同,并得出相应指数;
语速一致性:计算语音段的时长指数。
5.一种声纹鉴定比对推荐装置,其特征在于,包括:
获取单元:获取样本语音和检材语音;
语音识别单元:将样本语音和检材语音输入语音识别系统,语音识别系统识别出样本语音的文本和相应音素,以及检材语音的文本和相应的音素;
第一语音段获取单元:根据识别出的样本语音和检材语音的文本,基于词典进行结巴分词,获取样本语音和检材语音的文本中相同的词组和单字,记录词组和单字相应起始和结束位置,截取相应的语音段,组成第一语音段;
第二语音段获取单元:根据识别出的样本语音和检材语音的音素,获取样本语音和检材语音相同的三音素,并记录相应起始和结束位置,截取相应的语音段,组成第二语音段;
推荐指数计算单元:对于第一语音段和第二语音段,通过推荐算法,计算各语音段的推荐指数;
新音频获取单元:选取第一语音段推荐指数最高的语音段和第二语音段推荐指数最高的语音段,组成新音频;
推荐单元:通过对新音频进行自动声纹识别来区分同一性推荐和非同一性推荐。
6.根据权利要求5所述的一种声纹鉴定比对推荐装置,其特征在于,所述语音识别单元中,语音识别系统识别出样本语音的文本和相应音素,以及检材语音的文本和相应的音素,具体为:
从语音中获取声学特征;包括但不限于,线性预测编码和梅尔频率倒谱系数;
采用LSTM+CTC神经网络声学模型将声学特征转化为音素;
基于深度神经网络的语言模型将音素转化为词组和单字。
7.根据权利要求5所述的一种声纹鉴定比对推荐装置,其特征在于,所述推荐指数计算单元中,对于第一语音段和第二语音段,通过推荐算法,计算各语音段的推荐指数,所述推荐指数基于推荐指标,所述推荐指标包括:语音内容一致性,频谱清晰度,共振峰个数指标,上下文一致性,语速一致性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210169791.5/1.html,转载请声明来源钻瓜专利网。