[发明专利]跨信道声纹识别方法、装置、设备和存储介质有效
| 申请号: | 202111390613.7 | 申请日: | 2021-11-23 |
| 公开(公告)号: | CN113823294B | 公开(公告)日: | 2022-03-11 |
| 发明(设计)人: | 郑方;佴瑞乾;李蓝天;王东;张琛;谢弈峥 | 申请(专利权)人: | 清华大学;上海浦东发展银行股份有限公司 |
| 主分类号: | G10L17/04 | 分类号: | G10L17/04 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 乔慧 |
| 地址: | 100084 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信道 声纹 识别 方法 装置 设备 存储 介质 | ||
1.一种跨信道声纹识别方法,其特征在于,包括:
获取待识别声纹音频数据,其中,所述待识别声纹音频数据采集于设定信道集合中的信道,所述设定信道集合中包括至少两种不同信道;
将所述待识别声纹音频数据输入预置的跨信道声纹识别模型,得到声纹音频数据处理结果,以根据所述声纹音频数据处理结果进行声纹音频数据识别;
其中,所述跨信道声纹识别模型采用所述设定信道集合中采集的声纹音频数据经过多次迭代过程训练得到,在每一次迭代过程中采用两种不同信道中采集的声纹音频数据进行模型参数训练;
对所述跨信道声纹识别模型的训练过程包括:
获取采集于所述设定信道集合中的样本声纹音频数据集,所述样本声纹音频数据集中的样本声纹音频数据采集于所述至少两种不同信道;
选取一种信道中的样本声纹音频数据,计算其在自身对应的信道中的第一损失函数以及更新中间参数,并基于更新后的中间参数以及所述第一损失函数,选取所述一种信道之外的另一种信道中的样本声纹音频数据,计算其在自身对应的信道中的第二损失函数以及更新模型参数,完成一次迭代过程;
重新选取样本声纹音频数据进行迭代过程,直到所述第二损失函数收敛,得到所述跨信道声纹识别模型。
2.根据权利要求1所述的方法,其特征在于,所述至少两种不同信道包括以下信道分类中的至少一种类别:无线信道、有线信道和存储信道。
3.根据权利要求1所述的方法,其特征在于,所述待识别声纹音频数据包括采集于第一信道的第一数据和采集于第二信道的第二数据;所述得到声纹音频数据处理结果之后,所述方法还包括:
根据所述第一数据对应的声纹音频数据处理结果和所述第二数据对应的声纹音频数据处理结果获取所述第一数据和第二数据的相似关系;
根据所述相似关系与设定的第一阈值的大小关系,识别所述第一数据和所述第二数据是否来自于同一发音者。
4.根据权利要求1所述的方法,其特征在于,所述待识别声纹音频数据包括采集于第一信道的第三数据;所述得到声纹音频数据处理结果之后,所述方法还包括:
根据所述第三数据对应的声纹音频数据处理结果和声纹库中的在库数据,获取所述第三数据与所述在库数据的相似关系,其中,所述在库数据根据采集于第二信道的声纹音频数据得到;
根据所述相似关系在所述在库数据中选取与所述第三数据相似度最大的第四数据;
根据所述第三数据与所述第四数据的相似度与设定的第二阈值的大小关系,识别所述第三数据和所述第四数据是否来自于同一发音者。
5.根据权利要求3或4所述的方法,其特征在于,所述相似关系根据计算余弦距离或者进行概率线性判别分析获取。
6.根据权利要求1所述的方法,其特征在于,在每一次所述迭代过程中,按照以下公式更新中间参数:
其中,是在信道上的损失函数,是采集于信道的声纹音频数据,为局部更新的学习率,为的变化量;按照以下公式更新模型参数至:
其中,,是在信道上的损失函数,是采集于信道的声纹音频数据,为全局更新的学习率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;上海浦东发展银行股份有限公司,未经清华大学;上海浦东发展银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111390613.7/1.html,转载请声明来源钻瓜专利网。





