[发明专利]一种基于最大池化自注意力机制的声纹识别方法及系统在审

申请号：	202211733131.1	申请日：	2022-12-30
公开（公告）号：	CN116072127A	公开（公告）日：	2023-05-05
发明（设计）人：	孙钢;沈然;沈皓;李伊玲;汪一帆;徐世予;章江铭;章一新;项莹洁;佘清顺	申请（专利权）人：	国网浙江省电力有限公司营销服务中心;浙江大学
主分类号：	G10L17/18	分类号：	G10L17/18;G10L17/04;G10L17/02
代理公司：	浙江翔隆专利事务所(普通合伙) 33206	代理人：	张建青
地址：	311100 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于最大注意力机制声纹识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于最大池化自注意力机制的声纹识别方法，其特征在于，包括步骤：

S1：输入音频Α，提取音频特征序列，得到序列T；

S2：使用卷积神经网络对步骤S1得到的序列T进行降采样处理，得到降采样后的序列S；

S3：将步骤S2得到的序列S输入基于最大池化自注意力机制的Transformer编码器中进行训练，得到输出序列O；

S4：对步骤S3得到的输出序列O进行正则化，得到正则化之后的序列L；

S5：使用统计注意力聚合的方法从步骤S4得到的序列L中提取说话人声纹编码e；

S6：使用角度原型损失函数优化训练过程中的损失，使其最小化。

2.根据权利要求1所述的一种基于最大池化自注意力机制的声纹识别方法，其特征在于，所述步骤S2使用卷积神经网络进行降采样处理的过程如下：

S2-1：输入步骤S1得到的序列其中，B为批大小，F为序列长度，D为特征维度，使用大小为3×3、步长为2的二维卷积核对序列T进行二倍降采样，并使用ReLU激活函数激活，得到序列其中C为通道数，F′为降采样后的序列长度，D′为降采样后的特征维度，过程如下：

T′＝ReLU(Conv2d(T))

S2-2：输入步骤S2-1得到的序列T′，再次使用大小为3×3、步长为2的二维卷积核对序列T′进行二倍降采样，并使用ReLU激活函数激活，得到序列其中F″为再次降采样后的序列长度，D″为再次降采样后的特征维度，过程如下：

T″＝ReLU(Conv2d(T′))

S2-3：对步骤S2-2得到的序列T″进行降维操作，最终得到序列

3.根据权利要求1所述的一种基于最大池化自注意力机制的声纹识别方法，其特征在于，所述步骤S3使用Transformer编码器进行训练时的自注意力机制过程如下：

S3-1：通过对步骤S2得到的序列S进行投影得到查询集Q、键值集K和价值集V，过程如下：

Q＝SW_Q

K＝SW_K

V＝SW_V

其中，W_Q、W_K、W_V分别为第一可学习参数、第二可学习参数、第三可学习参数；

S3-2：通过查询集Q和键值集K计算得到相似度矩阵Λ，计算过程如下：

式中，T表示转置；d_k表示K的维度大小；

S3-3：对步骤S3-2得到的矩阵Λ引入卷积核大小为2×2的最大池化操作，得到每个卷积核内相似度分数最大的元素的位置信息集合P＝{p₁,p₂,…,p_N}，其中N为位置信息个数，计算过程如下：

P＝maxp(Λ)

其中，maxp()函数表示返回每个卷积核内相似度分数最大的元素的位置信息；

S3-4：通过步骤S3-3得到的位置信息集合P生成偏置矩阵M，M定义如下：

S3-5：根据步骤S3-1得到的价值集V、步骤S3-2得到的相似度矩阵Λ和步骤S3-4得到的偏置矩阵M计算最终结果，即为输出序列O，计算过程如下：

Attention(Q,K,V)＝softmax(Λ+M)V

其中，softmax()为指数归一化函数。

4.根据权利要求1所述的一种基于最大池化自注意力机制的声纹识别方法，其特征在于，所述步骤S4进行正则化的计算过程如下：

步骤S3得到的输出序列O＝{o₁,o₂,…,o_x}，x为序列O长度，对序列O进行正则化后得到序列L＝{l₁,l₂,…,l_x}，计算过程如下：

其中，||o_i||₂表示求向量o_i的2范数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司营销服务中心;浙江大学，未经国网浙江省电力有限公司营销服务中心;浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202211733131.1/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载