[发明专利]基于同构性和异质性动态信息交互的多模态情感分类方法在审
| 申请号: | 202211430451.X | 申请日: | 2022-11-15 |
| 公开(公告)号: | CN116010595A | 公开(公告)日: | 2023-04-25 |
| 发明(设计)人: | 纪明宇;周佳伟;何鑫;魏宁;王亚东 | 申请(专利权)人: | 东北林业大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/16;G06F18/25;G06F18/2415;G06F18/214;G06N3/0464;G10L25/63 |
| 代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 刘强 |
| 地址: | 150040 黑龙*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 同构 异质性 动态 信息 交互 多模态 情感 分类 方法 | ||
1.基于同构性和异质性动态信息交互的多模态情感分类方法,其特征在于包括以下步骤:
步骤一:获取CMU-MOSI多模态情感数据集,并对CMU-MOSI多模态情感数据集进行预处理,得到文本异质性特征和音频异质性特征,所述预处理具体步骤为:
步骤一一:将数据集内的文本序列数据经过BERT模型的编码层和解码层进行特征提取,得到文本异质性特征;
步骤一二:将数据集内的音频语义信号采用COVAREP库提取出每一帧内的音频异质性特征;
步骤二:采用P2FA将文本异质性特征和音频异质性特征在单词级别的每个时间步内进行模态对齐,对模态对齐后的文本异质性特征和音频异质性特征取平均,得到文本、音频两种模态单词级别对齐的长度相同的特征;
步骤三:将文本、音频两种模态单词级别对齐的长度相同的特征映射到一维卷积网络层,输出维度相同的文本异质性特征和音频异质性特征;
步骤四:将维度相同的文本异质性特征和音频异性质特征映射到一个多模态共享权重的子空间,并通过分布式排列学习不同模态之间的同构性,得到文本模态同构隐藏特征和音频模态同构隐藏特征;
步骤五:将文本异质性特征与文本模态同构隐藏特征进行矩阵相乘,得到文本信息交互矩阵;
将音频异质性特征和音频模态同构隐藏特征进行矩阵相乘,得到音频信息交互矩阵;
然后分别引入padding mask矩阵M,得到文本信息交互表示矩阵以及音频交互信息表示矩阵;
步骤六:利用软注意力方法分别对文本信息交互表示矩阵以及音频交互信息表示矩阵进行处理,得到文本注意力矩阵以及音频注意力矩阵;
步骤七:将文本注意力矩阵以及音频注意力矩阵进行加权求和,得到加权融合信息交互矩阵;
步骤八:将加权融合信息交互矩阵与文本异质性特征进行加权计算,得到多模态信息交互矩阵;
步骤九:将多模态信息交互矩阵与文本异质性特征进行残差连接和归一化处理,得到多模态融合特征数据;
步骤十:将多模态融合特征数据经过全连接层和softmax得到情感分类结果;
步骤十一:利用文本异质性特征和音频异质性特征作为输入、情感分类结果作为输出训练多模态情感分类模型,并利用交叉熵损失函数优化模型,得到训练好的多模态情感分类模型;
步骤十二:将待识别的文本异质性特征和音频异质性特征输入训练好的多模态情感分类模型,得到情感分类结果;
所述多模态情感分类模型的损失函数为:
l=ltask+αlSimilarity
其中,α表示相似度损失函数的正则化权重,lSimilarity表示相似度损失函数,ltask表示交叉熵损失函数,所述相似度损失函数用于计算文本模态同构隐藏特征和音频模态同构隐藏特征之间的损失;
所述相似度损失函数如下:
其中,lSimilarity表示相似度损失函数,αt表示文本模态同构隐藏特征,βa表示音频模态同构隐藏特征,t表示文本特征,a表示音频特征,{T,A}表示特征空间,CMDK(αt,βa)表示文本模态同构隐藏特征和音频模态同构隐藏特征中心距差函数;
所述交叉熵损失函数如下:
其中,N是语料的数量,为期望输出,为实际输出,i表示语料的序号,i=1...N。
2.根据权利要求1所述的基于同构性和异质性动态信息交互的多模态情感分类方法,其特征在于所述文本异质性特征如下:
其中,T1,T2,...,T表示文本表征序列。
3.根据权利要求2所述的基于同构性和异质性动态信息交互的多模态情感分类方法,其特征在于所述音频异质性特征如下:
其中,A1,A2,…,An表示音频信号序列,Time-Step表示每一帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北林业大学,未经东北林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211430451.X/1.html,转载请声明来源钻瓜专利网。





