[发明专利]一种基于MIT和FSM的多模态情感分析方法有效
申请号: | 202111128257.1 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113806609B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 李祖贺;郭青冰;王艳军;马江涛;王凤琴;张秋闻;黄伟;钱晓亮;张焕龙 | 申请(专利权)人: | 郑州轻工业大学 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06K9/62;G06N3/04;G06N3/08;G06F16/33;G06F16/35;G06F16/65;G06F16/68;G06F16/75;G06F16/783 |
代理公司: | 郑州优盾知识产权代理有限公司 41125 | 代理人: | 张真真 |
地址: | 450000 河南省郑州*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 mit fsm 多模态 情感 分析 方法 | ||
1.一种基于MIT和FSM的多模态情感分析方法,其特征在于,其步骤如下:
步骤一:分别对文本模态数据、语音模态数据和视频模态数据进行预处理,提取文本特征向量、语音特征向量和视频特征向量;
步骤二:从文本特征向量、语音特征向量和视频特征向量对应的模态中选择一个模态作为主要模态,其余两个模态作为辅助模态进行组合,得到三个组合,并将三个组合分别输入Multimodal Interactive Transformer中进行辅助学习,分别得到三个学习后的特征矩阵;
辅助学习的方法为:
A.文本特征向量对应的模态为主要模态x,语音特征向量和视频特征向量对应的模态为辅助模态y和z;
S2.1、将主要模态x的Key向量和Value向量记为Kx与Vx,将辅助模态y和z的Query向量分别记为Qy与Qz;
S2.2、计算Kx与Qy的标准内积来获取主要模态x与辅助模态y的相似度权重,并对主要模态x与辅助模态y的相似度权重使用Softmax函数进行归一化,再利用归一化后的相似度权重对Vx进行加权求和;具体计算公式为:
其中,d表示特征向量的维度;
S2.3、计算每一次操作后的head:
headi'=Guided-Attention(QyWi'Q,KxWi'k,VxWi'V);
其中,headi'表示第i'个head的计算结果,Wi'Q表示第i'个head计算时Qy的权重,Wi'k表示第i'个head计算时Kx的权重,Wi'V表示第i'个head计算时Vx的权重,i'=1,2,…,h,h为步骤S2.2的操作次数;
S2.4、将h次的结果进行拼接和线性变化即可得到主要模态x与辅助模态y经过Multi-Head Guided-Attention后的结果,表达式为:
MHGA(Qy,Kx,Vx)=Concat(head1,...,headh)WO;
其中,Concat(·)为拼接操作,WO表示给拼接后的值赋予的权重;
S2.5、将Kx、Vx和Qz按照步骤S2.2至S2.4的操作方法,获得主要模态x与辅助模态z经过Multi-Head Guided-Attention后的结果;
S2.6、将主要模态x与辅助模态y经过Multi-Head Guided-Attention后的结果记为张量t1,将主要模态x与辅助模态z经过Multi-Head Guided-Attention后的结果记为张量t2;
S2.7、使用笛卡尔积的跟随向量场定义二维张量融合网络,表示为:
其中,坐标(t1,t2)是由两个张量嵌入维度[t1 1]T和[t2 1]T定义的笛卡尔平面中的一个点,利用如下公式计算两个张量的融合结果:
其中,t表示融合后的张量;
S2.8、将融合后的张量t输入由全连接层和非线性激活函数组成的前向传播层进行一次残差变化和归一化变换,得到文本特征向量对应的学习后的特征矩阵Ftext:
Ftext=LayerNorm(t+Sublayer(t));
其中,LayerNorm(·)为归一化变换函数,Sublayer(·)为残差变化函数;
B.语音特征向量对应的模态为主要模态x,文本特征向量和视频特征向量对应的模态为辅助模态y和z;按照步骤S2.1至S2.8的操作方式执行,得到语音特征向量对应的学习后的特征矩阵Faudio;
C.视频特征向量对应的模态为主要模态x,文本特征向量和语音特征向量对应的模态为辅助模态y和z;按照步骤S2.1至S2.8的操作方式执行,得到视频特征向量对应的学习后的特征矩阵Fvideo;
步骤三:将三个学习后的特征矩阵输入FeatureSoft Mapping中映射到统一的语义空间中进行融合,得到融合特征;融合方法为:
S3.1、分别对特征矩阵Ftext、Faudio、Fvideo进行尺寸变换,得到三个新的特征矩阵,分别为M1、M2、M3,其中,M1、M2、M3的维度大小均为2k×k;
S3.2、利用大小为1×2k的向量vq分别与每个新的特征矩阵Mq相乘后再利用Softmax函数进行归一化处理,得到大小为1×k的向量aq:
aq=softmax(vqMq);
其中,q∈{1,2,3};
S3.3、将所有向量aq进行加权求和,并将求和结果进行整合,得到大小为k的向量m:
其中,wq为权重;
S3.4、m为视频序列上单个节点上的计算结果,将整个视频序列的所有节点的结果进行堆叠得到融合特征:
其中,s为融合特征,mj'为第j'个节点的向量,j'=0,1,…,N,N为视频的节点数,Stacking(·)为拼接操作;
步骤四:将融合特征输入分类层,获取情感预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业大学,未经郑州轻工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111128257.1/1.html,转载请声明来源钻瓜专利网。
- 一种支持分布式管理信息树的网络管理方法
- 突变金属 -绝缘体转变装置、使用该突变金属 -绝缘体转变装置的高压噪声消除电路、和包含该电路的电气和/或电子系统
- 使用突变式金属 -绝缘体转变装置的可编程金属 -绝缘体转变传感器、以及包括该金属 -绝缘体转变传感器的报警装置和蓄电池防爆电路
- 连续测量金属-绝缘体转变元件的突变的金属绝缘体转变的电路以及利用此电路的金属-绝缘体转变传感器
- 三端金属-绝缘体转变开关、包括该转变开关的开关系统和控制该转变开关的金属-绝缘体转变的方法
- 小鼠短串联重复序列的复合扩增体系及检测试剂盒
- 金属-绝缘体相变触发器
- 包括临界电流供给器件的金属绝缘体转变晶体管系统
- 线粒体基因组检测方法及引物
- 多接口应答器设备