[发明专利]用于可视化和解释用于情绪分析的多模态模型的系统在审

专利信息
申请号: 202210681070.2 申请日: 2022-06-15
公开(公告)号: CN115481218A 公开(公告)日: 2022-12-16
发明(设计)人: 王星博;何简奔;金志华;屈华民;张荣 申请(专利权)人: 香港科技大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F16/75;G06F16/783;G06K9/62;G06N3/04;G06N3/08;G06V40/16
代理公司: 北京天昊联合知识产权代理有限公司 11112 代理人: 张娜;林文
地址: 中国香港*** 国省代码: 香港;81
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 可视化 解释 情绪 分析 多模态 模型 系统
【说明书】:

发明涉及一种视觉分析系统,用于帮助用户更好地理解和诊断用于情感分析的多模态模型。通过考虑由事后解释性技术测量到的特征重要性,系统产生由多模态语言模型从三个层面(即,全局、子集和局部层面)学习到的模态内和模态间的相互作用的解释。在全局层面,本系统提取并直观地总结了三种类型的相互作用(即,主导性、互补性和冲突性),并且采用了扩充的树状布局。在子集层面,系统利用紧凑模板总结了有影响力和频繁的多模态特征,并且使得能够使用不同的符号设计来多方面地探索用户感兴趣的特征。在局部层面,系统利用细节来可视化各个多模态实例及其解释。

技术领域

本申请涉及自然语言处理(NLP)和情感计算,更具体地,涉及一种用于可视化和解释用于情绪分析的多模态模型的系统和方法。

背景技术

多模态情感分析是自然语言处理和情感计算中的有活力的主题,其主要关注于从多个通信信道,例如语言(即文本)、语音和面部表情,来自动检测人的态度或意见。核心挑战是对复杂的模态内和模态间的相互作用进行建模,其中多模态特征正在被融合。

早期工作中,在将不同模态输入到学习模型之前,将来自不同模态的特征级联(concatenate)。相反,一些工作采用后期融合方法,该方法使用投票方案或学习模型将来自各个单模态模型(unimodal model)的决策值(decision values)进行组合。然而,这些方法忽略了跨模态相互作用(cross-modal interactions)。为了解决这些种问题,一些工作明确地计算单模态特征(unimodal feature)、双模态特征(bimodal feature)和三模态特征(trimodal feature),并将它们与张量积(tensor product)和动态路线(dynamicrouting)融合。最近,神经网络方法普遍用于对各个模态之间的复杂相互作用(complexinterplay)进行建模。例如,研究人员已经扩展了LSTM单元和门,以用于学习多模态序列之间的时间相互作用模式(temporal interaction pattern)。提出了基于注意的RNN来学习在各个模态之中的具有循环翻译损失(cyclic translation loss)的多模态表示。设计了一种由神经网络控制的多视图门控存储器单元,其存储和预测时间跨模态相互作用(temporal cross-modal interaction)。还利用变换器注意力机制(transformerattention mechanism)来学习跨模态对齐和相互作用(cross-modal alignment andinteractions)。尽管这些神经网络相对于传统方法极大地提高了性能,但是它们复杂的体系结构严重影响了模型的可解释性。在本文中,我们构建了可视分析系统以帮助诊断用于情感分析任务的最先进的黑匣子模型。

事后可解释技术(Post-hoc explainability techniques)是指在模型训练过程之后对模型理解的单独解释方法。它们可以粗略地分为两组:模型特定方法(model-specific approach)和模型无关方法(model-agnostic approach)。模型特定方法提供了对特定类型模型的解释,其范围从浅层模型(如树集合和支持向量机)到更复杂的神经网络。相反,模型无关方法足够灵活,可应用于任何机器学习模型。根据最近的调查,存在两种主要类型的模型无关方法:简化解释和特征相关性解释。

对于属于简化解释的技术,研究人员通常建立替代模型(例如,基于规则的学习者、决策树和线性模型)以便以降低的复杂度来模仿原始模型行为。最具代表性的技术之一是LIME,其基于感兴趣的实例的邻居来构建局部线性模型来近似各个预测。特征相关性解释通过计算相关性或重要性分数来量化特征贡献。一个流行的例子是数学根值是Shapley值的SHAP,其是来自合作游戏理论的方法。SHAP为每个特征计算附加重要性分数,以描述其对给定预测结果的影响。它具有理想的特性(局部精度、缺失和一致性),并且被证明与人类直觉一致。其他工作使用局部梯度、随机化特征排列或影响函数来公开与模型预测相关的特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于香港科技大学,未经香港科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210681070.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top