[发明专利]一种基于共注意的多模态融合机制检测虚假信息的方法在审

专利信息
申请号: 202210271617.1 申请日: 2022-03-18
公开(公告)号: CN114662586A 公开(公告)日: 2022-06-24
发明(设计)人: 沈慧琳;林巧民;谢强;周斌 申请(专利权)人: 南京邮电大学
主分类号: G06K9/62 分类号: G06K9/62;G06F40/30;G06F16/35;G06N3/04
代理公司: 南京苏科专利代理有限责任公司 32102 代理人: 姚姣阳
地址: 210023 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 注意 多模态 融合 机制 检测 虚假 信息 方法
【权利要求书】:

1.一种基于共注意的多模态融合机制检测虚假信息的方法,其特征在于,包括如下步骤,

步骤S1.构建提取文本特征的BERT模型;

步骤S2.构建提取视觉特征的R-CNN模型;

步骤S3.构建融合文本与视觉特征的共注意转换器层Co-TRM模型;

步骤S4.将融合后的特征向量输入到域分类器中,将不同信息的多模态特征映射到相同的特征空间,将文本分类为不同的事件,并删除事件特殊的特征;

步骤S5.将融合后的特征向量输入到虚假信息检测器中,利用潜在的多模态特征判断信息的真假。

2.根据权利要求1所述的一种基于共注意的多模态融合机制检测虚假信息的方法,其特征在于,所述步骤S1中,使用Transformer的双向编码器进行文本特征提取,BERT模型由多层双向变压编码器构成,每层均由自我注意和完全连接的神经元组成,每一层编码器的输出,也是下一层编码器的输入,编码器的输入为在一个标记序列中明确地表示单个句子和一对句子,单个句子为一个连续文本的任意跨度,标记序列为输入标记序列,为一个句子或两个句子的组合;

使用WordPiece嵌入方法处理token词汇表,用特殊的分类标记CLS表示每个序列的第一个标记,与此标记对应的最终隐藏状态作为分类任务的聚合序列表示,一对句子被打包成一个单独的序列,用令牌符号SEP分隔句子,再在每个标记中添加一个学习的嵌入,表明所属的句子。

3.根据权利要求1所述的一种基于共注意的多模态融合机制检测虚假信息的方法,其特征在于,所述步骤S1中,采用两个非监督任务来预训练BERT模型,包括两个任务,

任务一:随机屏蔽输入令牌,再根据上下文预测被屏蔽的令牌,与掩码标记对应的最终隐藏向量被输入到词汇表的输出softmax中,训练数据生成器随机选择15%的令牌位置进行预测,若第i个令牌被选择,则第i个令牌80%概率替换为MASK令牌,10%的概率为随机令牌,10%的概率令牌不变,最后对具有交叉熵损失的原始令牌进行预测;

任务二:预测下一个句子,预先训练一个二值化的下一个句子的预测任务,当为每个训练前的例子选择句子A和B时,50%的概率为句子A后面的下一个句子,标记为IsNext,50%的概率为语料库中的随机句子,标记为NotNext。

4.根据权利要求1所述的一种基于共注意的多模态融合机制检测虚假信息的方法,其特征在于,文本特征提取器的输入部分由Token Embeddings、Segment Embeddings和Position Embeddings三部分组成,Token Embeddings为字符对应的索引的词向量,Segment Embeddings为用0和1作为句子之间的划分,Position Embeddings为表明位置信息,文本特征提取器的输入为信息中顺序排列的单词列表,首先将单词嵌入到向量中,将句子中的第i个词的第k维词嵌入到向量中,表示为Ti∈Rk,输入的句子为T=[T0,T1,...,Tn],其中,n为句子中单词的数量,T0为CLS嵌入到句子的顶部,使用预先训练的BERTbase,BERTbase由12个编码器构成,将BERTbase表示为Rb,输入句子T到Rb,获取输入句子对应的特征向量为对每个单独的特征向量Tf进行平均池化,平均池化后的文本特征记为其中,dt为BERT模型获取的文本特征维数,再将Rt输入到完全连接层FC,最终输出为Rtf∈Rp,与视觉特征具有相同的维数p,可以表示为:Rtf=σt(Wtf·Rt),其中,为文本特征提取器中完全连接层的权矩阵,σt为文本特征提取器中使用的LeakyRELU激活函数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210271617.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top