[发明专利]一种基于多表示学习的跨领域虚假新闻检测方法在审
申请号: | 202111124543.0 | 申请日: | 2021-09-24 |
公开(公告)号: | CN113901810A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 曹娟;王彦焱;徐朝喜;谢添;李锦涛 | 申请(专利权)人: | 杭州中科睿鉴科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/906;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 沈敏强 |
地址: | 310015 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 表示 学习 领域 虚假 新闻 检测 方法 | ||
1.一种基于多表示学习的跨领域虚假新闻检测方法,其特征在于:
获取待检测的新闻文本和该新闻文本所属的领域标签;
将新闻文本输入BERT模型,提取新闻文本的词嵌入向量;
将新闻文本的词嵌入向量和领域标签输入基于多表示学习的领域共享特征生成器,得到融合的领域共享特征表达;
将融合的领域共享特征表达输入虚假新闻分类器,输出新闻真假分类的概率值结果。
2.根据权利要求1所述的基于多表示学习的跨领域虚假新闻检测方法,其特征在于:所述将新闻文本的词嵌入向量和领域标签输入基于多表示学习的领域共享特征生成器得到融合的领域共享特征表达,包括:
将新闻文本的词嵌入向量输入多个领域共享专家,生成多个不同的领域共享特征,每个领域共享特征关注领域共享知识的一个方面;
将领域标签输入经训练的领域门模型,得到各领域共享特征的权重;
基于多个领域共享专家生成的多个领域共享特征和所述领域门模型得到的相应领域共享特征权重进行加权求和,得到融合的领域共享特征表达。
3.根据权利要求1所述的基于多表示学习的跨领域虚假新闻检测方法,其特征在于:使用多层感知机作为所述虚假新闻分类器,多层感知机为多层全连接的神经网络组成,分类器的最后一层使用softmax激活函数进行归一化,输出两个和为1的浮点数,分别代表判断新闻为真的概率值和判断新闻为假的概率值。
4.根据权利要求3所述的基于多表示学习的跨领域虚假新闻检测方法,其特征在于:使用二元交叉熵损失作为所述虚假新闻分类器进行虚假新闻检测任务的损失函数,最小化虚假新闻检测预测值与真实值之间的差距。
5.一种基于多表示学习的跨领域虚假新闻检测装置,其特征在于,包括:
待检测内容获取模块,用于获取待检测的新闻文本和该新闻文本所属的领域标签;
词嵌入向量提取模块,用于将新闻文本输入BERT模型,提取新闻文本的词嵌入向量;
共享特征提取模块,用于将新闻文本的词嵌入向量和领域标签输入基于多表示学习的领域共享特征生成器,得到融合的领域共享特征表达;
真假分类模块,用于将融合的领域共享特征表达输入虚假新闻分类器,输出新闻真假分类的概率值结果。
6.根据权利要求5所述的基于多表示学习的跨领域虚假新闻检测装置,其特征在于:所述将新闻文本的词嵌入向量和领域标签输入基于多表示学习的领域共享特征生成器得到融合的领域共享特征表达,包括:
将新闻文本的词嵌入向量输入多个领域共享专家,生成多个不同的领域共享特征,每个领域共享特征关注领域共享知识的一个方面;
将领域标签输入经训练的领域门模型,得到各领域共享特征的权重;
基于多个领域共享专家生成的多个领域共享特征和所述领域门模型得到的相应领域共享特征权重进行加权求和,得到融合的领域共享特征表达。
7.根据权利要求5所述的基于多表示学习的跨领域虚假新闻检测装置,其特征在于:使用多层感知机作为所述虚假新闻分类器,多层感知机为多层全连接的神经网络组成,分类器的最后一层使用softmax激活函数进行归一化,输出两个和为1的浮点数,分别代表判断新闻为真的概率值和判断新闻为假的概率值。
8.根据权利要求7所述的基于多表示学习的跨领域虚假新闻检测装置,其特征在于:使用二元交叉熵损失作为所述虚假新闻分类器进行虚假新闻检测任务的损失函数,最小化虚假新闻检测预测值与真实值之间的差距。
9.一种存储介质,其上存储有能被处理器执行的计算机程序,其特征在于:所述计算机程序被执行时实现权利要求1~4任意一项所述基于多表示学习的跨领域虚假新闻检测方法的步骤。
10.一种基于多表示学习的跨领域虚假新闻检测,具有存储器和处理器,存储器上存储有能被处理器执行的计算机程序,其特征在于:所述计算机程序被执行时实现权利要求1~4任意一项所述基于多表示学习的跨领域虚假新闻检测方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州中科睿鉴科技有限公司,未经杭州中科睿鉴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111124543.0/1.html,转载请声明来源钻瓜专利网。