[发明专利]一种基于强化学习和事理知识图谱的真假消息鉴别方法在审
| 申请号: | 202111554272.2 | 申请日: | 2021-12-17 |
| 公开(公告)号: | CN114429126A | 公开(公告)日: | 2022-05-03 |
| 发明(设计)人: | 陈涛;张卫山;王振琦;孙晨瑜 | 申请(专利权)人: | 中国石油大学(华东) |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/35;G06F16/36;G06N3/04 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 266580 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 强化 学习 事理 知识 图谱 真假 消息 鉴别方法 | ||
1.一种基于强化学习和事理知识图谱的真假消息鉴别方法,将大量的网络舆情数据以及用户评论和反馈数据联合建模,通过弱分类器实现真假消息预分类,强化学习筛选器选择置信度高的数据,用以分类训练,分类器将事理知识图谱与预训练语言表示模型BERT相结合,使机器在语义解析时,能够利用相关舆情知识进行真假推理。具体包括以下步骤:
步骤(1)、对每一条舆情数据进行分词、去除停用词预处理;
步骤(2)、手动标定小部分预处理好的数据集;并使用标定好的部分数据微调XLNET预训练模型;
步骤(3)、在使用XLNET模型对无标签数据进行弱分类;
步骤(4)、针对步骤(3)分好类的数据,使用强化学习算法筛选出高置信度的数据;
步骤(5)、结合事理知识图谱,使用BERT对步骤(4)筛选出来的数据进行真假消息鉴别;
步骤(6)、根据步骤(5)分类的结果,反向更新XLNET弱分类器和强化学习筛选算法;
步骤(7)、重复执行步骤(3)至步骤(6),直到真假消息鉴别收敛。
2.一种强化学习筛选数据的方法。强化学习中的智能体能够根据真伪消息鉴别器(EEG-BERT)对数据真伪的判断结果,动态调整该条数据的可行度,并给数据筛选算法打分,从而强化学习筛选算法,同时更新弱分类器。具体包括一下步骤:
步骤(1)、智能体评估真伪消息鉴别器(EEG-BERT)的预测结果;
步骤(2)、智能体动态调整真伪消息鉴别器的输入数据的置信度;
步骤(3)、智能体给数据筛选算法打分;
步骤(4)、更新强化学习筛选算法和弱分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111554272.2/1.html,转载请声明来源钻瓜专利网。





