[发明专利]一种基于区块链的自动合成新闻的检测方法及系统有效

专利信息
申请号: 202110035612.4 申请日: 2021-01-12
公开(公告)号: CN113158646B 公开(公告)日: 2023-10-27
发明(设计)人: 毛典辉;黄晖煜;张青川;李海生;左敏;蔡强 申请(专利权)人: 北京工商大学
主分类号: G06F40/216 分类号: G06F40/216;G06F16/35;G06N20/00
代理公司: 北京科迪生专利代理有限责任公司 11251 代理人: 江亚平
地址: 100048*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 区块 自动 合成 新闻 检测 方法 系统
【说明书】:

发明涉及一种基于区块链的自动合成新闻的检测方法及系统,其方法包括:步骤S1:将区块链上的新闻样本集,输入逻辑回归分类模型进行训练,得到初始的新闻分类结果;步骤S2:利用激励机制对新闻样本集进行纠错;步骤S3:通过生成网络,得到机器合成新闻样本,并与真实新闻样本一起输入判别网络进行判别训练,并生成近似真实新闻的机器合成新闻样本;步骤S4:计算合成新闻样本和真实新闻样本的比例,当超过阈值,将机器合成新闻样本加入新闻样本集,进行增量训练,得到更新后的新闻分类结果。本发明可以提高样本集的质量,均衡新闻正负样本,防止过度拟合,并使用智能合约来增量训练逻辑回归分类模型,解决逻辑回归分类模型容易过时的问题。

技术领域

本发明涉及区块链和机器学习领域,具体涉及一种基于区块链的自动合成新闻的检测方法及系统。

背景技术

目前,检测自动合成新闻的方法主要分为两种:事实核查以及机器学习。事实核查通过参考可信赖的网站进行比对。基于机器学习方法需要人工构造特征,通过对人工标注的数据集进行特征提取和学习来构建分类模型。然而,深度预训练语言模型能力的提高颠覆了过往的假设,自动合成新闻在“风格”和“结构”上与真实新闻越发相似。

因此,对于机器学习模型而言,自动合成新闻的特征提取和选择是十分困难的,这决定机器学习模型的上限。并且,当模型被部署到平台上并实际使用后,若不及时获取足够多的最新数据并重新训练,它们将很快会过时。此外,目前自动合成新闻的数量远小于真实新闻的数量,所以构建分类模型时存在正负样本不均衡的问题,这将严重降低模型的泛化能力,从而导致模型失效。

发明内容

为了解决上述技术问题,本发明提供一种基于区块链的自动合成新闻的检测方法及系统。

本发明技术解决方案为:一种基于区块链的自动合成新闻的检测方法,包括:

步骤S1:将区块链上的新闻样本集,输入逻辑回归分类模型进行训练,得到初始的新闻分类结果;

步骤S2:根据所述新闻分类结果,利用激励机制对所述新闻样本集进行纠错;

步骤S3:通过生成网络,得到机器合成新闻样本,并与真实新闻样本一起输入判别网络进行判别训练,直到所述生成网络生成近似真实新闻特征分布的机器合成新闻样本;

步骤S4:计算新闻样本集中所述机器合成新闻样本和所述真实新闻样本的比例,如果所述比例超过预设的阈值,则将所述机器合成新闻样本加入所述新闻样本集,输入所述逻辑回归分类模型进行增量训练,得到更新后的新闻分类结果。

本发明与现有技术相比,具有以下优点:

1、本发明公开了一种基于区块链的自动合成新闻的检测方法,利用n-gram特征和TF-IDF算法对逻辑回归分类模型进行改进,使该模型能获得到部分时序信息缓解时间序列预测问题,从而捕捉自动合成新闻过程中的抽样方案留下的“伪影”。

2、本发明利用区块链技术对新闻样本集进行纠错,供参与者协作构建新闻样本集。通过激励机制惩罚提交不良数据的贡献者,鼓励贡献者提交能够提高逻辑回归分类模型准确性的新闻样本,以提高样本集的质量。

3、本发明利用生成网络和判别网络进行博弈训练,从而生成机器合成新闻样本,使得新闻样本集的正负样本均衡,防止比例过大的样本造成过拟合,即预测偏向样本数较多的分类,从而实现大幅度提高增量式分类模型的泛化能力。同时,使用智能合约来增量训练逻辑回归分类模型,解决已发布的逻辑回归分类模型若不获取更多数据并对其进行重新训练将很快变得过时的问题。

附图说明

图1为本发明实施例中一种基于区块链的自动合成新闻的检测方法的流程图;

图2为本发明实施例中一种基于区块链的自动合成新闻的检测方法的结构示意图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110035612.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top