[发明专利]信息识别方法和装置及信息识别神经网络训练方法和装置在审

专利信息
申请号: 202010598887.4 申请日: 2020-06-28
公开(公告)号: CN111611981A 公开(公告)日: 2020-09-01
发明(设计)人: 杨伟风;钟滨;徐进;王志平 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 周婷婷
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信息 识别 方法 装置 神经网络 训练
【说明书】:

发明公开了一种信息识别方法和装置及信息识别神经网络训练方法和装置。该方法包括:获取在目标应用平台中发布的目标文章,其中,目标文章中至少包括文章文本、文章封面图片;对目标文章的文章文本进行特征提取,以得到文本特征,并对目标文章的文章封面图片进行特征提取,以得到图像特征;对文本特征和图像特征进行拼接,得到与目标文章匹配的多模态文章特征;根据多模态文章特征确定与目标文章匹配的目标置信度;在目标置信度指示目标文章中记载有虚假信息的情况下,从目标应用平台中删除目标文章。本发明解决了相关技术提供的信息识别方法存在识别准确性较低的问题的技术问题。

技术领域

本发明涉及计算机领域,具体而言,涉及一种信息识别方法和装置及信息识别神经网络训练方法和装置。

背景技术

在很多信息共享平台的客户端中常常会为用户定期推送不同的时事新闻信息。但这些新闻信息中不全是真实的信息,往往还会涉及一些被刻意捏造的虚假新闻信息。比如,很多媒体为了博取用户的关注度,会通过新闻传递一些未被求证的事情或纯粹人为编造的事情。

为了识别上述假新闻,目前常用的方式是采用事实校验。具体而言,先通过权威机构和高置信源发表的文章作为事实,构建事实校验库,然后利用该事实校验库中的文章与其他低置信度的文章或非权威机构发表的文章进行比较以校验文章中信息的真假。

但上述事实校验库中的文章通常是由专业人员人为审核指定的,构建过程繁复,此外事实校验库中覆盖的数据有限,无法枚举全部真实的文章。也就是说,相关技术提供的信息识别方法存在识别准确性较低的问题。

针对上述的问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种信息识别方法和装置及信息识别神经网络训练方法和装置,以至少解决相关技术提供的信息识别方法存在识别准确性较低的问题的技术问题。

根据本发明实施例的一个方面,提供了一种信息识别方法,包括:获取在目标应用平台中发布的目标文章,其中,目标文章中至少包括文章文本、文章封面图片;对目标文章的文章文本进行特征提取,以得到文本特征,并对目标文章的文章封面图片进行特征提取,以得到图像特征;对文本特征和图像特征进行拼接,得到与目标文章匹配的多模态文章特征;根据多模态文章特征确定与目标文章匹配的目标置信度;在目标置信度指示目标文章中记载有虚假信息的情况下,从目标应用平台中删除目标文章。

根据本发明实施例的另一方面,还提供了一种信息识别神经网络训练方法,其特征在于,包括:获取多个样本文章,其中,样本文章中至少包括样本文章文本、样本文章封面图片;依次将每个样本文章作为当前样本文章执行以下操作,直至达到收敛条件:对当前样本文章的样本文章文本进行特征提取,以得到样本文本特征,并对当前样本文章的样本文章封面图片进行特征提取,以得到样本图像特征;对样本文本特征和样本图像特征进行拼接,得到与当前样本文章匹配的当前多模态样本文章特征;将当前多模态样本文章特征输入当前信息识别神经网络以得到第一识别概率值,并将当前多模态样本文章特征输入当前事件识别神经网络以得到第二识别概率集,其中,第二识别概率集中包括至少一个第二识别概率值,至少一个第二识别概率值中的每个第二识别概率值为样本文章中记载的信息属于一种事件类型的概率值;利用第一识别概率值及第二识别概率集计算与当前样本文章目标损失值;在目标损失值达到收敛条件的情况下,确定当前信息识别神经网络为目标识别神经网络,其中,目标识别神经网络用于通过计算置信度来指示文章中所记载的信息的真实性,在置信度指示文章中记载有虚假信息的情况下,则删除文章。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010598887.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top