[发明专利]一种作弊信息的挖掘方法、作弊信息的识别方法及装置在审

专利信息
申请号: 202010641397.8 申请日: 2020-07-06
公开(公告)号: CN111666317A 公开(公告)日: 2020-09-15
发明(设计)人: 唐亚腾;钟滨;徐进;施雯洁 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/26;G06Q10/10
代理公司: 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人: 李杭
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 作弊 信息 挖掘 方法 识别 装置
【说明书】:

本申请公开了一种基于人工智能的作弊信息挖掘方法,本申请可采用大数据实现如下步骤:获取待检测用户所对应的查询信息集合;若查询信息集合中存在至少一条满足信息作弊条件的查询信息,则将待检测用户确定为作弊用户;获取作弊用户在历史时间段内的历史查询信息集合;若历史查询信息集合中存在满足信息作弊条件的历史查询信息,则将满足信息作弊条件的历史查询信息确定为作弊信息。本申请还提供了一种作弊信息的识别方法及装置,本申请获取作弊用户在历史时间段内的查询信息,由此挖掘出作弊的查询信息,从而提升了信息处理的效率,减少了信息挖掘的复杂度,并且节省了人力成本和时间成本。

技术领域

本申请涉及人工智能领域,尤其涉及一种作弊信息的挖掘方法、作弊信息的识别方法及装置

背景技术

随着网络的发展,网络信息更新的速度也越来越快,网络黑产已成为危害互联网生态安全的重大问题之一。由于网络中存在的作弊行为在不断地变化和转移,因此,需要对网络黑产进行分析与监控,尽可能从源头上发现和打击黑灰产。

目前,在一些搜索场景中,用户可通过搜索系统提供的搜索界面输入查询信息(query),搜索系统基于query判断搜索意图,然后针对该query进行提示补充,最后展示于搜索界面。如果检测到query存在敏感意图(例如,色情或者暴力等),则可以将这些query作为挖掘到的敏感query,并用于后续的处理。

然而,网络黑产开始利用搜索引擎优化(Search Engine Optimization,SEO)机制进行恶意导流,出现了很多含同音字、同形字以及拼音字母结合等作弊的敏感query,如果要挖掘这些作弊的query,则需要花费大量的人力和时间进行查找,导致信息挖掘成本较高。

发明内容

本申请实施例提供了一种作弊信息的挖掘方法、作弊信息的识别方法及装置,获取作弊用户在历史时间段内的查询信息,由此挖掘出作弊的查询信息,从而提升了信息处理的效率,减少了信息挖掘的复杂度,并且节省了人力成本和时间成本。

有鉴于此,本申请一方面提供一种作弊信息的挖掘方法,包括:

获取待检测用户所对应的查询信息集合,其中,查询信息集合包括M条查询信息,M为大于或等于1的整数;

若查询信息集合中存在至少一条满足信息作弊条件的查询信息,则将待检测用户确定为作弊用户;

获取作弊用户在历史时间段内的历史查询信息集合,其中,历史查询信息集合包括至少一条历史查询信息;

若历史查询信息集合中存在满足信息作弊条件的历史查询信息,则将满足信息作弊条件的历史查询信息确定为作弊信息。

本申请另一方面提供一种作弊信息的识别方法,包括:

获取待检测查询信息;

基于待检测查询信息,通过信息识别模型获取检测分数,其中,信息识别模型为根据作弊信息训练得到的模型,作弊信息为基于满足信息作弊条件的历史查询信息,历史查询信息属于作弊用户在历史时间段内的历史查询信息集合,作弊用户所对应的查询信息集合中存在至少一条满足信息作弊条件的查询信息,查询信息集合包括M条查询信息,M为大于或等于1的整数,历史查询信息集合包括至少一条历史查询信息;

若待检测查询信息的检测分数大于或等于检测分数阈值,则确定待检测查询信息为作弊信息。

本申请另一方面提供一种信息挖掘装置,包括:

获取模块,用于获取待检测用户所对应的查询信息集合,其中,查询信息集合包括M条查询信息,M为大于或等于1的整数;

确定模块,用于若查询信息集合中存在至少一条满足信息作弊条件的查询信息,则将待检测用户确定为作弊用户;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010641397.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top