[发明专利]一种基于取证数据的黑灰产广告识别方法和系统在审

专利信息
申请号: 202110383854.2 申请日: 2021-04-09
公开(公告)号: CN112990980A 公开(公告)日: 2021-06-18
发明(设计)人: 江汉祥 申请(专利权)人: 厦门市美亚柏科信息股份有限公司
主分类号: G06Q30/02 分类号: G06Q30/02;G06F16/33;G06F16/903;G06N5/02
代理公司: 厦门福贝知识产权代理事务所(普通合伙) 35235 代理人: 陈远洋
地址: 361000 福建省厦门市思明*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 取证 数据 黑灰产 广告 识别 方法 系统
【说明书】:

发明给出了一种基于取证数据的黑灰产广告识别方法和系统,包括根据确定的广告涉案类型获取涉案群名关键词和涉案广告关键词,利用涉案群名关键词获取涉案群聊数据;基于涉案广告关键词获取涉案群聊数据中的涉案广告样本,利用涉案广告样本进行人工智能训练建立涉案广告识别模型;基于涉案广告识别模型对目标群聊数据进行计算分析,输出可疑广告样本和发布广告样本的嫌疑虚拟身份。本发明利用的电子取证数据中群聊数据,取证数据是经过取证工具解析与清洗,相对结构化,容易分析,效率高,同时群聊中的成员本身是具备一定目的集中在一起的,对于应用关键字查找出相关群名更有针对性,在群中找相关涉案广告样本则更有效和准确。

技术领域

本发明涉及计算机网络技术领域,尤其是一种基于取证数据的黑灰产广告识别方法和系统。

背景技术

网络诈骗,特别是网贷、理财和刷单类诈骗,往往需要在网络中寻找目标,因而就需要在网络中进行广告推广活动。而网络推广空间主要在社交领域,比如:论坛、微博、直播和群聊中。群聊作为推广的空间,主要推广形式是文本广告,目标对象是相关群中的群成员。

目前网络诈骗已经在诈骗案件中占比超过50%,而且有越来越多的趋势。所以识别出这些为诈骗开展广告推广的黑灰产链条,一方面有利于找出发布广告的嫌疑人及广告宿主的嫌疑线索——网站域名、APP、电话、银行卡等,同时有利于收集广告样本,以供人工智能训练,完善识别模型,以便智能识别更多的可疑广告,可以给相关网络服务商进行广告拦截。

目前涉案推广广告的识别一般是针对互联网公开数据开展的,需要应用搜索引擎进行关键字搜索,数据源只能是一些公开的网络空间,而且数据样本比较杂乱,这些都约束了样本的数量与质量。

发明内容

针对现有技术中应用搜索引擎进行关键字搜索导致数据源只能是一些公开的网络空间,并且数据样本杂乱,导致样本的数量与质量收到约束的技术难题,本发明提出了一种基于取证数据的黑灰产广告识别方法和系统,用以解决上述技术问题。

根据本发明的一个方面一种基于取证数据的黑灰产广告识别方法,包括:

根据确定的广告涉案类型获取涉案群名关键词和涉案广告关键词,利用涉案群名关键词获取涉案群聊数据;

基于涉案广告关键词获取涉案群聊数据中的涉案广告样本,利用涉案广告样本进行人工智能训练建立涉案广告识别模型;

基于涉案广告识别模型对目标群聊数据进行计算分析,输出可疑广告样本和发布广告样本的嫌疑虚拟身份。

在具体的实施例中,涉案群名关键词和涉案广告关键词从关键词知识库中选择。

在具体的实施例中,在建立和更新涉案广告识别模型时将新获取的关键词更新至关键词知识库中。

在具体的实施例中,涉案广告样本为利用涉案广告关键词对群聊数据中疑似广告聊天内容进行匹配后的结果。

在具体的实施例中,疑似广告聊天内容为在群聊数据中重复发布次数超过第一阈值,内容字数大于第二阈值的聊天内容。

在具体的实施例中,第一阈值为5,第二阈值为100。

在具体的实施例中,关键词知识库包括字段内容为:案件类别、关键词、是否适合标题搜索、是否适合内容搜索、是否为正则表达式和是否必要条件。

在具体的实施例中,群聊数据包括应用类型、宿主ID、群ID、发言方ID、发言时间、发言类型、发言内容、附件名称。

在具体的实施例中,还包括群属性数据和群成员数据,群属性数据包括应用类型、宿主ID、群ID、群名称、群创建人ID、群创建人昵称、创建时间和成员数量;群成员数据包括应用类型、宿主ID、群ID、群名称、群创建人ID、群创建人昵称、创建时间和成员数量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110383854.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top