[发明专利]反欺诈黑产实体识别方法及系统在审
申请号: | 202110231361.7 | 申请日: | 2021-03-02 |
公开(公告)号: | CN113065943A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 刘培彬;熊雷 | 申请(专利权)人: | 苏宁金融科技(南京)有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 盛安平 |
地址: | 211800 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 欺诈 实体 识别 方法 系统 | ||
本发明公开一种反欺诈黑产实体识别方法及系统,涉及互联网金融科技技术领域,能够提升黑产实体的识别准确率和识别效率。该方法包括:采集黑产数据,清洗处理后得到包括黑产实体信息的有效数据;基于黑产分类表对有效数据进行分类打标,得到标签数据;将有效数据中的黑产实体信息与企业客户数据做关联匹配,输出企业客户数据中的黑产识别结果,所述黑产识别结果包括企业客户数据中潜在的风险实体及对应的所述标签数据。该系统应用有上述方案所提的方法。
技术领域
本发明涉及互联网金融科技技术领域,尤其涉及一种反欺诈黑产实体识别方法及系统。
背景技术
互联网金融黑产,来源于那些本身就缺乏足够的信用记录的金融信贷产品客户群,无法在银行等正规渠道获得授信,如农民工,学生等群体。其中很多人信用意识不高,存在占小便宜心理,有动机去用各种手段骗取授信,获取现金,但没有还款意愿。由此,催生了一些互联网金融黑产,专门针对这个客群从事各种套现、套利、参与包装身份等等的恶意行为。黑产往往通过论坛、贴吧、微博、公众号等发布各种套现、套利、包装身份的广告,引来这些客群的关注。所以爬取黑产的最新动态、发布信息,可以对银行金融业务提供预警,对这类群体申请贷款时拒绝以减少不必要损失。因此,如何利用技术手段对黑产实体进行有效甄别,逐渐成为了信贷行业需要解决的问题。
发明内容
本发明的目的在于提供一种反欺诈黑产实体识别方法及系统,能够提升黑产实体的识别准确率和识别效率。
为了实现上述目的,本发明的第一方面提供一种反欺诈黑产实体识别方法,包括:
采集黑产数据,清洗处理后得到包括黑产实体信息的有效数据;
基于黑产分类表对所述有效数据进行分类打标,得到标签数据;
将所述有效数据中的黑产实体信息与企业客户数据做关联匹配,输出企业客户数据中的黑产识别结果,所述黑产识别结果包括企业客户数据中潜在的风险实体及对应的所述标签数据。
优选地,采集黑产数据,清洗处理后得到包括黑产实体信息的有效数据的方法包括:
采集的黑产数据包括用户ID、内容详情、数据来源、链接地址和发表时间,所述内容详情包括黑产实体信息、或者同时包括终端识别号和/或登陆IP地址;
采用预设的正则表达式对所述黑产数据进行清洗,提取出包括黑产实体信息的有效数据。
较佳地,基于黑产分类表对所述有效数据进行分类打标,得到标签数据的方法包括:
所述黑产分类表中包括多个标签数据,以及与每个所述标签数据对应的多个关键词;
将所述有效数据分词后与各所述标签数据对应的关键词一一对应的匹配;
统计所述有效数据的分词与各所述标签数据对应关键词的匹配数量,筛选匹配数量最多的标签数据作为所述有效数据的所述标签数据。
进一步地,将所述有效数据中的黑产实体信息与企业客户数据做关联匹配,输出企业客户数据中的黑产识别结果的方法包括:
利用知识图谱将黑产实体信息与企业客户数据做关联匹配,识别出企业客户数据中的贷款实体与所述黑产实体信息的关联关系,所述关联关系包括关联层级和关联节点个数;
根据所述关联关系匹配出企业客户数据中潜在的风险实体,并将所述风险实体及对应的所述标签数据关联输出,得到黑产识别结果。
优选地,还包括:
构建所述标签数据与风险等级的映射关系,所述风险等级的欺诈概率从低往高依次为灰色账户、高危账户、黑色账户和极黑账户;
在输出所述黑产识别结果时,同时输出对应的所述风险等级。
优选地,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁金融科技(南京)有限公司,未经苏宁金融科技(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110231361.7/2.html,转载请声明来源钻瓜专利网。