[发明专利]一种基于特征匹配网络的社团划分方法和装置有效
申请号: | 201611110731.7 | 申请日: | 2016-12-06 |
公开(公告)号: | CN106709800B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 李旭瑞;邱雪涛;赵金涛;钟毅;胡奕 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 200135 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 匹配 网络 社团 划分 方法 装置 | ||
本发明实施例涉及数据处理领域,尤其涉及一种基于特征匹配网络的社团划分方法和装置,用于对社团划分。本发明实施例中,根据预设的K个哈希函数,确定每个账号信息对应的K位哈希向量;将每个账号信息对应的哈希向量,顺序划分为m=K/k类子哈希向量;针对每个类,将子哈希向量相同的账号信息划分为同一组;计算同一组内的各账号信息之间的相似度;若各账号信息之间的相似度大于阈值,则在各账号信息之间建立互连边,形成特征匹配网络;根据特征匹配网络,对各账号信息进行社团划分,进而可以根据划分后的社团进行社团分析,发现异常社团。
技术领域
本发明实施例涉及数据处理领域,尤其涉及一种基于特征匹配网络的社团划分方法和装置。
背景技术
目前,国内信用卡市场面临的风险形势日益严峻,信用卡套现、伪卡欺诈、盗卡欺诈等案件日益增加,具体的,信用卡套现是指持卡人通过虚假消费交易或与商户合谋刷卡后获取现金,之后退款或购买容易变现商品后变卖获取现金等行为、伪卡欺诈是指按照银行卡的磁条信息格式写磁,凸印或平印伪造真实有效的银行卡进行交易的欺诈行为;盗卡欺诈是指欺诈者获得真实持卡人的部分或者全部信息并假冒真实持卡人对账户的信息进行变更以达到欺诈目的的行为。信用卡犯罪手段不断向着高科技、集团化、专业化发展,案件实施过程更为隐蔽,手法不断翻新,这对银行和持卡人的资金安全构成威胁,成为制约信用卡产业长期健康发展的重要因素。
面对各种各样的欺诈手段,现有技术中,通常采用聚类的方法来应对,然而采用这种方法存在多种缺陷,例如,一方面,如果后续对反欺诈模型添加数据,会对反欺诈模型更新数据造成困难,另一方面,经过聚类之后,虽然能将节点划分为若干类,但群体内的结构以及结构之间的关联仍然难以描述。
综上所述,现有技术中存在着如果后续对反欺诈模型添加数据,造成反欺诈模型更新数据困难;经过聚类之后,群体内的结构以及结构之间的关联仍然难以描述的问题,因此,需要采取有效的措施来解决以上问题。
发明内容
本发明实施例提供一种基于特征匹配网络的社团划分方法和装置,用以解决现有技术中存在着如果后续对反欺诈模型添加数据,造成反欺诈模型更新数据困难、经过聚类之后,群体内的结构以及结构之间的关联仍然难以描述的问题。
本发明实施例提供一种基于特征匹配网络的社团划分方法,包括:
根据预设的K个哈希函数,确定每个账号信息对应的K位哈希向量;
将每个账号信息对应的哈希向量,顺序划分为m=K/k类子哈希向量;
针对每个类,将子哈希向量相同的账号信息划分为同一组;
计算同一组内的各账号信息之间的相似度;
若各账号信息之间的相似度大于阈值,则在各账号信息之间建立互连边,形成特征匹配网络;
根据特征匹配网络,对各账号信息进行社团划分。
可选地,计算同一组内的各账号信息之间的相似度,包括:
若第i账号信息与第j账号信息位于n类同组中,则将n/m作为第i帐号信息与第j账号信息之间的相似度;第i账号信息与第j账号信息为各账号信息中的任一个。
可选地,计算同一组内的各账号信息之间的相似度,包括:
若第i账号信息与第j账号信息位于同一组中,统计第i账号信息的哈希向量与第j账号信息的哈希向量中位于同一位且哈希向量值相同的个数h;第i账号信息与第j账号信息为各账号信息中的任一个;
第i账号信息与第j账号信息的相似度s=h/K。
可选地,根据预设的K个哈希函数,确定每个账号信息对应的K位哈希向量,包括:
根据公式(1)确定每个账号信息对应的K位哈希向量
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611110731.7/2.html,转载请声明来源钻瓜专利网。