[发明专利]一种处理实体的方法和设备有效
申请号: | 201510845455.8 | 申请日: | 2015-11-26 |
公开(公告)号: | CN106803178B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 周荣旺;李莎;朱楼华;张英 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/00 | 分类号: | G06F16/00;G06Q20/40 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 |
地址: | 开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 处理 实体 方法 设备 | ||
本公开公开了一种处理实体的方法和设备,该方法包括:根据起始实体的风险概率以及每一条边的扩散系数,按照风险传播的方向进行迭代处理,以确定所述实体网络关系中的每一个实体的综合风险概率;根据各实体的综合风险概率,来处理所述各实体;以此在挖掘隐案时涉及到了所有关联的实体,扩大了实体的覆盖率,并且准确率还得到了提高,同时,能够确定存在隐案的非黑实体是受哪些实体的影响,还能够支持实时性的隐案挖掘。
技术领域
本公开涉及网络技术领域,特别是涉及一种处理实体的方法和设备。
背景技术
近些年,各个支付平台的盗卡和盗帐户案件已经积累了很多,并形成了相应的黑名单。如何有效的利用这些黑名单是一个很重要的课题。现有的黑名单应用一般是直接做查询使用,即只是利用黑名单本身,对黑名单中的实体进行处罚动作。
基于黑名单的拓展应用目前一般是挖掘隐藏在其中的作案团伙,研究黑名单中的实体的行为方式等。
基于通过黑名单挖掘隐案,一般是通过反查的方式进行,即从单个黑名单中的实体出发,根据业务逻辑,向非黑实体一层层的进行反查,然后找出隐藏的有过非法行为但是没有被发现的实体。
另外,隐案挖掘的方式还可以通过标签扩散算法,进行半监督学习,通过不断的迭代,在算法稳定后会对非黑实体进行标注,然后选择标注成有非法行为的实体进行处罚动作。
经过研究,发现现有技术至少存在以下问题:
通过反查进行隐案的挖掘时只对黑名单实体有直接关系的实体进行反查,这样覆盖率不高,且会遗漏存在隐案的实体,标签扩散算法是双向扩散的,即一个实体的判断逻辑,会在迭代过程中不断受到同一个实体的影响,最终结果没法判别到底是什么原因导致的,结果的准确率不是很高,同时,因为标签扩散算法是迭代机制的,只适用于离线模型训练,对于实时性支持不够。
发明内容
本公开提出了一种处理实体的方法和设备,本公开的技术方案可以有效用于通过黑名单去发现隐案,以及预测非黑实体的作案可能性等。
本公开的技术方案如下:
一种处理实体的方法,应用于包括多个实体的实体网络关系中,其中相邻两个实体之间通过边进行连接,风险经由所述边进行传播是有方向的,所述方法包括:
根据起始实体的风险概率以及每一条边的扩散系数,按照风险传播的方向进行迭代处理,以确定所述实体网络关系中的每一个实体的综合风险概率;
根据各实体的综合风险概率,来处理所述各实体。
可选的,所述起始实体为风险概率已知的实体,所述每一条边的扩散系数是基于所述实体网络关系确定的,具体的确定过程包括以下步骤:
步骤A、根据所述实体网络关系确定各所述边的衰减系数、各所述边的风险传播概率,以及各所述边的边权重系数;
步骤B、根据各所述边的衰减系数、各所述边的风险传播概率,各所述边的边权重系数三者的乘积来确定各所述边的扩散系数。
可选的,各所述边的衰减系数是根据各所述边的业务属性来确定的;
各所述边的风险传播概率是根据各所述边所连接的相邻两个实体的历史行为而确定的;
各所述边的边权重系数是根据各所述边所连接的相邻两个实体发生的历史行为的次数来确定的。
可选的,所述根据起始实体的风险概率以及每一条边的扩散系数,按照风险传播的方向进行迭代处理,以确定所述实体网络关系中的每一个实体的综合风险概率,具体包括以下步骤:
步骤1、以多个起始实体中的第N个起始实体为起点,确定与所述第N个起始实体相关联的多条风险传播路径,N为大于0的正整数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510845455.8/2.html,转载请声明来源钻瓜专利网。