[发明专利]风险用户识别方法、装置、计算机设备及存储介质在审
| 申请号: | 201811527385.1 | 申请日: | 2018-12-13 |
| 公开(公告)号: | CN109801073A | 公开(公告)日: | 2019-05-24 |
| 发明(设计)人: | 刘波;唐文;林瑜;侯明远 | 申请(专利权)人: | 中国平安财产保险股份有限公司 |
| 主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G06Q40/08;G06K9/62 |
| 代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 林燕云 |
| 地址: | 518000 广东省深圳市福田区益田路*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 聚类 计算机设备 存储介质 概率分布 节点向量 用户识别 机器学习模型 准确度 参数设置 混合模型 节点转化 客户预测 数据对应 贝叶斯 非参数 采样 概率 预设 嵌入 | ||
1.一种风险用户识别方法,其特征在于,包括:
获取理赔数据对应的节点,通过图嵌入将节点转化为节点向量;
通过贝叶斯非参数混合模型对所述节点向量进行聚类,得到多个聚类群;
通过采样获取每一聚类群的概率分布,若根据聚类群的概率分布得到的概率值大于预设的概率阈值,将对应的聚类群所包括的节点进行风险用户的标识。
2.根据权利要求1所述的风险用户识别方法,其特征在于,所述通过图嵌入将节点转化为节点向量,包括:
根据理赔数据的节点进行织网,得到初始图;
通过带权重的采样对所述初始图进行采样,获取多个采样序列,将每一采样序列作为一个节点向量。
3.根据权利要求2所述的风险用户识别方法,其特征在于,所述根据理赔数据的节点进行织网,得到初始图,包括:
将理赔数据的节点作为图的初始节点;
若初始节点之间存在数据关联,将对应的节点通过连接边连接,并通过数据关联的权重值对应获取连接边的权重值,以得到包括有权重连接边的初始图。
4.根据权利要求1所述的风险用户识别方法,其特征在于,所述通过贝叶斯非参数混合模型对所述节点向量进行聚类,得到多个聚类群,包括:
获取由所述节点向量组成的混合高斯分布;
获取混合高斯分布中满足狄利克雷过程的有限划分,得到与节点向量对应的多个聚类群。
5.根据权利要求1所述的风险用户识别方法,其特征在于,所述通过采样获取每一聚类群的概率分布,包括:
通过吉布斯抽样获取每一聚类群的概率分布。
6.一种风险用户识别装置,其特征在于,包括:
节点向量获取单元,用于获取理赔数据对应的节点,通过图嵌入将节点转化为节点向量;
聚类单元,用于通过贝叶斯非参数混合模型对所述节点向量进行聚类,得到多个聚类群;
风险识别单元,用于通过采样获取每一聚类群的概率分布,若根据聚类群的概率分布得到的概率值大于预设的概率阈值,将对应的聚类群所包括的节点进行风险用户的标识。
7.根据权利要求6所述的风险用户识别装置,其特征在于,所述节点向量获取单元,包括:
初始织网单元,用于根据理赔数据的节点进行织网,得到初始图;
权重采样单元,用于通过带权重的采样对所述初始图进行采样,获取多个采样序列,将每一采样序列作为一个节点向量。
8.根据权利要求6所述的风险用户识别装置,其特征在于,所述聚类单元,包括:
先验分布获取单元,用于获取由所述节点向量组成的混合高斯分布;
有限划分单元,用于获取混合高斯分布中满足狄利克雷过程的有限划分,得到与节点向量对应的多个聚类群。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的风险用户识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至5任一项所述的风险用户识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安财产保险股份有限公司,未经中国平安财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811527385.1/1.html,转载请声明来源钻瓜专利网。





