[发明专利]基于频繁图模式挖掘的企业员工层级关系发现方法及装置有效
申请号: | 202310098587.3 | 申请日: | 2023-02-10 |
公开(公告)号: | CN115858875B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 朱博;罗伦文;王洵;任明;黄建 | 申请(专利权)人: | 武汉中科通达高新技术股份有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06Q10/105 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 廉海涛 |
地址: | 430000 湖北省武汉市东湖新*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 频繁 模式 挖掘 企业 员工 层级 关系 发现 方法 装置 | ||
1.一种基于频繁图模式挖掘的企业员工层级关系发现方法,其特征在于,包括:
步骤100,根据用户属性以及工作时间长期连接基站的属性,提取企业员工的用户;
步骤200,根据企业员工用户一天的通话记录以及上网日志数据,构建用户行为的有向多权图,图中的节点表示用户,图中的连边表示用户之间的行为,每条连边均包含第一权重和第二权重,所述第一权重和第二权重分别与所述通话记录和所述上网日志数据有关;提取多天的用户数据,形成用户行为的有向多权图数据集;
步骤300,提取有向多权图中的有环子结构,在有环子结构进行剪枝,将有环结构剪枝为无环结构,将有向多权图剪枝为有向无环图,将有向多权图数据集剪枝为有向无环图数据集;
步骤400,根据连边在有向无环图数据集中出现的情况,将所有连边编码为位向量BC,并将相同位向量的连边归为同一连边组;所述位向量BC中的每个元素为0或1,长度为n,n为有向多权图数据集中有向多权图的数量;
步骤500,设置频繁阈值σ,遍历所有连边组,筛选位向量中非零元素数量大于等于阈值σ的所有连边即为频繁连边;通过深度有向算法,根据所述频繁连边生成频繁子图,组合所有频繁子图形成有向图数据集的频繁无环子图;
步骤600,根据所述有向图数据集的频繁无环子图的连边方向,推理出所有节点的层级,输出用户的层级关系。
2.根据权利要求1所述的方法,其特征在于,所述步骤100包括:
步骤101,在移动运营商的用户属性数据中,根据工作单位信息提取用户属性为某个具体工作单位的全部用户;所述用户属性数据包括:用户的姓名、年龄、性别、工作单位;
步骤102,根据具体工作单位信息提取工作单位附近的基站编号,从步骤101提取的用户中筛选出在工作时间长期连接此基站的用户,则这些提取用户即为某工作单位的所有用户。
3.根据权利要求1所述的方法,其特征在于,所述步骤200包括:
步骤201,提取企业员工用户的通话记录与上网日志;
步骤202,利用所述通话记录生成有向多权图,图的节点表示用户,连边的方向由通话记录的主叫指向被叫,连边的第一权重为一天内的所有通话时长的综合;
步骤203,从所述上网日志中筛选企业员工用户使用企业级社交APP的记录,以指定时间间隔进行采样,形成用户在社交APP上一天使用流量的时间序列,在有向多权图中,计算存在连边的两个节点之间时间序列的相似度,以所述相似度作为连边的第二权重;
步骤204,提取用户n天的通话记录与上网日志,将每一天的数据生成一个有向多权图,将n天的数据合并为有向多权图数据集。
4.根据权利要求1所述的方法,其特征在于,所述步骤300包括:
步骤301,筛选出有向多权图中所有的有环子结构,有环子结构满足条件为:存在最小有向连边组满足,其中表示有向连边,连边方向由节点指向;
步骤302,获取最小连边组的连边权重集合,计算所有连边的权重损失,对最小连边组中权重损失最小的连边进行剪枝,将所述有向多权图剪枝为有向无环图;连边的权重损失
步骤303,遍历有向多权图数据集,对数据集中所有有向多权图进行剪枝,得到有向无环图数据集。
5.根据权利要求1所述的方法,其特征在于,所述位向量包括n个元素,对应向多权图数据集中的n个有向多权图,每个元素的取值为0或1,若连边在某一有向多权图中出现时,则所述位向量中与该有向多权图对应的元素取值为1,否则取值为0;
将相同位向量的连边归为同一连边组后,计算位向量中的非零元素个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉中科通达高新技术股份有限公司,未经武汉中科通达高新技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310098587.3/1.html,转载请声明来源钻瓜专利网。