[发明专利]基于图嵌入的员工离职行为预测方法及装置在审
申请号: | 201910864727.7 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110704692A | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 尚家兴;蔡昕均;刘飞逸;江林丽;朱倩雯;李旭 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06N20/00;G06Q10/04;G06Q10/10 |
代理公司: | 11228 北京汇泽知识产权代理有限公司 | 代理人: | 武君 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 员工 低维 嵌入 工作信息 构造序列 机器学习 时间信息 相邻顶点 向量表示 向量选择 行为预测 动态图 预测 学习 | ||
本发明公开了一种结合动态图嵌入方法的员工离职行为预测方法,包括将员工的历史工作信息表示为员工节点与公司节点之间相连的二部图;通过有偏随机游走的方式,随机或有序选择相邻顶点来构造序列;对所述序列进行处理,以学习二部图的低维向量表示;对员工的基本属性与所述低维向量选择机器学习方法进行训练;利用训练的结果进行员工离职预测。本发明可以获得的特征能够更好地解决员工离职预测问题,同时比没有时间信息的其他图嵌入方法更有效。
技术领域
本发明涉及一种结合动态图嵌入方法预测员工离职行为的方法,属于机器学习、数据挖掘领域。
背景技术
员工离职预测一直是人们普遍关注的问题,员工的离职意愿将影响公司的正常发展。离职可大致分为主动离职和被动离职两类,其中被动离职如解雇等一般是由人力资源部门决定的,所以一般预测员工的主动离职行为。用于员工离职预测的数据一般分为两类,一类是公司内部的员工的信息,包括入职时间、离职时间、工作时间、职位变动信息等,主要记录的是员工从入职到离职的这段信息,由人力资源部门进行记录;另一类数据是员工个人在职业社交网络上填写的工作经历等信息,例如国内的脉脉,国外的LinkedIn等网站,记录的大多是员工个人的基本信息和历史的工作记录。员工离职预测可以被看作二分类问题,主要是根据员工的特征进行训练,预测接下来一段时间是否会发生离职行为,也有部分研究的是员工的职业生涯轨迹等,主要是预测员工在某公司的职位变动等。从研究手段来看,目前的研究可大致分为四类,第一类是用传统的机器学习算法对员工的信息进行训练预测;第二类是基于生存分析的算法,预测的是员工在某一时间点的离职情况;第三类是基于半马尔科夫链算法;第四类是结合员工社交网络的特征。不同类别的研究使用的数据集类别也不同。现有的研究主要专注在员工的基本属性如性别、年龄等对离职的影响,大多数对员工社交网络的研究也局限于网络的中心性等基本网络结构信息,很少有研究将员工的历史工作记录用二部图表示,并且用动态的图嵌入方法解决员工离职问题。
发明内容
鉴于以上所述现有技术的缺点,本发明提供一种结合动态图嵌入方法的员工离职行为预测方法及装置。
为实现上述目的及其他相关目的,本发明提供一种结合动态图嵌入方法的员工离职行为预测方法,该方法包括:
将员工的历史工作信息表示为员工节点与公司节点之间相连的二部图;
通过有偏随机游走的方式,随机或有序选择相邻顶点来构造序列;
对所述序列进行处理,以学习二部图的低维向量表示;
对员工的基本属性与所述低维向量选择机器学习方法进行训练;
利用训练的结果进行员工离职预测。
可选地,所述序列遵循时间顺序。
可选地,使用语言模型Skip-gram模型对序列进行处理,以学习二部图的低维向量表示。
可选地,所述员工的基本属性包括人口统计特征、工作信息特征、工作经验特征和经济特征。
为实现上述目的及其他相关目的,本发明还提供一种结合动态图嵌入方法的员工离职行为预测装置,该装置包括:
二部图建立模块,用于将员工的历史工作信息表示为员工节点与公司节点之间相连的二部图;
序列构造模块,用于通过有偏随机游走的方式,随机或有序选择相邻顶点来构造序列;
序列处理模块,用于对所述序列进行处理,以学习二部图的低维向量表示;
训练模块,用于对员工的基本属性与所述低维向量选择机器学习方法进行训练;
预测模块,用于利用训练的结果进行员工离职预测。
可选地,所述序列遵循时间顺序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910864727.7/2.html,转载请声明来源钻瓜专利网。