[发明专利]适用于人岗匹配推荐系统的文本解析方法及装置有效
申请号: | 201911303927.1 | 申请日: | 2019-12-17 |
公开(公告)号: | CN111125343B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 吴佳俊 | 申请(专利权)人: | 领猎网络科技(上海)有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F16/9535;G06Q10/105 |
代理公司: | 北京知果之信知识产权代理有限公司 11541 | 代理人: | 唐海力 |
地址: | 200000 上海市徐汇区吴*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 适用于 匹配 推荐 系统 文本 解析 方法 装置 | ||
1.一种适用于人岗匹配推荐系统的文本解析方法,其特征在于,包括:
获取用人单位录入的职位文本信息和求职人员录入的简历文本信息,所述职位文本信息为针对待招聘职位的相关信息,所述简历文本信息为所述求职人员的简历;
针对所述职位文本信息和所述简历文本信息设置多个信息标签,所述信息标签对应的标签信息至少包括职位职能分类、高频关键词、技能关键词、细分行业、薪资预测、职位所需工作年限、职位所需学历;
采用与每种标签信息相匹配的标签生成方法生成标签信息;
所述采用与每种标签信息相匹配的标签生成方法生成标签信息,包括:
基于系统中所有的职位文本信息预训练职位职能分类模型;
提取所述职位文本信息和所述简历文本信息中的职位名称信息;
将所述职位名称信息放入所述职位职能分类模型做匹配,输出分类结果;
所述基于系统中所有的职位文本信息预训练职位职能分类模型,包括:
基于系统中所有的职位文本信息,结合TFIDF算法、低频词过滤、bi-gram互信息计算和人工整合整理3层职位分类体系;
利用所述3层职位分类体系的分类标识建立一个3级对应2级的tier树;
将建立的tier树关系存储到tier树结构中;
在将所获取的职位名称信息放入分类模型做匹配,输出分类结果时,包括:从存在的字符开始比较,如果不存在tier树的起始查找列表中,则跳过;
所述采用与每种标签信息相匹配的标签生成方法生成标签信息,包括:
基于系统中所有的简历文本信息和职位文本信息预训练细分行业标签体系;
分析所述职位文本信息中职位所属公司和所述简历文本信息中简历工作经历所在公司,获取公司相关信息;
将所述公司相关信息放入所述细分行业标签体系中计算出一级细分行业和二级细分行业分类标签。
2.根据权利要求1所述的方法,其特征在于,所述采用与每种标签信息相匹配的标签生成方法生成标签信息,包括:
提取所述简历文本信息中的工作经验和项目经验,并提取所述职位文本信息中的职位描述和职位要求;
对所述工作经验、所述项目经验、所述职位描述和所述职位要求进行分词处理;
对所述分词处理的分词结果进行词频、词性、语义相关性的特征综合判断单个单词的关键程度。
3.根据权利要求2所述的方法,其特征在于,所述采用与每种标签信息相匹配的标签生成方法生成标签信息,包括:
基于系统中所有的简历文本信息预训练技能关键词提取模型;
将所述工作经验、所述项目经验、所述职位描述和所述职位要求放入所述关键词提取模型中计算,并输出结果至数据库。
4.根据权利要求1所述的方法,其特征在于,所述采用与每种标签信息相匹配的标签生成方法生成标签信息,包括:
采用正则匹配公式对所述职位文本信息中对职位所需的最小工作年限、最大工作年限或者所述职位所需的最低学历进行提取。
5.根据权利要求1所述的方法,其特征在于,所述采用与每种标签信息相匹配的标签生成方法生成标签信息,包括:
基于系统中所有的简历文本信息对应的有效标签信息和所有简历文本信息中的基本信息建立薪资预测模型;
判断所述简历文本信息中是否包含描述薪资的薪资信息;
若包含则将所述薪资信息存入数据库中;
若不包含则从所述数据库中获取所述简历文本信息的目标标签信息和目标基本信息,所述目标标签信息和所述目标基本信息与生成所述薪资预测模型的标签信息和基本信息相似;
基于所述薪资预测模型判断和所述目标标签信息、所述目标基本信息预测所述简历文本信息对应的预测薪资。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于领猎网络科技(上海)有限公司,未经领猎网络科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911303927.1/1.html,转载请声明来源钻瓜专利网。