[发明专利]职位名称的识别方法、装置、计算处理设备、程序及介质在审
| 申请号: | 202111617057.2 | 申请日: | 2021-12-27 |
| 公开(公告)号: | CN114461900A | 公开(公告)日: | 2022-05-10 |
| 发明(设计)人: | 陈猛 | 申请(专利权)人: | 北京五八信息技术有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 吕俊秀 |
| 地址: | 100083 北京市海淀区学清*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 职位 名称 识别 方法 装置 计算 处理 设备 程序 介质 | ||
本申请提供的职位名称的识别方法、装置、计算处理设备、程序及介质,属于计算机技术领域。所述方法包括:接收待输出的原始职位信息;将所述原始职位信息输入至预先训练的职位信息表征模型进行预测,得到所述原始职位信息的原始职位特征,其中,所述职位信息表征模型是利用与标准职位特征相匹配的正样本、与标准职位特征不匹配的负样本,对预训练语言表征模型基于目标损失函数进行训练得到,所述目标损失函数的值与所述职位信息表征模型的稳定性和充分性相关;在所述标准职位特征中查询与所述原始职位特征相匹配的目标标准职位特征;输出所述目标标准职位特征相对应的标准职位名称。本方案可以提高进行职位特征匹配所得到标准职位名称的准确性。
技术领域
本申请属于计算机技术领域,特别涉及一种职位名称的识别方法、装置、计算处理设备、程序及介质。
背景技术
随着网络与人们生活的不断融合,用户可以通过招聘平台发布和查询各种招聘信息。
而随着用户的不断增加,职位种类也随着不断增加,由于用户在表述职位名称时会使用各种术语、简称、甚至错别字等,导致平台对职位名称进行识别变得越来越困难,以至于在给用户搜索和推荐相关职位信息的时候出现误差,大大降低了用户体验。
发明内容
本申请提供的一种职位名称的识别方法、装置、计算处理设备、程序及介质。
本申请一些实施方式提供一种职位名称的识别方法,所述方法包括:
接收待输出的原始职位信息;
将所述原始职位信息输入至预先训练的职位信息表征模型进行预测,得到所述原始职位信息的原始职位特征,其中,所述职位信息表征模型是利用与标准职位特征相匹配的正样本、与标准职位特征不匹配的负样本,对预训练语言表征模型基于目标损失函数进行训练得到,所述目标损失函数的值与所述职位信息表征模型的稳定性和充分性相关;
在所述标准职位特征中查询与所述原始职位特征相匹配的目标标准职位特征;
输出所述目标标准职位特征相对应的标准职位名称。
可选地,所述方法还包括:
基于样本职位信息与标准职位名称之间的匹配关系对所述样本职位信息进行标注,得到与标准职位特征相匹配的正样本、与标准职位特征不匹配的负样本;
分别将所述正样本和所述负样本输入至预训练语言表征模型进行预测,得到所述正样本的正样本预测特征、所述负样本的负样本预测特征;
将所述正样本的正样本预测特征、所述负样本的负样本预测特征、所述标准职位名称的标准职位特征输入至目标损失函数,得到目标损失值;
在所述目标损失值小于损失值阈值的情况下结束训练,将训练后的预训练语言表征模型作为所述职位信息表征模型,所述目标损失函数的损失值是与所述职位信息表征模型的稳定性和充分性呈负相关关系。
可选地,所述将所述正样本的正样本预测特征、所述负样本的负样本预测特征、所述标准职位名称的标准职位特征输入至目标损失函数,得到目标损失值,包括:
计算所述正样本预测特征与所述标准职位特征之间的第一余弦相似度,所述负样本预测特征与所述标准职位特征之间的第二余弦相似度;
计算所述第一余弦相似度与综合余弦相似度之间比例的相反数,得到目标损失值,所述综合余弦相似度是将所述第一余弦相似度和所述第二余弦相似度结合得到。
可选地,所述计算所述第一余弦相似度与综合余弦相似度之间比例的相反数,得到目标损失值,包括:
通过下述公式计算得到目标损失值:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京五八信息技术有限公司,未经北京五八信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111617057.2/2.html,转载请声明来源钻瓜专利网。





