[发明专利]一种招聘岗位描述文本的生成方法、装置、设备及介质有效
| 申请号: | 202010381686.9 | 申请日: | 2020-05-08 |
| 公开(公告)号: | CN113627135B | 公开(公告)日: | 2023-09-29 |
| 发明(设计)人: | 秦川;姚开春;祝恒书;马超;申大忠;徐童 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F40/166 | 分类号: | G06F40/166;G06N3/04;G06N3/08 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 招聘 岗位 描述 文本 生成 方法 装置 设备 介质 | ||
1.一种招聘岗位描述文本的生成方法,其特征在于,包括:
获取目标岗位的原始相关文本;
基于所述原始相关文本和预先训练出的深度神经网络模型,生成所述目标岗位对应的目标招聘岗位描述文本;
其中,所述深度神经网络模型包括:
文本主题预测子模型,用于根据所述原始相关文本,预测出目标技能主题分布向量;
描述文本生成子模型,用于根据所述目标技能主题分布向量,生成所述目标岗位的目标招聘岗位描述文本;
其中,所述文本主题预测子模型包括:
词袋特征提取模块,用于提取所述原始相关文本的词袋特征向量;
分布参数计算模块,用于根据所述词袋特征向量和非线性网络层,计算技能主题向量分布参数;
第一主题分布确定模块,用于根据所述技能主题向量分布参数以及预设主题分布假设参数,获得目标技能主题分布向量;
其中,所述描述文本生成子模型包括:
编码器模块,用于生成所述原始相关文本中当前句子的语义表征向量序列;
注意力模块,用于根据所述目标技能主题分布向量,对所述语义表征向量序列进行加权变换;
解码器模块,用于根据加权变换后的语义表征向量序列,预测所述当前句子的技能主题标签;并根据所述技能主题标签预测出目标招聘岗位描述文本的当前词。
2.根据权利要求1所述的方法,其特征在于,所述原始相关文本包括:已确定符合岗位要求人员的简历文本、包含岗位职责数据的文本、以及包含岗位涉及项目数据的文本中的至少一个。
3.根据权利要求1所述的方法,其特征在于,所述词袋特征提取模块包括:
词袋生成子模块,用于生成所述原始相关文本的词袋表征数据;
第一全连接网络子模块,用于对所述词袋表征数据进行特征提取,获得词袋特征向量。
4.根据权利要求1所述的方法,其特征在于,所述分布参数计算模块包括:
第一参数计算子模块,用于根据所述词袋特征向量和预先设置的第一非线性网络层,计算第一技能主题向量分布子参数;
第二参数计算子模块,用于根据所述词袋特征向量和预先设置的第二非线性网络层,计算第二技能主题向量分布子参数。
5.根据权利要求4所述的方法,其特征在于,所述第一主题分布确定模块包括:
第三参数计算子模块,用于根据第一技能主题向量分布子参数和第一预设主题分布假设子参数,计算第三技能主题向量分布参数;其中,所述第一预设主题分布假设子参数和所述第三技能主题向量分布参数成正比关系;
第四参数计算子模块,用于根据第二技能主题向量分布子参数和第二预设主题分布假设子参数,计算第四技能主题向量分布参数;其中,所述第二预设主题分布假设子参数和所述第四技能主题向量分布参数成对数关系;
第一主题向量采样子模块,用于根据第三技能主题向量分布参数和第四技能主题向量分布参数,获得第一技能主题向量;
第二全连接网络子模块,用于对第一技能主题向量进行特征提取,获得第一主题特征向量;
第一主题分布特征计算子模块,用于根据第一主题特征向量和第一激活函数,获得目标技能主题分布向量。
6.根据权利要求1所述的方法,其特征在于,所述编码器模块包括:
词向量生成子模块,用于生成所述原始相关文本中当前句子所包含各个词的词向量;
第一循环神经网络子模块,用于根据各所述词向量生成所述当前句子的语义表征向量序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010381686.9/1.html,转载请声明来源钻瓜专利网。





