[发明专利]搜索引擎有效
申请号: | 201710908835.0 | 申请日: | 2017-09-29 |
公开(公告)号: | CN107958014B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | S.R.加德里;陶学军;田野;M.考特尼;陈佩君;C.波斯 | 申请(专利权)人: | 谷歌公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/33 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索引擎 | ||
1.一种用于执行搜索的方法,包括:
定义向量词汇表;
定义包括多个不同职业的职业分类;
获得多个标记的训练数据项,其中每个标记的训练数据项至少与(i)职位、和(ii)职业相关联;
为相应的标记的训练数据项中的每一个生成包括用于所述向量词汇表中的每个相应术语的特征权重的职业向量,所述特征权重基于(i)表示反向职业频率的值,该反向职业频率基于职业分类中的职业的数量所确定,其中相应的训练数据项的职位中的每个相应的项存在于职业分类中,以及(ii)表示职业导数的值,该职业导数基于跨越职业分类中相应的职业中的每一个的相应的训练数据项的职位中每个相应术语的密度;
基于用于生成所述职业向量的所述标记的训练数据项的职业,将每个相应职业向量与所述职业分类中的职业相关联;
接收包括与一个或多个潜在工作机会的特征有关的字符串的搜索查询;
基于所接收的查询生成第一向量;
针对所述职业分类中的多个职业的每个相应职业确定指示查询向量是否在相应职业中被正确分类的置信度;
选择与最高置信度相关联的特定职业;
使用所选职业获得一个或多个工作岗位;以及
响应于所述搜索查询,提供在搜索结果的集合中所获得的工作岗位。
2.如权利要求1所述的方法,其中定义向量词汇表包括生成包括存在于存储在文本语料库中的至少一个训练数据项中的术语和不存在于存储在所述文本语料库中的至少一个训练数据项中的术语的向量词汇表。
3.如权利要求1所述的方法,其中定义向量词汇表包括生成仅仅包括存在于存储在文本语料库中的至少一个训练数据项中的术语的向量词汇表。
4.如权利要求1所述的方法,其中所述特征权重至少部分地基于表示术语频率的第一值,所述术语频率至少部分地基于所述相应的训练数据项的职位中的每个相应术语的出现次数所确定。
5.如权利要求1所述的方法,其中所述特征权重至少部分地基于表示反向职业频率的第二值,所述反向职业频率至少部分地基于所述职业分类中的职业的数量所确定,其中相应的训练数据项的职位中的每个相应的术语存在于所述职业分类中。
6.如权利要求1所述的方法,其中所述特征权重至少部分地基于表示职业导数的第三值,所述职业导数至少部分地基于跨越所述职业分类中的相应的职业中的每一个的相应的训练数据项的职位中每个相应术语的密度。
7.如权利要求1所述的方法,其中所述特征权重至少部分地基于(i)表示所述反向职业频率的第二值以及基于(ii)表示职业导数的第三值两者,所述反向职业频率至少部分地基于职业分类中的职业的数量来确定,其中相应训练数据项的职位中的每个相应的术语存在于所述职业分类中,所述职业导数至少部分地基于跨越所述职业分类中的相应的职业中的每一个的相应的训练数据项的职位中每个相应术语的密度。
8.如权利要求7所述的方法,其中所述特征权重基于(i)表示所述反向职业频率的第二值和(ii)表示所述职业导数的所述第三值的三分之一的和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710908835.0/1.html,转载请声明来源钻瓜专利网。