[发明专利]基于动态图谱链接分析的领域搜索排序方法有效
申请号: | 201911146865.8 | 申请日: | 2019-11-21 |
公开(公告)号: | CN111079035B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 鲍家坤;刘思培;高天成;曹玲玲;张志虎;袁鸯;宋春林;侯海婷;邹媛媛;童安玲;李金龙;李香亭;王娟;杨磊 | 申请(专利权)人: | 北方信息控制研究院集团有限公司 |
主分类号: | G06F16/9538 | 分类号: | G06F16/9538;G06F16/901;G06F16/9038 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 张玲 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 图谱 链接 分析 领域 搜索 排序 方法 | ||
本发明属于互联网搜索领域,具体涉及一种基于动态图谱链接分析的领域搜索排序方法。本发明首先为领域搜索中的文件资源建立语义层面链接关系,进而从权威度和相关度两个方面进行计算,最终实现搜索结果的融合排序。包括以下步骤:面向搜索排序领域图谱动态构建;基于全图的文件节点权威度离线增量计算;基于搜索子图的文件节点相关度在线计算;基于权威度与相关度的搜索结果融合排序。本申请能够以文件文本内容中的实体和关系为纽带,将原本孤立的文件从语义层面进行关联,突破单一文件的在搜索排序中的信息孤岛问题,并从文件节点的权威度和相关度两个层面进行分析计算,最终实现搜索结果的融合排序。
技术领域
本发明属于互联网搜索领域,具体涉及一种基于动态图谱链接分析的领域搜索排序方法。
背景技术
帮助用户准确、迅速地定位所需要的资源,是搜索引擎始终如一的目标。但是随着信息的不断产生与积累,一次搜索常常会返回大量结果。因此搜索引擎必须依靠有效的搜索排序方法,才能返回用户期望的结果并进行优先展示。相比互联网搜索,领域搜索中用户的专业性和目的性更强,对搜索排序也提出了更高的要求。
传统的基于词频和词位置的搜索排序方法的排序依据过于单一,并且不能对文件资源的质量进行考量。现有的基于网页链接分析的搜索排序方法(如PageRank、HillTop等),不能直接应用于缺乏网页链接关系的领域搜索。现有的基于用户浏览偏好学习的搜索排序方法(如RankSVM等),通常将一次“用户-查询”记录作为孤立样本集进行训练,虽然能够较好地处理历史用户的历史搜索请求,但对于新用户或新请求难以提供有效的排序;即使通过相似“用户-查询”进行改进,也不能适用于小用户量的领域搜索场景。互联网搜索引擎的竞价排名方法,与领域搜索的专业性、权威性原则相违背,同样不能适用。
发明内容
本发明的目的在于提供一种基于动态图谱链接分析的领域搜索排序方法。
实现本发明目的的技术解决方案为:
基于动态图谱链接分析的领域搜索排序方法,所述方法首先为领域搜索中的文件资源建立语义层面链接关系,进而从权威度和相关度两个方面进行计算,最终实现搜索结果的融合排序;具体步骤如下:
步骤(1):面向搜索排序的领域图谱动态构建;以该领域的各类文件集合为输入,构建领域图谱;
步骤(2):基于全图的文件节点权威度增量离线计算;以步骤(1)中的领域图谱为输入,计算得到领域图谱内各文件节点的权威度;
步骤(3):基于搜索子图的文件节点相关度在线计算;以领域图谱、用户检索词为输入,从整个领域图谱中抽取与检索相关的搜索子图,并计算该子图内各文件节点相关度;
步骤(4):基于权威度与相关度的搜索结果融合排序;计算过程以步骤(3)中的搜索子图中各文件节点的权威度和相关度为输入,综合计算文件节点排名度,并按排名度大小排序,返回给用户。
本发明与现有技术相比,其显著优点在于:
(1)本申请提出的面向搜索排序方法的领域图谱构建方法,能够以文件文本内容中的实体和关系为纽带,将原本孤立的文件从语义层面进行关联,突破单一文件的在搜索排序中的信息孤岛问题,将所有领域文件纳入同一关联体系进行评价,其构建的领域图谱为分析各文件节点的权威度和相关度奠定基础。
(2)本申请在步骤(2)和步骤(3)中提出的基于领域图谱的文件节点权威度和相关度定义与计算方法,能够对文件节点在整个领域图谱中的权威性,以及与文件节点在搜索子图中与用户输入的搜索关键词的相关性进行定量评价,进而实现步骤(4)中提出的融合权威度和相关度的搜索排序方法。
(3)本申请在步骤(1)和步骤(2)中提出的动态构建方法和增量计算方法,能够针对领域搜索中待检索文件的增加、删除、修改情况,进行领域图谱动态构建以及整个领域图谱中文件节点权威度增量计算,从而减少系统的计算量,提升系统的计算效率与实用性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方信息控制研究院集团有限公司,未经北方信息控制研究院集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911146865.8/2.html,转载请声明来源钻瓜专利网。