[发明专利]一种搜索结果的排序方法及系统有效
申请号: | 201911181750.2 | 申请日: | 2019-11-27 |
公开(公告)号: | CN110929154B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 宗宇 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 古利兰 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 结果 排序 方法 系统 | ||
本发明提供一种搜索结果的排序方法及系统,获取用户输入的包含银行专业术语的搜索内容;获取搜索内容中的关键词以及对应的相似词;基于其他用户对包含关键词和相似词的文本信息的用户选择行为,获取包含多条文本信息的排序结果集合;基于用户的行为数据,确定用户对排序结果集合中每条文本信息对应的目录知识的访问率;利用逻辑回归算法确定每一文本评分的评分权重和每一访问率的用户特征权重;基于每一评分权重和每一用户特征权重,计算排序结果集合中每条文本信息对应的最终分数;根据排序结果集合中每条文本信息的最终分数进行排序,将得到的最终排序结果集合反馈给用户。使反馈给用户的最终排序结果符合用户预期期望,提高用户的使用体验。
技术领域
本发明涉及检索技术领域,具体涉及一种搜索结果的排序方法及系统。
背景技术
随着科学技术的发展,搜索引擎逐渐成为人们日常生活和工作中经常使用的工具。用户通过向搜索引擎输入对应内容,从而获取到想要的搜索结果。
目前常见的搜索引擎有基于solr的全文搜索引擎,使用方式为:将需要搜索的内容输入基于solr的全文搜索引擎,该全文搜索引擎基于solr自带的结果排序算法对搜索到的结果进行简单的排序,最后将排序后的搜索结果反馈给用户。但是在不同背景的领域下,尤其是商业银行领域,商业银行领域中存在大量的银行专业术语和词汇,solr自带的搜索规则和排序算法具有较大的局限性。当用户需要对银行专业词汇进行搜索时,solr反馈给用户的结果往往不符合用户的预期期望,造成用户体验效果差。
发明内容
有鉴于此,本发明实施例提供一种搜索结果的排序方法及系统,以解决solr反馈给用户的结果不符合用户的预期期望,从而造成用户体验效果差的问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开一种搜索结果的排序方法,所述方法包括:
获取用户输入的包含银行专业术语的搜索内容;
获取所述搜索内容中的至少一个关键词,以及获取所述关键词的相似词;
基于其他用户对包含所述关键词和相似词的文本信息的用户选择行为,获取包含多条文本信息的排序结果集合,所述用户选择行为至少包括点赞次数、点踩次数和选择次数,预先计算所述排序结果集合中每一条文本信息的文本分数,并根据文本分数的高低进行排序;
基于所述用户的行为数据,确定所述用户对所述排序结果集合中每一条文本信息对应的目录知识的访问率,所述行为数据包括所述用户访问不同目录知识的次数;
利用逻辑回归算法确定每一所述文本评分的评分权重和每一所述访问率的用户特征权重;
基于每一所述评分权重和每一所述用户特征权重,计算所述排序结果集合中每一条文本信息对应的最终分数;
根据所述排序结果集合中每一条文本信息的最终分数进行排序,将得到的最终排序结果集合反馈给所述用户。
优选的,所述确定所述用户对所述排序结果集合中每一条文本信息对应的目录知识的访问率,包括:
利用确定所述用户对所述排序结果集合中每一条文本信息对应的目录知识的访问率;
其中,li为访问i目录知识的次数,为访问所有目录知识的总次数。
优选的,所述基于每一所述评分权重和每一所述用户特征权重,计算所述排序结果集合中每一条文本信息对应的最终分数,包括:
利用计算所述排序结果集合中每一条文本信息对应的最终分数score;
其中,和Y1分别为每一文本信息对应的文本分数和评分权重,Y2为每一访问率对应的用户特征权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911181750.2/2.html,转载请声明来源钻瓜专利网。