[发明专利]一种分布式一致性的搜索结果随机排序方法在审
申请号: | 202210148774.3 | 申请日: | 2022-02-18 |
公开(公告)号: | CN114510661A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 陈一凡;李仁勇 | 申请(专利权)人: | 焦点科技股份有限公司 |
主分类号: | G06F16/9538 | 分类号: | G06F16/9538;G06Q30/06 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210032 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 一致性 搜索 结果 随机 排序 方法 | ||
本发明公开了一种分布式一致性的搜索结果随机排序方法,准备搜索数据,并生成索引主键标识;初始化控制随机排序处理的全局参数;搜索线程启动,初始化随机时间因子;针对匹配的产品数据,计算初始分和随机分;计算初始分和随机分的总和为产品数据的总分;本发明不受分布式环境及网络环境的影响,支持分布式环境中的搜索结果一致性,达到既保障了产品搜索的公平性,也提高了用户检索产品的用户体验的效果。
技术领域
本发明涉及互联网电子商务信息检索和处理领域,特别是涉及一种分布式一致性的搜索结果随机排序方法。
背景技术
随着计算机技术、互联网技术的发展,网络和在其上发展起来的电子商务深入到人们的日常生活中,在B2B电子商务平台内,供应商每天都会发布大量的产品信息,这些产品信息通过搜索引擎被检索。随着平台内产品数据量增加至一定数量级,很多产品会处在搜索词同等匹配度且同等重要性条件下,此时如何保证产品搜索展示顺序的公平性,让搜索用户看到尽可能多的相关产品信息,给用户较好的体验,成为搜索排序中一个重要的考量因素。
在搜索排序时,通常会按照产品内容和搜索词语的语义相关匹配度,获得匹配度从高至低的排序顺序,再结合产品重要性得分,使匹配度越高、重要性越高的产品排序更靠前。若是遇到匹配度相同且重要性相同的情况时,会采用如下多种策略控制排序顺序:
(1)按照产品发布者的发布时间或产品信息更新时间排序,然而会导致发布或更新时间较早的产品的排名总是靠后,或是发布者为了使排名靠前,反复更新产品信息或重新发布产品,造成不必要的信息更新。当所有产品发布者都采用新鲜度策略时,一方面会造成不必要的系统更新压力,另一方面更新时间变成了发布者为提高排名刻意更新产品信息,这种按照时间排名的设计变得没有意义。
(2)将随机程序置于数据中心所在的搜索服务器中;随着平台内用户规模逐渐扩大,为保证服务性能和高可用,搜索服务器部署在多个数据中心,方便用户就近高效地访问,此时会出现一种现象:在用户访问到不同的数据中心时,如在南京和广州,或者在不同网络运营商提供的网络下访问时,如电信和联通,排序的结果会存在不同,不同的用户处于不同的网络环境或地区、甚至同一个用户在网络变化时会发现同样的搜索词将搜索得到不同的结果顺序,这造成不好的用户体验。买卖方用户交流或者用户和平台运营人员交流排序结果时,也无法基于一致的排序信息进行交流。
(3)设置随机规则在一个范围内规律地移动,然而用户能感知到随机规则,对于信息的发布者,希望自己发布的产品排在前列,会人为利用规则,如在自己发布的产品即将滚动到后方时插入新的产品,做上下架操作等人为的干扰,破坏随机公平性。
(4)随机排序,随机排序策略是在匹配度、重要性排序结果的前列进行随机,比如只处理结果的前N条产品信息。在这种策略下,当产品的相同匹配度和重要性数量大于N时,就会出现产品无法参与随机排名,而且往往这种情况出现时,在相同匹配度和重要性的尾部产品,无法出现在前N,或者出现在前N的次数不平均,影响公平性。
专利“搜索引擎的结果排序方法”(专利申请号:201210435060.7)通过检索程序将具有相同匹配度得分的网页资源根据加权度得分的高度划分为多个集合;将匹配度得分高的网页资源排序在匹配度得分低的网页资源之前,在具有相同匹配度得分的网页资源中,则将加权度得分高的集合排序在加权度得分低的集合之前,但第一集合中随机排序各个网页资源,并以此展示给用户;该专利利用检索程序将一个集合内部的检索结果分为多段,并根据一定的时间间隔将开头的一段挪至末尾,将第二段及其后各段依次递进,使搜索结果得到被公平展示的机会,但存在如下不足:(1)随机排序集合分段内部检索结果之间的位置没有随机排序,段内结果公平性欠缺;(2)分段从开头挪至末尾、后续段向前的随机方式具有规律性,可能被用户通过变更数据等方式利用,进而获得排名优势,破坏公平性;(3)无法保证多数据中心之间随机顺序一致,买卖双方访问不同数据中心后进行沟通、用户网络漂移等情形,会出现顺序不一致的情况。
因此,需要一种既能兼顾产品曝光的公平性,又能解决搜索结果频繁变动,还能使随机的顺序在各数据中心一致的随机排序技术。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210148774.3/2.html,转载请声明来源钻瓜专利网。