[发明专利]搜索结果排序方法及系统、搜索结果排序优化方法及系统在审
申请号: | 201210254425.6 | 申请日: | 2012-07-20 |
公开(公告)号: | CN103577413A | 公开(公告)日: | 2014-02-12 |
发明(设计)人: | 林锋;汤佳宇 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 结果 排序 方法 系统 优化 | ||
技术领域
本申请涉及计算机数据处理技术领域,特别是涉及一种搜索结果排序方法及系统、搜索结果排序优化方法及系统。
背景技术
随着电子商务的发展,越来越多的用户选择在电子商务网站进行商品的购买。一般情况下一个电子商务网站,通常拥有千万甚至几亿的产品,用户要在繁多的产品中找到自己需要的,利用关键词进行搜索是常见的一种方法。所谓搜索,即用户输入关键词,网站返回与关键词相关的搜索结果供用户筛选。
在很多情况下,一个关键词可能会有较大数量的搜索结果,那么搜索结果在展示必然需要按照一定的顺序排列,如何对这些搜索结果进行排序需要网站进行综合考虑。例如,可以根据搜索结果与关键词的相关性、搜索结果在之前的点击率、成交情况等等。对于电子商务网站来说,其主要目的是提高商品的销售量,因此,其在对搜索结果进行排序时除了考虑相关性,还需要考虑搜索结果的可成交性,例如成交转化率、好评率等等。
目前,常见的电子商务网站对搜索结果进行排序时,相关性和可成交性预测主要通过人工对历史数据进行分析并根据经验来确定搜索结果(即具体商品)的特征和权重,并根据一定公式计算得到。其中,商品特征是指能够影响商品可成交性的因素,例如销售量、好评率、成交转化率等等。因为在确定特征和权重时凭经验设定,较为盲目和主观,往往会与实际情况出现误差。因此,其返回的排序后的搜索结果可能与用户期望会出现较大的差异,用户期望的搜索结果可能被排在靠后的位置,因为搜索结果数量通常较大,为了减少数据传输量,服务器通常会分段返回排序后的搜索结果,先返回部分结果,若用户提交请求,则再返回部分结果。当排序后的搜索结果与用户期望出现较大差异时,那么用户则可能不断的请求查看剩余搜索结果或者重新通过客户端向服务器提交新的搜索请求来获取其所期望的搜索结果。那么就会增加服务器的数据传输量,那么这无疑会增加服务器的负载,占用大量的网络资源,甚至可能造成网络堵塞。同时也说明服务器返回的排序后的搜索结果中有大量的无关数据,这部分数据的传输无疑是对服务器资源和网络资源的浪费和不必要的占用。
发明内容
本申请提供一种搜索结果排序方法及系统、搜索结果排序优化方法及系统,能够解决搜索结果与用户预期不同,用户通过客户端反复的发送搜索请求而导致的服务器负担增加以及网络堵塞的问题。
为了解决上述问题,本申请公开了一种搜索结果排序方法,包括以下步骤:
获取原始特征集合,所述原始特征包括预先设定的可能对搜索结果的排序产生影响的特征;
基于历史交易数据从原始特征集合提取有效特征,所述有效特征指根据历史交易数据确定的能够对搜索结果的排序产生影响的特征;
基于历史交易数据确定各有效特征的初始权重,并利用历史交易数据和预定训练模型对初始权重进行训练得到最终权重;
基于所述有效特征的最终权重对搜索结果进行排序。
进一步地,所述基于历史交易数据从原始特征集合提取有效特征包括:
基于历史交易数据选取两组测试产品,其中一组为有成交记录的产品,另外一组为没有成交记录的产品;
从历史交易数据中分别提取所述两组测试产品在一定时间段内的相关数据,并利用所述相关数据计算两组测试产品各原始特征的特征值;
比较所述两组测试产品相同原始特征的特征值的差值,若超过阈值,则选取所述原始特征为有效特征。
进一步地,所述基于历史交易数据从原始特征集合提取有效特征包括:
从历史交易数据中提取预定时间段内的交易数据,计算该预定时间段内各产品的成交转化率;
选取成交转化率差值大于阈值的两组产品作为测试产品;
从历史交易数据中提取所述两组测试产品在所述预定时间段之后的一定时间段内的交易数据,并计算两组测试产品的原始特征集合中各原始特征的特征值;
比较所述两组测试产品相同原始特征的特征值的差值,若超过阈值,则选取所述原始特征为有效特征。
进一步地,所述基于历史交易数据确定各有效特征的初始权重,并利用历史交易数据和训练模型对初始权重进行训练得到最终权重包括:
确定有效特征的初始权重;
将历史交易数据和初始权重代入预定训练模型中,计算理论数据;
比较理论数据与实际数据,若二者差异在预定范围内,则确定该初始权重为有效特征的最终权重,反之,则返回确定有效特征的初始权重这一步骤。
进一步地,所述基于所述有效特征的最终权重对搜索结果进行排序包括:
确定搜索结果的实际有效特征值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210254425.6/2.html,转载请声明来源钻瓜专利网。