[发明专利]一种搜索方法和系统在审
申请号: | 201210387891.1 | 申请日: | 2012-10-12 |
公开(公告)号: | CN103729365A | 公开(公告)日: | 2014-04-16 |
发明(设计)人: | 宋超;陈超;冯景华;郭宁 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/00 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 方法 系统 | ||
技术领域
本申请涉及计算机技术领域,特别是涉及一种搜索方法和系统。
背景技术
搜索引擎技术的发展是随着电子技术不断进步而形成的信息数字化和数据网络化的必然产物。一个出色的搜索引擎能够及时准确的向用户提供所需要的信息。Google搜索引擎依靠其Page Rank机制及收敛算法一直处在该领域的领先地位,其体系结构代表了该搜索领域的传统搜索引擎。
但随着互联网快速、细分的发展,需要对于各方向的网络信息的搜索具有更加精确、更加专业、更具深度的搜索,而传统搜索引擎的排名技术显然不适用于专业垂直搜索的需求,比如在B2B电子商务垂直搜索等产品垂直搜索领域,基于互联网的产品搜索服务器需要将散布于互联网的各产品与相关数据搜集起来,提供统一的检索服务,因此产品数据的检索功能对于整体业务而言是非常重要的,产品数据的检索方法既要满足产品数据的检索这样一个特定的要求,又要具有很高的性能。
以电子商务为例,用户希望通过搜索获得所需产品的相关信息并较好的完成交易。从计算机数据处理的过程来看,具体包括以下过程:计算机针对用户搜索需求给出产品反馈信息,用户查看产品相关信息并确定交易,计算机依据用户指示完成交易(当采用电子货币购买电子商品或者虚拟物品时,则全部过程为互联网上的数据处理过程;当购买实物时,则上述过程可能会涉及到一些线下过程)。
上述数据处理过程中,当搜索的产品信息的结果排序不符合实际需求时,则用户为了完成交易(完成整个数据处理过程),则可能需要点击很多搜索结果,从而可能导致信息处理过程的冗余、服务器浪费和效率降低。
即迫切需要本领域技术人员解决的技术问题是:如何才能减少或者避免由于搜索结果排序不优化,而导致的信息处理过程的冗余、服务器浪费和效率降低。
发明内容
本申请所要解决的技术问题是提供一种搜索方法和系统,解决现有技术中由于产品信息置信度导致的信息不够精确,从而导致服务器负载压力大,用户搜索成本高的缺点;能精确返回用户需求的产品信息,从而降低服务器负载压力,降低用户的搜索成本。
为了解决上述问题,本申请公开了一种搜索方法,包括:
接收用户端的查询词串;
根据所述查询词串检索与查询词串相关的各产品信息;
查找各产品信息所属的产品提供方,或者查找各产品信息所属的产品提供方和各产品信息所属领域;
提取各产品信息对应的第一置信度,所述第一置信度为所述产品信息在所属产品提供方的置信度,或提取各产品信息对应的第二置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息的所属领域的置信度;其中,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得;
将所述第一置信度或第二置信度加入排序权重,并将各产品信息进行排序;
将排序后的产品信息输出给用户端。
优选的,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得包括:
针对每一产品提供方,提取所述产品提供方各产品信息对应的各种行为记录表;所述各种行为记录表包括所述各产品信息的对应的交易行为记录表、评价行为记录表、和/或收藏行为记录表;
针对每一所述产品信息,分析统计所述产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息的第一置信度。
优选的,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得包括:
针对每一产品提供方,提取所述产品提供方的各产品信息的核心产品词,并提取所述产品提供方各产品信息对应的各种行为记录表;所述各种日志记录表包括所述各产品信息的对应的各交易行为记录表、各评价行为记录表、和/或各收藏行为记录表;
根据所述核心产品词,确定属于同一领域的各条产品信息;
针对每一领域,分析统计所述领域内各产品信息对应的各种行为记录表,获得各种特征维度下的特征值;
将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息对应的第二置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210387891.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种喇叭口混凝土衬砌金属模具
- 下一篇:一种隧道施工衬砌量确定装置