[发明专利]以商品为媒介的增强型相关搜索系统及其方法无效
申请号: | 200710301711.2 | 申请日: | 2007-12-25 |
公开(公告)号: | CN101206674A | 公开(公告)日: | 2008-06-25 |
发明(设计)人: | 刘刚;庄洪波;刘建国;王洪涛;张研 | 申请(专利权)人: | 北京科文书业信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100011北京市东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品 媒介 增强 相关 搜索 系统 及其 方法 | ||
技术领域
本发明涉及信息检索领域,尤其是涉及到一种电子商务网站以商品为媒介的相关搜索改进技术。
背景技术
相关搜索是对用户的搜索关键词,给出有某种相关性的其他关键词的技术,在一定程度上可以起到修正用户的输入关键词,引导用户搜索相关度最大的关键词的作用。
当前,通用搜索网站的实现,例如:百度、Google等搜索结果页面会显示出相关搜索的结果。相关搜索结果中的关键词是和用户搜索的关键词比较相近而且搜索量比较大的。其实现结果可能出现三种情况:①基本的实现法:把大量用户进行搜索的输入词进行分词和索引,然后当每一次进行搜索的时候,对这个“搜索的关键词索引”进行搜索,就得到了相关搜索;②相关性的实现法:把部分词进行近义词的相关度运算,得到权重数据;③广告推广效应法,人为为某些关键词给出特定的相关搜索词。例如,某个电子商务网站为了推广某个品牌的商品,在用户搜索关键词“数码相机”时给出“松下/索尼/奥林巴斯/富士/佳能”等相关搜索词。
以上方法应用于电子商务网站的不足:对于②所描述的方法一般要通过近义词表等基础词表。相关搜索结果很大程度上取绝于词表的质量,并且推荐的词要和商品相关,这又增加了人为的选词工作。再者电子商务网站商品更新速度快,词表的更新也是一个繁琐的问题。对于③所描述的方法更多的是人工筛选工作,随着要推荐的词增多,工作量越大。
目前对于以商品为向导的近义相关词研究甚少,例如:搜索一个作者,如果可以给出他们的作品相关词,用户会更感兴趣;反之搜索一本书,给出作者提示,或者该作者著的其他相关书;用户搜索某类物品,给出该类物品经典品牌的推荐等等。而这种以商品为向导近义词的相关性搜索对于电子商务网站的经营日趋重要。
发明内容
本发明针对上述迫切需求,提出了一种与商品相关的增强型搜索实施方案,整个相关搜索系统由四个模块组成:如图1所示
1.数据更新模块:Data updater,读取数据库中的相关数据,以文件形式保存;
2.索引模块:Indexer,对更新的数据建立索引,以文件形式保存;
3.搜索服务模块:Search service,实时处理用户查询请求;
4.控制器模块:Controller,每隔一定更新周期调度以上三个模块的执行,以便于更新数据
整个系统流程如图1所示,Search service模块为一个搜索服务进程,每当系统重新启动时它会自动运行,实时处理用户的查询请求,并将结果返回给前台。Controller模块为总调度器,每隔一定时间调度Data updater模块,从数据库读取数据进行预处理,然后启动Indexer模块,使用更新的数据建立索引,再将Search Service模块重新启动载入新的索引文件,启动服务。这就是整个更新过程。
整个系统中发明部分存在于Indexer模块和Search service模块,即相关词索引的建立与查询,下文主要阐述一下它们的技术实现。
一般说来,相关搜索是运用下述规律实现的。
相关词一般可以分为两种:
字面相关:两个关键词文字间有相同的部分,如“商务英语”<-->“外贸英语”。字面相关可以通过计算文字重叠程度来考察。具体操作可以参照上文提到的相关词的“基本实现”法来实施。
意义相关:意义相关指两个关键词有某种词义上的相关性,不要求文字间的重复出现,可以是相近,相反,从属,包含等关系,例如“姚明”<-->“我的世界我的梦”,这两个词是作者与作品的关系。
而对于意义相关的相关词在电子商务网站商品搜索中具有重要的意义。这里提出一种基于日志中用户搜索反馈信息的方法,来优化意义型相关搜索,以达到更好的推荐商品的作用。下面介绍本发明的基于日志用户反馈信息法。
首先,用户反馈信息的获取:
搜索日志是记录用户搜索行为的源头,通过提取用户的搜索词,和在该搜索词下点击的商品来分析关键词间的相关性。
具体来说:用户搜索一个商品分为两个步骤:①输入某个关键词,得到某些搜索结果;②选择某个搜索结果。步骤①只说明该关键词能够搜索某个商品,而该关键词和商品的重要性有待于进一步验证。②则说明了某个关键词能够代表某个商品,与该商品联系很紧密,这样就找到了一个该商品的特征属性。
同样用户搜索了另外一个关键词,也点击了该商品,则此商品和该关键词也具有紧密的关系。这样就找到了该商品的另一个特征属性。
以此类推可以找到该商品的另外一些特征属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科文书业信息技术有限公司,未经北京科文书业信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710301711.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:非易失性存储系统及其相应的编程方法
- 下一篇:具有冗余供电装置的电力系统