[发明专利]以商品为媒介的增强型相关搜索系统及其方法无效
申请号: | 200710301711.2 | 申请日: | 2007-12-25 |
公开(公告)号: | CN101206674A | 公开(公告)日: | 2008-06-25 |
发明(设计)人: | 刘刚;庄洪波;刘建国;王洪涛;张研 | 申请(专利权)人: | 北京科文书业信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100011北京市东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品 媒介 增强 相关 搜索 系统 及其 方法 | ||
1.一种以商品为媒介的增强型相关搜索系统,由四个模块组成:数据更新Dataupdater模块、索引Indexer模块、搜索服务Search service模块、控制器Controller模块,其中搜索服务Search service模块为一个搜索服务进程,每当系统重新启动时它会自动运行,实时处理用户的查询请求,并将结果返回给前台;控制器Controller模块为总调度器,每隔一定时间调度数据更新Data updater模块,从数据库读取数据进行预处理,然后启动索引Indexer模块,使用更新的数据建立索引,再将搜索服务Search Service模块重新启动载入新的索引文件,启动服务。
2.如权利要求1所述的一种以商品为媒介的增强型相关搜索系统,其特征在于在Searchservice模块采用基于日志中用户搜索反馈信息的方法:
(1)首先,从搜索日志中提取用户的搜索词和在该搜索词下点击的商品来分析关键词间的相关性,从而获取用户“关键词—商品”之间的反馈信息;
(2)然后,对每个关键字找出其对应的商品ID,而发生次数作为某个商品ID的权重来处理,于是形成了关键词到商品向量的映射关系,通过计算商品向量间相似度,就得出了关键词之间的相似关系。
3.如权利要求2所述的一种以商品为媒介的增强型相关搜索系统,其特征在于通过用户的选择来确定每个元素的特征向量,并进行一些去噪处理。
4.如权利要求3所述的一种以商品为媒介的增强型相关搜索系统,其特征在于向量相似度计算可以利用向量空间模型、TF-IDF公式或者其他相似公式的一种或几种方法结合。
5.一种以商品为媒介的增强型相关搜索方法,包括建立索引流程与查询流程,
其中建立索引流程步骤包括:
a.首先程序初始化,对程序运行环境进行设置、载入分词词库等操作;
b.连接数据库,读取用户反馈信息,其结构为: 关键词-商品ID-搜索次数;
c.建立关键词到商品ID向量的哈希映射,键为关键词,值为商品向量,该向量每一个元素由商品ID号和搜索次数构成;
d.建立商品到关键词向量的哈希映射,键为商品ID,值为关键词向量,这是上面映射的相反映射;
e.根据上面两个映射计算关键词间的相似度;
f.对每个关键词对应的相似词按照相似度由大到小排序;
g.生成意义相关索引结构;
h.对每一个关键词分词建立索引;
i.生成字面相关的索引;
j.两部分索引合并,写入文件,备查询时使用;
其中搜索流程步骤包括:
k.对用户查询串进行预处理、分词;
l.搜索意义相关索引,查找相应结果;
m.搜索字面相关索引,查找相应结果;
n.对两部分索引按照相关程度排序、并按一定比例分配、合并;
o.包装搜索结果数据,向前台返回;
这里有一个分支,其中c~g是产生意义相关索引的分支,而h,i是产生普通索引的分支。
6.如权利要求5所述的一种以商品为媒介的增强型相关搜索方法,其特征在于向量相似度计算可以利用向量空间法模型、TF-IDF公式、共有商品次数或者其它相似公式计算的一种或几种方法结合。
7.如权利要求5所述的一种以商品为媒介的增强型相关搜索方法,其特征在于通过用户的选择来确定每个元素的特征向量,并进行一些去噪处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科文书业信息技术有限公司,未经北京科文书业信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710301711.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:非易失性存储系统及其相应的编程方法
- 下一篇:具有冗余供电装置的电力系统