[发明专利]一种分布式全文检索的索引实时更新的方法和系统有效
申请号: | 200910168335.3 | 申请日: | 2009-08-27 |
公开(公告)号: | CN101650741A | 公开(公告)日: | 2010-02-17 |
发明(设计)人: | 杨翊平;徐雄;蔡坚铮;李云;梁冰;余锦婷 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/06 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 宋海宁 |
地址: | 100032*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 全文 检索 索引 实时 更新 方法 系统 | ||
1.分布式全文检索的索引实时更新的方法,包括以下步骤:
当有索引信息更新时,由信息发布服务器向通知服务器发送更新请求,在更新请求中包括索引分类信息的数据;
由通知服务器将更新请求分配到对应的消息主题队列中,并将更新请求发送到订阅相应消息主题的请求分发器;每一个消息主题包含多类索引分类,负责维护所包含的索引分类对应的索引更新请求;
根据记载有索引分类与索引服务器之间关系的路由信息表,由请求分发器向与索引分类对应的索引服务器发送更新请求;
索引服务器接收请求分发器发送的索引更新请求,或主动向信息发布服务器发起数据访问请求,读取索引更新信息和操作类型;
对读取到的索引更新信息按照索引结构进行字段规范化,根据操作类型对规范化后的索引更新信息进行增量操作,所述根据操作类型对规范化后的索引更新信息进行增量操作,包括如下之一:
当新增索引更新信息时,直接加入内存索引;
当删除索引更新信息时,判断要删除的索引更新信息位于内存索引还是文件索引,再直接进行删除;
当修改索引更新信息时,判断索引更新信息位于内存索引还是文件索引,如果位于内存索引,删除原有记录,再将修改后的索引更新信息新增到内存索引;如果位于文件索引,在内存索引中新增索引更新信息,再从文件索引中删除该索引更新信息。
2.根据权利要求1所述实时更新的方法,其中,索引分类包括至少如下之一:地域、数据所属专业领域、索引日期、信息id范围。
3.根据权利要求1所述实时更新的方法,其中,建立记载有索引分类与索引服务器之间关系的路由信息表的操作,包括以下步骤:
每个索引服务器均在请求分发器上注册,在注册请求中包括该索引服务器的索引分类;
根据索引分类与索引服务器之间的对应关系建立路由信息表。
4.根据权利要求1所述实时更新的方法,其中,当内存索引到达设定条件时,将内存索引合并到文件索引。
5.根据权利要求1所述实时更新的方法,其中,还包括在内存索引故障时执行的容错控制,包括以下步骤:
由容错模块将需要恢复的时间段信息、信息发布服务器信息发送到索引服务器,并通知其启动索引恢复过程进行内存索引恢复。
6.分布式全文检索的索引实时更新的系统,包括:
信息发布服务器,当有索引信息更新时,向通知服务器发送更新请求,在更新请求中包括索引分类信息的数据;
通知服务器,维护消息主题队列,在每一个消息主题队列中包含多类索引分类的索引更新请求消息,当更新请求消息到达消息主题队列时,将更新请求消息发送到订阅相应消息主题的请求分发器;
请求分发器,根据记载有索引分类与索引服务器之间关系的路由信息表,向与索引分类对应的索引服务器发送更新请求;
索引服务器包括:
数据预处理模块,接收请求分发器的索引更新消息,或主动向信息发布服务器发起数据访问获得索引更新消息,解析索引更新信息和操作类型,对读取到的索引更新信息按照索引结构进行字段规范化,并发送给索引模块;
索引模块,根据操作类型对数据预处理模块处理后的索引更新信息进行增量操作,执行的增量操作包括如下之一:
当新增索引更新信息时,直接加入内存索引;
当删除索引更新信息时,判断要删除的索引更新信息位于内存索引还是文件索引,再直接进行删除;
当修改索引更新信息时,判断索引更新信息位于内存索引还是文件索引,如果位于内存索引,删除原有记录,再将修改后的索引更新信息新增到内存索引;如果位于文件索引,在内存索引中新增索引更新信息,再从文件索引中删除该索引更新信息。
7.根据权利要求6所述实时更新的系统,其中,索引分类包括至少如下之一:地域、数据所属专业领域、索引日期、信息id范围。
8.根据权利要求6所述实时更新的系统,其中,请求分发器接收索引服务器发送的注册请求,在注册请求中包括该索引服务器的索引分类,根据索引分类与索引服务器的对应关系建立路由信息表。
9.根据权利要求6所述实时更新的系统,其中,索引服务器在内存索引到达设定条件时,将内存索引合并到文件索引。
10.根据权利要求6所述实时更新的系统,还包括:
容错模块,在内存索引发生故障时,将索引恢复请求发送到索引服务器的数据源主动访问模块,索引恢复请求包括需要恢复的时间段信息、信息发布服务器信息;
数据源主动访问模块,接收容错模块的索引恢复请求,向信息发布服务器发起数据访问请求,读取需要恢复的时间段内的索引更新信息和操作类型,并发送给数据预处理模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910168335.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:保温装饰成品板安全保险锁片
- 下一篇:戒指锯断钳