[发明专利]电子文本处理与检索的方法和系统无效
| 申请号: | 200710087104.0 | 申请日: | 2007-03-21 |
| 公开(公告)号: | CN101063975A | 公开(公告)日: | 2007-10-31 |
| 发明(设计)人: | 刘二中 | 申请(专利权)人: | 刘二中 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100089北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供一种计算机及搜索引擎关于电子文本处理与检索的技术,在用户经过交互界面进行关键词检索而面对海量的搜索结果时,通过原关键词结合邻接词段形成关键语句的搜索技术及其形成的数据分布多级子集体系和目录体系,能在不需明显增加服务器容量的情况下,帮助用户迅速而严密地缩小搜索范围,或剔除各类无关信息或核心内容重复的信息,完整准确地得到所期望的查询结果。 | ||
| 搜索关键词: | 电子 文本 处理 检索 方法 系统 | ||
【主权项】:
1、一种计算机执行的对多个含有同样关键词的电子文本进行处理的方法,包括:获得多个含有同样关键词的电子文本;规定邻接词段所含字词数量或邻接词段截取方式;根据部分或全部文本中的每个文本内容中所述关键词的邻接词段或间接邻接词段与其他文本相同还是不同,将该文本与其他文本划分入同一或不同子集或者进行相应的相同或不同处理;所述的相应的相同或不同处理可以包括:相应文本具有相同或不同的分布位置或存储方式,或者得到相同或不同的子集标记,或者使得其索引具有相同或不同的标记或索引项,或者具有相同或不同的编排方式,或者在交互界面具有相同或不同的显示方式或位置,或者允许至少部分子集各有一个或多个邻接词段或文本进行跨子集组合或排序或在交互界面展示;所述的文本可以是电子文件或网页或者它们的摘要或索引或题录或题目。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘二中,未经刘二中许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200710087104.0/,转载请声明来源钻瓜专利网。





