[发明专利]文档管理方法和装置以及文档搜索方法和装置有效
申请号: | 200610054742.8 | 申请日: | 2006-03-10 |
公开(公告)号: | CN1831825A | 公开(公告)日: | 2006-09-13 |
发明(设计)人: | 服部雅一 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 夏青 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种文档管理方法,包括从文档数据移动多个字符的字符串并剪辑它,确定通过剪辑所获得的管理Gram是第一低频Gram和第二高频Gram中的一个,将第一登记数据存储在与通过计算第一Gram的字符串获得的Gram值相关的第一登记区中,该第一登记数据具有指示包含第一Gram的文档数据的一组文档标识符(ID)和指示其字符串位置的文档内偏移量,以及将第二登记数据存储在与第二Gram的字符串相关的第二登记区中,该第二登记数据具有指示包含第二Gram的文档数据的一组文档标识符(ID)和指示其字符串位置的文档内偏移量。 | ||
搜索关键词: | 文档 管理 方法 装置 以及 搜索 | ||
【主权项】:
1.一种文档管理方法,用于管理存储在存储单元的文档数据区中的文档数据,包括:从文档数据移动给定字符数量的字符串,并剪辑该字符串以产生管理Gram;确定该管理Gram是小于阈值的较低发生频率的第一Gram和不小于该阈值的较高发生频率的第二Gram中的一个;与通过计算该第一Gram的字符串获得的Gram值相关,将第一登记数据存储在存储单元的第一登记区中,该第一登记数据被配置具有指示包含该第一Gram的字符串的文档数据的一组文档标识符(ID)和指示该第一Gram的字符串位置的文档内偏移量;以及与该第二Gram的字符串相关,将第二登记数据存储在该存储单元的第二登记区中,该第二登记数据被配置具有指示包含该第二Gram的字符串的文档数据的一组文档标识符(ID)和指示该第二Gram的字符串位置的文档内偏移量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200610054742.8/,转载请声明来源钻瓜专利网。