[发明专利]结构化文档管理系统和管理在所述系统中的索引的方法有效
申请号: | 200710147754.X | 申请日: | 2007-08-28 |
公开(公告)号: | CN101136033A | 公开(公告)日: | 2008-03-05 |
发明(设计)人: | 山田晃智;谷川均;藤本克文 | 申请(专利权)人: | 株式会社东芝;东芝解决方案株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 杨晓光;李峥 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结构 文档 管理 系统 中的 索引 方法 | ||
技术领域
本发明涉及一种结构化文档管理系统,具体地涉及适合于管理用于搜索结构化文档的索引的结构化文档管理系统,和管理在所述系统中的索引的方法。
背景技术
以可扩展标记语言(XML)形式表示的文档被称为XML文档。在由XML文档表示的结构化文档中,通过被称为标签的串来表达分层结构。具体上,通过以几个标签(即几个开始标签和结束标签)围绕文本来结构化文本。从开始标签到结束标签的串被称为包括标签的元素。由开始标签和结束标签围绕的串被称为元素的内容。结构化文档(XML文档)可以被表达为树结构。在所述结构化文档的树结构中,对应于结构化文档的元素的节点被称为元素节点。如果元素的内容(值)是文本,则对应于元素的内容的节点被称为文本节点。所述文本节点由文本单独构成。换句话说,文本节点、文本节点的值和文本彼此等同。
用于管理多个结构化文档并且执行大规模搜索处理的系统被称为结构化文档管理系统。在数据库服务器上运行的数据库管理系统(DBMS)被称为典型的结构化文档管理系统。在所述结构化文档管理系统中,应用一种通过使用索引(索引数据)来改善搜索速度的方法,如例如在下文中所公开:JP-A 2000-207409(KOKAI)和JP-A 2006-172268(KOKAI)。所述索引用于使用在结构化文档中的数据(值)来加速搜索速度。
在结构化文档管理系统中,经常以元素节点为单位来搜索结构化文档。因此,一般以元素节点为单位来分配索引。于是,将例示以元素节点为单位的索引分配。首先,采用包括下述数据(其中以XML形式描述了日本地址)的结构化文档。。
<address>
<prefecture>Tokyo</prefecture>
<municipality>Fuchu-shi Musashidai</municipality>
<number>1-1-15</number>
</address>
为了搜索这样的结构化文档,使用第一条件[address contains“TokyoFuchu-shi”(地址包含“Tokyo Fuchu-shi”)]。“Tokyo Fuchu-shi”是以罗马字母表达的日语标题,并且对应于字母标题“Fuchu-shi,Tokyo”。“Fuchu-shi”的“shi”对应于英文词“municipality”。
客户端向结构化文档管理系统发出用于在第一条件下搜索的搜索请求。这个搜索请求包括作为搜索字符串(查询)的例如“/address[prefecture/text()=“Tokyo”and contains (municipality/text(),“Fuchu-shi”)]”。为了加速这样的查询的XML文档搜索,索引被产生和分配到分别由路径[/address/prefecture]和路径[/address/municipality]指定的元素节点(<prefecture>标签和<municipality>标签)。
但是,当旨在加速使用以元素节点为单位产生的索引而进行的XML文档搜索时,在所述<地址(address)>标签中的自由度有限。例如分别以在图4A和图4B中所示的DOCUMENT#1和DOCUMENT#2来说明在标签的自由度上的限制。
DOCUMENT#1:
<address>
<prefecture>Tokyo</prefecture>
<municipality>Fuchu-shi Musashidai</municipality>
<number>1-1-15</number>
</address>
DOCUMENT #2:
<address>
<prefecture>Tokyo</prefecture>
<ward>Minato-ku</ward>
<municipality>Shibaura</municipality>
<number>1-1-1</number>
</address>
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝解决方案株式会社,未经株式会社东芝;东芝解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710147754.X/2.html,转载请声明来源钻瓜专利网。