[发明专利]分析、转换和拆分结构化数据的方法和装置无效
申请号: | 200810080925.6 | 申请日: | 2008-02-29 |
公开(公告)号: | CN101520770A | 公开(公告)日: | 2009-09-02 |
发明(设计)人: | 李晓凯;尹宏斌 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 李 峥;于 静 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分析 转换 拆分 结构 数据 方法 装置 | ||
1.一种分析结构化数据(structural data)的方法,其特征在于,包括:
利用预先定义的与上述结构化数据相对应的模式信息(schema information),对上述结构化数据进行分析和验证,其中,上述模式信息包括利用正则表达式(regular expression)表示的与该结构化数据的结构和验证有关的信息,
其中上述利用预先定义的与上述结构化数据相对应的模式信息,对上述结构化数据进行分析和验证的步骤进一步包括:
对上述模式信息进行分析,以解析出其中与上述结构化数据的结构和验证有关的信息;
根据上述与结构化数据的结构和验证有关的信息,将上述结构化数据中的各元素与上述模式信息中的相应正则表达式进行匹配,以验证该结构化数据。
2.权利要求1所述的分析结构化数据的方法,其中,上述结构化数据包括电子数据交换文档。
3.权利要求1所述的分析结构化数据的方法,其中上述模式信息包括:用于验证上述结构化数据的、与上述结构化数据的层级关系相对应的每一个元素的值的正则表达式。
4.权利要求1所述的分析结构化数据的方法,其中上述模式信息是XML格式的。
5.权利要求1所述的分析结构化数据的方法,其中上述利用预先定义的与上述结构化数据相对应的模式信息,对上述结构化数据进行分析和验证的步骤进一步包括:
根据上述与结构化数据的结构和验证有关的信息,将上述模式信息中的正则表达式按照层级关系组装为正则表达式树;并且
根据上述与结构化数据的结构和验证有关的信息,将上述结构化数据中的各元素与上述模式信息中的相应正则表达式进行匹配的步骤进一步包括:
将上述结构化数据中的各元素与上述正则表达式树中的相应节点进行匹配。
6.权利要求1所述的分析结构化数据的方法,其中在上述匹配的步骤中进行延迟匹配。
7.权利要求5所述的分析结构化数据的方法,其中在上述匹配的步骤中进行延迟匹配。
8.权利要求1所述的分析结构化数据的方法,其中上述模式信息保存在模式文件中。
9.权利要求1所述的分析结构化数据的方法,还包括:
根据上述模式信息中与上述结构化数据的结构和验证有关的信息,将根据该模式信息预先设定的取值路径映射到该模式信息中的层级关系中的具体取值位置;以及
根据上述与结构化数据的结构和验证有关的信息以及上述具体取值位置,从上述结构化数据中提取数据。
10.权利要求9所述的分析结构化数据的方法,其中上述取值路径是以XPath格式设定的。
11.一种转换结构化数据的方法,其特征在于,包括:
利用权利要求1~10中的任意一项所述的分析结构化数据的方法对上述结构化数据进行分析;以及
将分析后的上述结构化数据从源格式转换为目标格式。
12.一种拆分结构化数据的方法,其特征在于,包括:
利用权利要求1~10中的任意一项所述的分析结构化数据的方法对上述结构化数据进行分析;以及
将分析后的上述结构化数据拆分为多个部分数据。
13.权利要求12所述的拆分结构化数据的方法,还包括:
分别对上述拆分后的多个部分数据添加标头,以封装为目标格式的包。
14.一种分析结构化数据的装置,其特征在于,包括:
分析/验证模块,用于利用预先定义的与上述结构化数据相对应的模式信息,对上述结构化数据进行分析和验证,其中,上述模式信息包括利用正则表达式表示的与该结构化数据的结构和验证有关的信息,其中所述分析/验证模块进一步包括:
模式信息分析单元,用于对上述模式信息进行分析,以获得其中与上述结构化数据的结构和验证有关的信息;以及
验证单元,用于根据上述与结构化数据的结构和验证有关的信息将上述结构化数据中的各元素与上述模式信息中的相应正则表达式进行匹配,以验证该结构化数据。
15.权利要求14所述的分析结构化数据的装置,其中上述模式信息包括:用于验证上述结构化数据的、与上述结构化数据的层级关系相对应的每一个元素的值的正则表达式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810080925.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种海量医学图像三维可视化处理系统
- 下一篇:多媒体播放调整方法及系统