[发明专利]信息文档的处理方法及装置有效
| 申请号: | 201010519870.1 | 申请日: | 2010-10-19 |
| 公开(公告)号: | CN102004722A | 公开(公告)日: | 2011-04-06 |
| 发明(设计)人: | 曾良军;李恒 | 申请(专利权)人: | 北京红旗中文贰仟软件技术有限公司 |
| 主分类号: | G06F17/22 | 分类号: | G06F17/22 |
| 代理公司: | 北京派特恩知识产权代理事务所(普通合伙) 11270 | 代理人: | 张颖玲;王黎延 |
| 地址: | 100176 北京市北京经济技*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信息 文档 处理 方法 装置 | ||
1.一种信息文档的处理方法,其特征在于,该方法包括:
A、将可扩展标记语言XML文档标签信息映射到可由下标访问的XML文档向量模型中;
B、依据滞后处理策略信息,通过下标访问并处理所述XML文档向量模型的结构元素,其中对于需要滞后处理的信息暂不处理,记录该滞后处理信息的下标;
C、根据步骤B中记录的需要滞后处理信息的下标,访问并处理所述XML文档向量模型中对应的结构元素。
2.根据权利要求1所述的方法,其特征在于,所述步骤A中,将所述XML文档中的每一个标签所包含的信息对应映射到XML文档向量模型的一个结构元素中,其中一个标签映射的结构元素包含有以下内容信息:
1)当前标签在XML文档中的顺序编号;
2)当前标签到包含此标签的父标签顺序编号的距离;
3)当前标签包含的子标签个数;
4)当前标签的标签名;
5)当前标签的属性信息;
6)当前标签包含的起始文本内容;
7)当前标签包含的结束文本内容。
3.根据权利要求2所述的方法,其特征在于,所述步骤A以基于事件驱动分析处理的方式进行处理,具体包括以下事件驱动处理过程:
起始文档事件驱动处理:建立或清理一个可以通过下标访问的数据结构作为所述XML文档向量模型,初始化当前处理标签下标;
起始标签事件驱动处理:构建一个新标签的结构元素,并对该新结构元素的顺序编号、该新标签到父标签顺序编号的距离、该新结构元素的标签名称以及属性进行赋值,并将该新建的结构元素加入到可用下标访问的数据结构中,变更当前处理下标为当前结构元素的顺序编号;
内容处理事件驱动处理:判断当前遇到的内容是起始内容还是结束内容,如是起始内容,将对当前元素结构的起始内容赋值,否则对当前元素结构的结束内容赋值;
结束标签事件驱动处理:对当前处理结构元素的包含子元素数赋值,并将当前处理结构元素的父元素下标赋给当前处理标签下标。
4.根据权利要求1所述的方法,其特征在于,所述步骤B具体包括:
B1、将所述XML文档向量模型的第一个结构元素作为当前结构元素,构建该结构元素对应的处理上下文作为当前处理上下文;
B2、在当前处理上下文中进行当前结构元素起始阶段的处理;
B3、在当前处理上下文中进行当前结构元素起始内容的处理,并为当前子结构元素下标赋值;
B4、判断当前子结构元素下标是否在当前结构元素的子结构元素范围内,如果是则进入到步骤B9,否则进入到步骤B5;
B5、在当前处理上下文中进行当前结构元素对应的结束内容的处理;
B6、在当前处理上下文中进行当前结构元素对应的结束阶段的处理;
B7、判断当前结构元素是否为根结构元素,如果是则结束本流程,否则进入步骤B8;
B8、将当前子结构元素下标设为当前结构元素的兄弟结构元素下标,并返回到当前结构元素的父结构元素的处理上下文中,进入步骤B4;
B9、依据预设的处理策略信息,判断当前子结构元素是否可以滞后处理,如果是则进入步骤B10,否则进入步骤B11;
B10、记录当前子结构元素下标的值,之后将当前子结构元素下标的值改为下一子结构元素位置,进入步骤B4;
B11、将当前处理上下文进行相应的处理,将当前子结构元素作为当前处理结构元素,并构建当前处理结构元素对应的处理上下文作为当前处理上下文,返回步骤B2。
5.根据权利要求1或4所述的方法,其特征在于,步骤B中所述的滞后处理策略信息包括:判断当前处理的信息是否为后继处理过程中的必须项,如果不是必须项,且不是同等级信息中的首项,则可滞后处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京红旗中文贰仟软件技术有限公司,未经北京红旗中文贰仟软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010519870.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种细胞保存液、其制备方法及用途
- 下一篇:手车式开关装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





