[发明专利]一种基于不定长标识码的XML的压缩方法和装置有效
申请号: | 201310580015.5 | 申请日: | 2013-11-19 |
公开(公告)号: | CN103605730A | 公开(公告)日: | 2014-02-26 |
发明(设计)人: | 龚如宾;张炼珠 | 申请(专利权)人: | 山西三恒自动化设备有限公司;上海理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 太原高欣科创专利代理事务所(普通合伙) 14109 | 代理人: | 冷锦超;邓东东 |
地址: | 030006 山西省太原市*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 定长 标识 xml 压缩 方法 装置 | ||
1.一种基于不定长标识码的XML的压缩方法,其特征在于:该方法包括:
对于XML文档中的每一个元素,在数据字典中定义一个与之相对应的不定长标识码;以及对于XML文档中的每一个属性,在数据字典中定义一个与之相对应的不定长标识码;
发送方使用所述数据字典中定义的对应不定长标识码逐个替换XML文档中的元素和属性,实现XML文档的替换压缩;
接收方根据所述数据字典中定义的与相应不定长标识码对应的元素和属性替换所接收到的替换压缩后的XML文档中的不定长标识码,实现XML文档的解压;
所述对于XML文档中的每一个元素,在数据字典中定义一个与之相对应的不定长标识码;以及对于XML文档中的每一个属性,在数据字典中定义一个与之相对应的不定长标识码包括:
对于XML文档中的每一个元素,采用8位比特位标识码表示,或是采用16位比特位标识码表示;其中高4位中的第1位用于判断是否为XML格式,第2位用于判断是否为元素,第3位用于判断是否为结束元素,第4位用于判断是否需要使用两个8位的字节来表示同一元素,剩余的比特位用于表示该元素;
对于XML文档中的每一个属性,采用8位比特位标识码表示,或是采用16位比特位标识码表示;其中高3位中的第1位用于判断是否为XML格式,第2位用于判断是否为属性,第3位用于判断是否需要使用两个8位的字节来表示同一属性,剩余的比特位用于表示该属性,其中属性的值以字符串格式表示。
2.根据权利要求1所述的一种基于不定长标识码的XML的压缩方法,其特征在于:在所述数据字典中,对于XML文档中的每一个元素,采用频度分析法来决定采用8位比特位标识码表示,或是采用16位比特位标识码表示。
3.根据权利要求1所述的一种基于不定长标识码的XML的压缩方法,其特征在于:在所述数据字典中,对于XML文档中的每一个元素,采用耗费字节数分析法来决定采用8位比特位标识码表示,或是采用16位比特位标识码表示。
4.根据权利要求1所述的一种基于不定长标识码的XML的压缩方法,其特征在于:在所述数据字典中,对于XML文档中的每一个属性,采用频度分析法来决定采用8位比特位标识码表示,或是采用16位比特位标识码表示。
5.根据权利要求1所述的一种基于不定长标识码的XML的压缩方法,其特征在于:在所述数据字典中,对于XML文档中的每一个属性,采用耗费字节数分析法来决定采用8位比特位标识码表示,或是采用16位比特位标识码表示。
6.根据权利要求1至5中任一权利要求所述的一种基于不定长标识码的XML的压缩方法,其特征在于:所述压缩方法也适用于多个具有相同DTD或者多个具有相同XML SCHMEA的XML文档的压缩,其中所述数据字典为多个XML文档共享的通用数据字典。
7.一种XML的压缩装置,其特征在于:该装置包括:XML读取模块、压缩用数据字典存储模块、标签替换压缩模块和通用压缩模块;其中:
XML读取模块,用于读取XML字节流数据;
压缩用数据字典存储模块,用于保存数据字典;
在所述数据字典中,对于XML文档中的每一个元素,在数据字典中定义了一个与之相对应的不定长标识码;以及对于XML文档中的每一个属性,在数据字典中定义了一个与之相对应的不定长标识码;
标签替换压缩模块,用于根据数据字典存储模块中定义的对应不定长标识码逐个替换XML文档中的元素和属性,生成替换压缩后的XML文档;
通用压缩模块,用于对数据字典和替换压缩后的XML文档使用通用压缩算法进行进一步压缩,生成压缩数据。
8.一种XML的解压装置,其特征在于:该装置包括:通用解压模块、解压用数据字典存储模块和标签替换解压模块,其中:
通用解压模块,用于对接收到的压缩数据使用通用解压算法进行解压;
解压用数据字典存储模块,用于存储数据字典;
在所述数据字典中,对于XML文档中的每一个元素,在数据字典中定义了一个与之相对应的不定长标识码;以及对于XML文档中的每一个属性,在数据字典中定义了一个与之相对应的不定长标识码;
标签替换解压模块,使用解压用数据字典存储模块存储的数据字典,将替换压缩后的XML文档中的不定长标识码逐个反替换为对应的元素和属性,解压得到原始的XML文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西三恒自动化设备有限公司;上海理工大学,未经山西三恒自动化设备有限公司;上海理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310580015.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:内外置通用的车灯
- 下一篇:一种基于2.4G无线通讯的电梯紧急报警对讲装置