[发明专利]一种数据格式的描述方法有效
申请号: | 201210159900.1 | 申请日: | 2012-05-21 |
公开(公告)号: | CN102708206A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | 闾国年;胡迪;温永宁;盛业华 | 申请(专利权)人: | 南京师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 李媛媛 |
地址: | 210046 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据格式 描述 方法 | ||
技术领域
本发明属于计算机和信息技术领域,特别涉及一种数据格式的描述方法。
背景技术
数据格式问题自计算机诞生时就产生了。在计算机数据交换与共享过程中,解决数据格式问题的方法主要有标准格式转换法和数据格式描述法两种。标准格式转换法是人为的规定一种适应较广的数据格式作为标准格式,强制数据以标准格式存储,并将其他数据格式的数据转换为标准格式。该方法强调数据与软件的可移植性、数据文件内容组织的灵活性,具有一定的灵活性和可扩展性,缺点在于任何一种标准格式都不可能对所有类型的数据通用、标准格式往往较为复杂。数据格式描述法采用描述机制直接对各种数据格式进行描述。该方法无需进行数据格式转换,只需采用数据描述语言对数据进行描述,可扩展性强。目前,已经有ASN-I、EAST、ODL、FREEFORM、DFDL等多种数据格式描述语言的方案,并得到了一定的应用,但是这些数据格式描述语言本质上都以数据为中心的描述方法,存在数据格式的描述能力不足的问题。因此,本发明提出一种新的数据格式描述的方法,以数据位置为中心,以数据类型和分隔符为核心,对数据的类型、结构和布局等格式信息进行统一描述。
发明内容
为了解决数据交换与共享过程中,数据格式多样、异构的问题,克服标准格式复杂、不可能适用于所有数据格式的缺点,针对现有的数据格式描述语言以数据为核心,格式的描述依附于数据,而难以描述数据格式的细微特征的缺陷,本发明的目的是提供一种数据格式的描述方法,能够对各种数据格式进行描述,解决了数据交换与共享过程中的数据格式问题。
本发明解决其技术问题所采用的技术方案是:
一种数据格式的描述方法,包括以下步骤:
(1)从数据格式的文字说明或数据中获取数据格式信息;
(2)采用数据格式标记语言对数据格式信息进行统一描述;
(3)生成数据格式标记文档。
数据格式信息包括数据的数据类型、结构和布局信息;数据类型信息是指具 有某些共同格式特征的数据的统称;结构信息是指数据的有规律的重复排列;布局信息是指数据和分隔符的位置或位置范围,两者之间的排列关系;
数据格式标记语言采用标记元素对数据格式信息进行描述,标记元素包括根元素(dfml)、导入元素(import)、位置元素(location)、数据类型元素、分隔符元素和组元素(group)6大类元素;
根元素(dfml)用于描述数据格式的基本信息;主要属性有name、namespace、version和mode;
导入元素(import)用于将其他数据格式标记文档中定义的元素导入当前文档中,使得当前文档可以引用其他文档中定义好的元素;只有一个必选的link属性;
位置元素(location)用于描述数据项在数据中的位置或位置范围;主要属性有name和value;
数据类型元素用于描述数据项的类型和格式信息,包括综合数据类型元素(datatype)和基本数据类型元素(string、integer、real、boolean、date、time、datetime和path),主要属性有name、type、value、format、default、domain、number、separator、和location,只有综合数据类型元素具有type和value属性;综合数据类型元素用于描述任何数据项的类型和格式信息,同时提供数据类型的可扩展性;基本数据类型元素用于描述某类具体的数据项的类型和格式信息;
分隔符元素用于描述数据项的分隔符类型和格式信息,包括综合分隔符元素(separator)和基本分隔符元素(space、tab、comma、semicolon、cr和br),主要属性有name、type、value、number和location,只有综合分隔符元素具有type和value属性;综合分隔符元素用于描述所有数据项的分隔符类型和格式信息;基本分隔符元素用于描述某类具体的数据项的分隔符类型和格式信息;
组元素(group)将若干个元素归为一组,通过元素的组合来描述数据的结构信息,主要属性有name、location和number。
采用数据格式标记语言对数据格式信息进行描述的过程,包括以下步骤:
(1)新建数据格式标记文档;
(2)添加根元素dfml,设置其name、namespace和mode属性描述数据格式的名称、标识符和模式信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京师范大学,未经南京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210159900.1/2.html,转载请声明来源钻瓜专利网。