[发明专利]数据处理装置和数据处理方法有效
申请号: | 201210508714.4 | 申请日: | 2012-12-03 |
公开(公告)号: | CN103020189A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 周辉 | 申请(专利权)人: | 深圳中兴网信科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 518057 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 装置 方法 | ||
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种数据处理装置和一种数据处理方法。
背景技术
随着信息技术的发展,使得半结构化数据的数量日趋增大,格式也五花八门。当前,主要用于处理半结构化数据分析的技术与装置相对较少,应用普及度不高;使得大多企业、政府部门等对IT内容的搜索、审核等难度加大。
因此,需要一种新的数据处理技术,在半结构化数据采集处理入库时,可以实现半结构化数据的结构化处理,为基于审计审核的管理工作提供方便快捷的查询结构。
发明内容
本发明正是基于上述问题,提出了一种新的数据处理技术,在半结构化数据采集处理入库时,可以实现半结构化数据的结构化处理,为基于审计审核的管理工作提供方便快捷的查询结构。
有鉴于此,本发明提出了一种数据处理装置,包括:接收单元,接收半结构化数据;第一处理单元,根据存储的所述半结构化数据的识别规则,识别出所述半结构化数据的基本属性,并对所述半结构化数据进行处理,得到第一结果数据;规则生成单元,接收用户信息,根据所述用户信息生成格式化规则,并对所述格式化规则进行存储;第二处理单元,根据所述格式化规则对所述第一结果数据进行处理,得到相应的结构化数据。
在该技术方案中,用户可以根据自己的需要定义用户信息,系统根据用户信息,会生成符合用户要求的格式化规则,根据此格式化规则对已经经过一次处理的半结构化数据进行再处理,从而得到符合用户要求的结构化数据。其中,半结构化数据的基本属性包括数据的来源点、数据类型、数据生成的时间以及数据内容等。
在上述技术方案中,优选地,还包括:输出单元,输出所述结构化数据。
在该技术方案中,用户需要不同的业务数据,就可以定义不同的用户信息,从而生成不同的格式化规则,并根据格式化规则得到用户需要的结构化数据,输出给用户,这样,用户查看到的都是自己需要的数据,从而降低了不必要的信息冗余与资源损耗,方便了用户。
在上述技术方案中,优选地,所述格式化规则包括自定义字段。
在该技术方案中,格式化规则可以是根据用户信息生成的自定义字段,用户的需求不同,用户信息就会不同,则生成的自定义字段也会不同。根据不同的自定义字段,从已经处理过的数据内容中抽取出符合自定义字段的内容并输出给用户。
在上述技术方案中,优选地,所述第二处理单元还包括:解析子单元,解析所述自定义字段,并根据解析结果对所述第一结果数据进行相应的结构化处理。
在该技术方案中,解析每个自定义字段的内容,然后根据自定义内容,从经过处理的数据内容中提取出符合自定义字段内容的数据,并将提取出的符合自定义字段的内容的数据连同数据的其他基本属性,如数据的来源点、数据类型、数据生成的时间等,一起输出给用户。
在上述技术方案中,优选地,还包括:响应单元,接收修改或删除用户信息的命令,并根据所述命令对所述用户信息进行相应的修改或删除。
在该技术方案中,用户可以根据业务需要定义用户信息,从而定制不同格式的数据结构,也可以适时的修改或删除用户信息,从而对数据信息进行裁剪或删除。这样满足了用户的个性化业务需要,降低了不必要的信息冗余。
根据本发明的又一方面,还一种数据处理方法,包括:步骤202,接收半结构化数据;步骤204,根据存储的所述半结构化数据的识别规则,识别出所述半结构化数据的基本属性,并对所述半结构化数据进行处理,得到第一结果数据;步骤206,接收用户信息,根据所述用户信息生成格式化规则,并对所述格式化规则进行存储;步骤208,根据所述格式化规则对所述第一结果数据进行处理,得到相应的结构化数据。
在该技术方案中,用户可以根据自己的需要定义用户信息,系统根据用户信息,会生成符合用户要求的格式化规则,根据此格式化规则对已经经过一次处理的半结构化数据进行再处理,从而得到符合用户要求的结构化数据。其中,半结构化数据的基本属性包括数据的来源点、数据类型、数据生成的时间以及数据内容等。
在上述技术方案中,优选地,还包括:步骤210,输出所述结构化数据。
在该技术方案中,用户需要不同的业务数据,就可以定义不同的用户信息,从而生成不同的格式化规则,并根据格式化规则得到用户需要的结构化数据,输出给用户,这样,用户查看到的都是自己需要的数据,从而降低了不必要的信息冗余与资源损耗,方便了用户。
在上述技术方案中,优选地,所述格式化规则包括自定义字段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中兴网信科技有限公司,未经深圳中兴网信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210508714.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于浏览文件的方法及装置
- 下一篇:一种基于Web应用的记事系统及方法