[发明专利]一种数据处理的方法及装置在审
| 申请号: | 201510520858.5 | 申请日: | 2015-08-24 |
| 公开(公告)号: | CN105138637A | 公开(公告)日: | 2015-12-09 |
| 发明(设计)人: | 张峰;张兆勇;王大伟 | 申请(专利权)人: | 浪潮软件股份有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
| 地址: | 250100 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据处理 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,特别涉及一种数据处理的方法及装置。
背景技术
随着信息通信技术快速发展,产生了海量的数据资源,这些数据资源被分别保存在不同的数据库中,不同的数据资源之间,一般相互之间没有关联。为了充分利用这些数据资源,需要将不同的数据资源关联起来。
现有技术中,为了建立数据资源之间的联系,一般将数据资源存储在同一个数据表中,通过同一个数据表来关联该数据表中的数据资源。例如:通过数据表中的行列将数据资源进行分类。
通过上述描述可见,现有技术中,数据资源通过存储在同一个数据表中来相关关联,但是,这种方式比较适合数据量较少的情况,当数据量很多时,将这些数据资源存储在同一个数据表中比较困难,而且不容易处理。另外,一张数据表中对数据资源的描述能力有限,只能对数据资源的少量特征进行关联,难以全面对数据资源的特征进行关联。总之,现有技术的方法关联数据的效率较低。
发明内容
有鉴于此,本发明提供了一种数据处理的方法及装置,能够提高关联数据的效率。
一方面,本发明提供了一种数据处理的方法,包括:预先设置多个标签,还包括:
S1:获取待处理数据对应的至少一个字符串;
S2:分别将每个字符串与所有标签进行匹配,获取每个字符串相匹配的匹配标签;
S3:将所有匹配标签作为所述待处理数据的标签。
进一步地,包括:所述S2,包括:
S21:从当前字符串中提取至少一个待标识字符串,其中,每个待标识字符串由当前字符串中相邻的字符组成;
S22:将每个待标识字符串与每个标签进行匹配,获取每个待标识字符串相匹配的匹配标签;
S23:将每个待标识字符串相匹配的匹配标签作为当前字符串对应的匹配标签。
进一步地,所述S22,包括:
B1:将当前待匹配字符串两端中的任意一端作为删减端;
B2:将当前待标识字符串作为当前待匹配字符串;
B3:判断当前待匹配字符串的字符数是否小于预设值,如果是,则结束当前流程,否则,执行步骤B4;
B4:将当前待匹配字符串与所有标签进行匹配,判断是否有与当前待匹配字符串相匹配的标签,如果有,则将与当前待匹配字符串相匹配的标签作为当前待标识字符串的匹配标签,执行步骤B5,否则,执行步骤B5;
B5:将当前待匹配字符串的删减端的第一个字符去掉,得到删减字符串,将所述删减待标识字符串作为当前待匹配字符串,返回步骤B3。
进一步地,包括:
X为所有标签中字符个数最少的标签的字符数,Y为所有标签中字符个数最多的标签的字符数;
所述预设值包括X;
所述S21,包括:判断当前字符串的字符数是否大于Y,如果是,则从当前字符串中提取出所有字符数为Y的待标识字符串,否则,将当前字符串作为待标识字符串。
进一步地,还包括:
将每个标签保存在对应的标签关联表,所述标签关联表中包括:当前标签的上级标签、当前标签的下级标签、当前标签的关联标签;
和/或,所述待处理数据对应的至少一个字符串,包括:存储所述待处理数据的数据表中对应的数据项名称、所述待处理数据的属性名称、所述待处理数据中的字符串;
和/或,所述多个标签,包括:存储数据的数据表中的数据项名称、标准词库中的词、数据的属性名称;
和/或,所有标签中包括多个维度的标签,每个维度的所有标签中包括描述当前维度对应的数据特征的所有标签。
进一步地,在所述S3之后,进一步包括:将对应相同标签的各个待处理数据,确定为相关联的数据。
另一方面,本发明提供了一种数据处理的装置,包括:
设置单元,用于设置多个标签;
获取单元,用于获取待处理数据对应的至少一个字符串;
匹配单元,用于分别将每个字符串与所有标签进行匹配,获取每个字符串相匹配的匹配标签,将所有匹配标签作为所述待处理数据的标签。
进一步地,包括:所述匹配单元,在执行所述分别将每个字符串与所有标签进行匹配,获取每个字符串相匹配的匹配标签时,具体执行:从当前字符串中提取至少一个待标识字符串,其中,每个待标识字符串由当前字符串中相邻的字符组成,将每个待标识字符串与每个标签进行匹配,获取每个待标识字符串相匹配的匹配标签,将每个待标识字符串相匹配的匹配标签作为当前字符串对应的匹配标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件股份有限公司,未经浪潮软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510520858.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据库访问方法
- 下一篇:一种测量高精度轴类键槽深度误差的装置





