[发明专利]一种数据处理的方法及装置在审
| 申请号: | 201510520858.5 | 申请日: | 2015-08-24 |
| 公开(公告)号: | CN105138637A | 公开(公告)日: | 2015-12-09 |
| 发明(设计)人: | 张峰;张兆勇;王大伟 | 申请(专利权)人: | 浪潮软件股份有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
| 地址: | 250100 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据处理 方法 装置 | ||
1.一种数据处理的方法,其特征在于,包括:预先设置多个标签,还包括:
S1:获取待处理数据对应的至少一个字符串;
S2:分别将每个字符串与所有标签进行匹配,获取每个字符串相匹配的匹配标签;
S3:将所有匹配标签作为所述待处理数据的标签。
2.根据权利要求1所述的方法,其特征在于,包括:所述S2,包括:
S21:从当前字符串中提取至少一个待标识字符串,其中,每个待标识字符串由当前字符串中相邻的字符组成;
S22:将每个待标识字符串与每个标签进行匹配,获取每个待标识字符串相匹配的匹配标签;
S23:将每个待标识字符串相匹配的匹配标签作为当前字符串对应的匹配标签。
3.根据权利要求2所述的方法,其特征在于,所述S22,包括:
B1:将当前待匹配字符串两端中的任意一端作为删减端;
B2:将当前待标识字符串作为当前待匹配字符串;
B3:判断当前待匹配字符串的字符数是否小于预设值,如果是,则结束当前流程,否则,执行步骤B4;
B4:将当前待匹配字符串与所有标签进行匹配,判断是否有与当前待匹配字符串相匹配的标签,如果有,则将与当前待匹配字符串相匹配的标签作为当前待标识字符串的匹配标签,执行步骤B5,否则,执行步骤B5;
B5:将当前待匹配字符串的删减端的第一个字符去掉,得到删减字符串,将所述删减待标识字符串作为当前待匹配字符串,返回步骤B3。
4.根据权利要求3所述的方法,其特征在于,包括:
X为所有标签中字符个数最少的标签的字符数,Y为所有标签中字符个数最多的标签的字符数;
所述预设值包括X;
所述S21,包括:判断当前字符串的字符数是否大于Y,如果是,则从当前字符串中提取出所有字符数为Y的待标识字符串,否则,将当前字符串作为待标识字符串。
5.根据权利要求1所述的方法,其特征在于,还包括:
将每个标签保存在对应的标签关联表,所述标签关联表中包括:当前标签的上级标签、当前标签的下级标签、当前标签的关联标签;
和/或,所述待处理数据对应的至少一个字符串,包括:存储所述待处理数据的数据表中对应的数据项名称、所述待处理数据的属性名称、所述待处理数据中的字符串;
和/或,所述多个标签,包括:存储数据的数据表中的数据项名称、标准词库中的词、数据的属性名称;
和/或,所有标签中包括多个维度的标签,每个维度的所有标签中包括描述当前维度对应的数据特征的所有标签。
6.根据权利要求1所述的方法,其特征在于,在所述S3之后,进一步包括:将对应相同标签的各个待处理数据,确定为相关联的数据。
7.一种数据处理的装置,其特征在于,包括:
设置单元,用于设置多个标签;
获取单元,用于获取待处理数据对应的至少一个字符串;
匹配单元,用于分别将每个字符串与所有标签进行匹配,获取每个字符串相匹配的匹配标签,将所有匹配标签作为所述待处理数据的标签。
8.根据权利要求7所述的装置,其特征在于,包括:所述匹配单元,在执行所述分别将每个字符串与所有标签进行匹配,获取每个字符串相匹配的匹配标签时,具体执行:从当前字符串中提取至少一个待标识字符串,其中,每个待标识字符串由当前字符串中相邻的字符组成,将每个待标识字符串与每个标签进行匹配,获取每个待标识字符串相匹配的匹配标签,将每个待标识字符串相匹配的匹配标签作为当前字符串对应的匹配标签;
和/或,还包括:关联单元,用于将对应相同标签的各个待处理数据,确定为相关联的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件股份有限公司,未经浪潮软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510520858.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据库访问方法
- 下一篇:一种测量高精度轴类键槽深度误差的装置





