[发明专利]用于生成非关系数据库的模式的方法和设备有效
申请号: | 201410181384.1 | 申请日: | 2014-04-30 |
公开(公告)号: | CN105095237B | 公开(公告)日: | 2018-07-17 |
发明(设计)人: | 王岚君;张硕;焦丽梅;王晨 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 周少杰 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 记录模式 非关系数据库 方法和设备 树状关系 条目 相似度确定 结果更新 名称变化 中子节点 层级 更新 | ||
1.一种用于生成非关系数据库的模式的方法,包括:
确定非关系数据库的至少一个条目中的记录模式,所述记录模式是该条目中以键为节点的各键层级之间的树状关系,其中键对应于属性名称;
基于所述树状关系中子节点的相似度确定存在属性名称变化的节点,并根据确定的结果更新相应的记录模式;
基于更新后的记录模式生成所述非关系数据库的模式,
所述方法还包括:
对每个条目的记录模式进行CinP编码,其中,每个节点的CinP编码包括该节点自身编码P-Code以及其子节点的编码C-Code;
所述基于树状关系中子节点的相似度确定存在属性名称变化的节点是基于CinP编码后的记录模式中子节点的相似度确定存在属性名称变化的节点,
所述基于所述树状关系中子节点的相似度确定存在属性名称变化的节点,并根据确定的结果更新相应的记录模式包括:
将编码后的树形结构记录模式解析成路径集合,所述路径包括叶子节点到根节点所经过的所有节点的编码;
根据某一层的P-Code分桶;
在各桶中,根据该层子节点的相似度判断确定存在属性名称变化的父节点;
将部分所确定的存在属性名称变化的父节点源P-Code更新为目标P-Code,更新该更新后的父节点的相应父节点的C-Code编码。
2.根据权利要求1所述的方法,所述各桶中,根据该层子节点的相似度判断确定存在属性名称变化的父节点包括:
对于存在多条路径的桶,确定出该层子节点的父节点的P-Code不同的节点;
通过所确定的父节点的C-Code以及公式计算父节点的相似度,其中,N1,N2代表两个父节点,CN1表示N1的子节点集合,CN2表示N2的子节点集合,|.|表示集合中元素个数;
如果相似度大于门限值G1,则认为两个父节点发生了属性名称的变化。
3.根据权利要求2所述的方法,根据至少一个更新后的记录模式生成所述非关系数据库的模式包括:
在路径编码中,提取只包含P-Code的子序列,并统计该子序列出现的频率,并合并相同的P-Code子序列;
保留频率超过门限G2的P-Code子序列,并将其按照各层的编码表进行解码生成所述非关系数据库的模式。
4.根据权利要求1所述的方法,其中确定非关系数据库的至少一个条目中的键之间的树状关系包括:
提取所述条目中包含的键;
确定所述提取的键在所述条目中的层级信息;以及
根据所述层级信息确定所述键之间的树状关系。
5.根据权利要求1所述的方法,其中根据基于更新后的记录模式生成所述非关系数据库的模式包括:
获取至少一个路径中的有效路径及其权重;以及
基于所述有效路径及其权重,生成所述非关系数据库的模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410181384.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带除尘功能的热交换器
- 下一篇:光纤传感器及其应用