[发明专利]一种为图数据的存储和索引设计代价评估模型的方法在审
申请号: | 202210598923.6 | 申请日: | 2022-05-30 |
公开(公告)号: | CN115099309A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 韩珣;杨曼;燕钰;王宏志;高建杰 | 申请(专利权)人: | 四川警察学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/21;G06F16/22;G06N3/04 |
代理公司: | 成都其高专利代理事务所(特殊普通合伙) 51244 | 代理人: | 廖曾 |
地址: | 646099 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 存储 索引 设计 代价 评估 模型 方法 | ||
1.一种为图数据的存储和索引设计代价评估模型的方法,其特征在于:包括下述步骤:
1)特征向量构造,对于不同的数据集和负载,提取数据集和负载的主要特征,并根据存储方案信息,构造包括数据库信息,存储方案,数据集信息和负载信息在内的特征向量;
2)训练集生成,根据特征向量生成对应的样本数据,对于每条样本向量映射为对应的数据集和负载到相应的数据库中进行打标签操作,带有负载执行时间的样本则用于构造训练集;
3)评估模型设计,利用神经网络构建能够进行主动学习的代价评估模型。
2.根据权利要求1所述的一种为图数据的存储和索引设计代价评估模型的方法,其特征在于:所述数据库信息:采用neo4j数据库和titan数据库进行测试,通过one-hot来编码;
所述存储方案:采用数据集的属性的索引信息来描述存储方案,采用二进制形式来编码,0代表该属性没有建立索引,1代表该属性建立索引;当数据集中共有n个属性,则存储方案部分用n+1位来表示,其包括了属性个数以及每一位属性上的索引信息;
所述数据集信息:根据提取的数据集的统计特征构造数据集信息,长度为4,包含节点个数、边个数、节点种类和边的种类信息;
所述负载信息:通过统计每种类型的基本操作在整个负载占据的百分比,并统计所有负载中不同属性出现的频率,据此来表示负载信息。
3.根据权利要求2所述的一种为图数据的存储和索引设计代价评估模型的方法,其特征在于:所述负载分为32种基本操作。
4.根据权利要求1或2或3所述的一种为图数据的存储和索引设计代价评估模型的方法,其特征在于:所述步骤2)包括下述具体步骤:
2.1)样本数据生成:统计已有的图数据集的特征,并随机生成一些负载特征和对应的存储方案信息,组合成样本数据集S;
2.2)打标签:根据每条样本数据所表示的数据和相应的存储方案信息将数据存储到对应的数据库中,并执行样本数据中所表示的负载,得到每条样本数据的标签;
2.3)构造训练集,利用样本数据集S中的样本组合新样本,将新样本向量化,形成训练用数据集D;
2.4)训练集预处理:对训练用数据集D的特征进行取整处理,得到新的训练集D’。
5.根据权利要求4所述的一种为图数据的存储和索引设计代价评估模型的方法,其特征在于:所述步骤2.3)的具体步骤为:
2.3.1)对于样本数据集S中的每2个样本数据,当2个向量满足一定条件时,则将2个向量组合构造新样本;
2.3.2)将每条新样本设计为一个定长长度的定长模式。
6.根据权利要求5所述的一种为图数据的存储和索引设计代价评估模型的方法,其特征在于:所述满足一定条件具体为:满足数据集信息相同、负载相同和存储方案不同。
7.根据权利要求5或6所述的一种为图数据的存储和索引设计代价评估模型的方法,其特征在于:所述新样本的两个特征向量在定长模式下:两个特征向量分别占据一半位置,且实际长度不足设置的定长长度时采用-1进行填充;若第1个特征向量的负载执行时间小于第2个特征向量的负载执行时间,则标签为1,否则标签为0。
8.根据权利要求4所述的一种为图数据的存储和索引设计代价评估模型的方法,其特征在于:所述步骤2.4)具体为:对于节点个数和边的个数直接进行向上取整处理;而对于种类数而言其取值变化范围更大,则进行log处理。
9.根据权利要求1~3、5、6、8任一项所述的一种为图数据的存储和索引设计代价评估模型的方法,其特征在于:所述代价评估模型的神经网络采用四层一维卷积神经网络,且该四层一维卷积神经网络的前三层为两个一维卷积层和一个最大池化层,中间三层为两个一维卷积层和一个最大池化层,最后两层为张量层和全连接层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川警察学院,未经四川警察学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210598923.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置