[发明专利]一种测试数据的生成方法和系统有效

专利信息
申请号: 202010216656.2 申请日: 2020-03-25
公开(公告)号: CN111444094B 公开(公告)日: 2023-08-04
发明(设计)人: 许江峰;蔡苗;陈震宇;刘国华 申请(专利权)人: 中国邮政储蓄银行股份有限公司
主分类号: G06F11/36 分类号: G06F11/36;G06F18/23;G06F18/2415
代理公司: 北京市万慧达律师事务所 11111 代理人: 顾友
地址: 100032*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 测试数据 生成 方法 系统
【说明书】:

发明公开了一种测试数据的生成方法和系统,所述生成方法包括以下步骤:接收元数据的信息,并明确所述元数据的关联数据,对所述关联数据进行分析,调整关联字段的分布,找出所述关联数据中的字段关系特征;根据所述字段关系特征,匹配不同的数据运算方法对所述元数据进行测试数据的运算,并根据所述元数据的存储位置输出所述测试数据的存储格式和字段类型。本发明实施例提供的能够生成方法和系统能够利用较少的操作工作量,生成用于测试程序性能的数据,来实现对程序可行性的测试或程序效率的调优。本发明实施例解决了现阶段采用随机生成测试数据的弊端,使测试数据与真实数据更加相似。

技术领域

本发明涉及计算机领域,具体涉及一种测试数据的生成方法和系统。

背景技术

目前,对程序可行性的测试或程序效率的调优时,都需要用到测试数据,然而,传统的封闭网络系统中,真实数据难以导入相关系统中,或系统只要小规模的样本数据,而系统程序是大规模的批量运算,现有的测试数据难以满足对程序效率测试的需求。现阶段,大家生产测试数据主要是用随机数生产,由于传统的随机生产都未对元数据进行处理,导致测试数据存在以下几个方面的问题:数据分布不一致、不能体现字段间的相关性、主键与外键的关联性差,进而导致这种随机的生成的测试数据与真实数据差距较大,影响了测试的准确性和程序效率的调优。

发明内容

为了解决现有技术的问题,本发明实施例提供了一种测试数据的生成方法和系统,利用较少的操作工作量,生成和真实数据相似度更高的测试数据。

为解决上述技术问题,本发明采用的技术方案是:

第一方面,本发明提供了一种测试数据的生成方法,包括以下步骤:

接收元数据的信息,并明确所述元数据的关联数据,对所述关联数据进行分析,调整关联字段的分布,找出所述关联数据中的字段关系特征;

根据所述字段关系特征,匹配不同的数据运算方法对所述元数据进行测试数据的运算,并根据所述元数据的存储位置输出所述测试数据的存储格式和字段类型。

进一步地,对所述元数据进行测试数据的运算包括以下步骤:

当所述元数据中有明确性相关字段的测试数据生成时,采用明确的加减乘除四则运算规则实现字段间数据类型和数据值的转化;

当所述元数据中有复杂关联的数据集间字段的运算时,首先对所述数据集进行局部认识或者明确小样本的原始数据集,选择不同的算法模型并调试,从而输出不同类型的测试数据,并验证所述测试数据的准确性。

进一步地,在对所述数据集进行局部认识或者明确小样本的原始数据集的过程中,当选择聚类算法或者分类算法得到数据特征时,首先选择与所述聚类算法或所述分类算法具有紧密相关的字段,然后按照选择的结果,随机选择某一字段的值,再随机选择其他字段,并按照选择的字段采用贝叶斯算法模型或者决策树算法模型,确定符合聚类结果的概率。

进一步地,在对所述数据集进行局部认识或者明确小样本的原始数据集的过程中,当选择关联算法得到数据特征时,首先选择与关联算法具有相关的字段,然后按照关联的结果,先随机关联某一字段,通过关联的结果,按照预定的置信度生成其他关联字段。

进一步地,对所述关联字段的分布调整包括:对无关联字段采用ARM算法进行相关概率分布的调整;对复杂关联字段采用隔离分箱填充不同数量的字段;通过判断字段间的主外键关联度,使得字段表的外键存在于相关所述字段表中;通过字段的长度和精度进行字段约束。

另一方面,本发明还提供了一种测试数据的生成系统,包括:

元数据处理模块,用于接收元数据的信息,并明确所述元数据的关联数据,对所述关联数据进行分析,调整关联字段的分布,找出所述关联数据中的字段关系特征;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国邮政储蓄银行股份有限公司,未经中国邮政储蓄银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010216656.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top