[发明专利]一种测试数据的构造方法和设备有效
申请号: | 201310358970.4 | 申请日: | 2013-08-16 |
公开(公告)号: | CN103455420A | 公开(公告)日: | 2013-12-18 |
发明(设计)人: | 顾美营 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 测试数据 构造 方法 设备 | ||
技术领域
本发明涉及软件测试领域,尤其涉及一种测试数据的构造方法和设备。
背景技术
在重复数据删除产品的测试过程中,需要对不同备份主机的数据和同一备份主机多次备份的数据进行测试,得到重复数据删除比率这个指标,具体的,重复数据删除比率的计算方法是重复数据删除前的数据总量:重复数据删除后的数据总量,在测试过程中,生成用于进行测试的数据的方式首选为:生成一组内容随机的文件来模拟得到不同备份主机的数据,然后重复若干次上述的生成过程模拟得到各备份主机多次备份的数据,以此来测试应用在备份系统中的重复数据删除产品的重复数据删除比率。
在实现上述现有技术的过程中,发明人发现现有技术中至少存在如下问题:由于产生的数据都是随机的,因此无法构造出确定相似度的数据来支撑复数据删除产品的测试过程以得到准确的重复数据删除比率这一关键指标,更加无法构造不同类型的数据以支撑应用于不同场景的重复数据删除产品的测试。
发明内容
本发明的实施例提供一种测试数据的构造方法和设备,可以模拟出不同备份源进行备份的数据情况,还可以模拟出同一个备份源进行多次备份的数据情况,并且构造出的数据具有一定的差异度,而且该差异度还可以指定;此外,还可以构造出不同模型的数据,以支撑应用于不同场景下的重复数据删除产品的测试。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明实施例提供了一种测试数据的构造方法,包括:
生成初始文件组,其中,所述初始文件组中的每个文件按照固定的顺序进行排列,而且所述初始文件组中相邻文件之间的内容差异率为预设的第一差异率X,所述第一差异率为所述初始文件组中相邻文件之间有差异的内容占所述文件内容的比例;
将所述初始文件组中的每个文件进行编辑操作,生成编辑后的文件组,其中,所述编辑后的文件组中的文件的顺序与所述初始文件组中对应的文件的顺序相同,并且所述编辑后的文件组中每个文件与所述初始文件组中对应的文件之间的内容差异率为预设的第二差异率Y,所述第二差异率为所述编辑后的文件组中每个文件与所述初始文件组中对应的文件之间有差异的内容占所述文件内容的比例。
根据第一种可能的实现方式,结合第一方面,所述生成初始文件组,包括:
生成内容随机的第一文件;
将所述第一文件切分成等长的预设数量P个文件块,并且对所述P个文件块中的P*X个文件块进行编辑操作,生成第二文件。
根据第二种可能的实现方式,结合第一方面或者第一种可能的实现方式,所述将所述初始文件组中的每个文件进行编辑操作生成编辑后的文件组,包括:
将所述初始文件组中的每个文件切分成等长的预设数量Q个数据块;
随机选择所述Q个数据块中的Q*Y个数据块进行编辑操作,得到所述编辑后的文件组的对应文件。
根据第三种可能的实现方式,结合第二种可能的实现方式,所述随机选择所述Q个数据块中的Q*Y个数据块进行编辑操作,包括:
在整数1-Q范围内生成Q*Y个满足预设的随机分布的整数变量,其中,所述预设的随机分布的整数变量包括满足正态分布的整数变量或满足均匀分布的整数变量;
对所述Q个数据块中所述Q*Y个整数变量所对应的编号的数据块进行编辑操作。
根据第四种可能的实现方式,结合第一方面、第一种至第三种可能的实现方式中的任一项,所述第一差异率X的取值范围是50%-100%,所述第二差异率Y的取值范围是1%-10%。
根据第五种可能的实现方式,结合第一方面、第一种至第四种可能的实现方式中的任一项,所述编辑操作包括新增、删除或修改。
第二方面,本发明实施例提供了一种测试数据的构造设备,包括:
第一生成单元,用于生成初始文件组,其中,所述初始文件组中的每个文件按照固定的顺序进行排列,而且所述初始文件组中相邻文件之间的内容差异率为预设的第一差异率X,所述第一差异率为所述初始文件组中相邻文件之间有差异的内容占所述文件内容的比例;
第二生成单元,用于将所述第一生成单元生成的所述初始文件组中的每个文件进行编辑操作,生成编辑后的文件组,其中,所述编辑后的文件组中的文件的顺序与所述初始文件组中对应的文件的顺序相同,并且所述编辑后的文件组中每个文件与所述初始文件组中对应的文件之间的内容差异率为预设的第二差异率Y,所述第二差异率为所述编辑后的文件组中每个文件与所述初始文件组中对应的文件之间有差异的内容占所述文件内容的比例。
根据第一种可能的实现方式,结合第二方面,所述第一生成单元包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310358970.4/2.html,转载请声明来源钻瓜专利网。