[发明专利]一种HDFS分布式文件系统IO性能调优方法、系统及设备有效
申请号: | 201911223200.2 | 申请日: | 2019-12-03 |
公开(公告)号: | CN111125005B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 申晓青;贾晓露 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F16/11 | 分类号: | G06F16/11;G06F16/182 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 李舜江 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 hdfs 分布式 文件系统 io 性能 方法 系统 设备 | ||
1.一种HDFS分布式文件系统IO性能调优方法,其特征在于,包括如下步骤:
S1:确定HDFS测试场景和集群可用资源区间;
S2:形成数据训练库;
S3:创建数据模型并形成预测矩阵,输出最优值及最优配置;
所述步骤S2包括:
S21:在默认推荐配置下执行TestDFSIO测试工具的测试语句,将结果以矩阵的形式存放;
S22:在获取集群可用资源区间内抽样分配更新参数,并将测试结果以矩阵的形式输出;
所述步骤S3包括:
S31:根据数据训练库、随机森林和贝叶斯算法,生成预测矩阵;
S32:根据预测矩阵中的参数使用预设脚本进行测试;
S33:将测试结果添加至数据训练库;
S34:进行数据模型创建,预测矩阵形成、自动化测试操作,直至多次连续循环测试结果均达到最优,则输出最优值及最优配置。
2.根据权利要求1所述的HDFS分布式文件系统IO性能调优方法,其特征在于,所述步骤S1包括:
S11:确定HDFS分布式文件系统I/O性能测试采用TestDFSIO测试工具;
S12:明确集群的Yarn资源、MapRduce资源区间和集群硬件总资源。
3.根据权利要求2所述的HDFS分布式文件系统IO性能调优方法,其特征在于,所述步骤S12具体为:
通过Ambari监控UI明确Yarn资源和MapRduce资源区间;
通过linux指令lscpu或cat/proc/meminfo明确集群硬件总资源。
4.一种HDFS分布式文件系统IO性能调优系统,其特征在于,包括:
确定单元,用于确定HDFS测试场景和集群可用资源区间;
形成单元,用于形成数据训练库;
输出单元,用于创建数据模型并形成预测矩阵,输出最优值及最优配置;
所述形成单元具体用于:
在默认推荐配置下执行TestDFSIO测试工具的测试语句,将结果以矩阵的形式存放;
在获取集群可用资源区间内抽样分配更新参数,并将测试结果以矩阵的形式输出;
所述输出单元具体用于:
根据数据训练库、随机森林和贝叶斯算法,生成预测矩阵;
根据预测矩阵中的参数使用预设脚本进行测试;
将测试结果添加至数据训练库;
进行数据模型创建,预测矩阵形成、自动化测试操作,直至多次连续循环测试结果均达到最优,则输出最优值及最优配置。
5.一种HDFS分布式文件系统IO性能调优设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至3任一项所述HDFS分布式文件系统IO性能调优方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911223200.2/1.html,转载请声明来源钻瓜专利网。