[发明专利]基于Spark基因表达式优化的爆破振动预测方法有效
申请号: | 201711254918.9 | 申请日: | 2017-12-04 |
公开(公告)号: | CN108154003B | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 王云岚;赵天海;张彬;周兴社;谷建华;曲广建;王静;朱振海;徐继革;张怀民;涂鹏程 | 申请(专利权)人: | 西北工业大学;陕西中爆安全网科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/12 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 金凤 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于Spark基因表达式优化的爆破振动预测方法,涉及机器学习领域,本发明利用数据预处理技术处理爆破数据,得到样本数据集,通过计算各条件属性的不协调率,在原始数据集中删除不协调率低于阈值的条件属性后,从而生成新的数据集作为输入数据集,在各个节点上利用改进的基因表达式方法进行函数寻优,即可得到爆破振动效果预测函数,从而得到爆破振动峰值速度的预测值。本发明能更好的解决海量数据条件下的训练效率问题,通过采用新一代并行计算技术,改进基因表达式编程算法对爆破数据进行全局函数寻优,能大大提高收敛速度,在不影响训练精度的条件下,提高训练的效率。 | ||
搜索关键词: | 基于 spark 基因 表达式 优化 爆破 振动 预测 方法 | ||
【主权项】:
一种基于Spark基因表达式优化的爆破振动预测方法,其特征在于包括下述步骤:步骤1:利用数据预处理技术处理爆破数据,得到样本数据集,将样本数据集切分成多个子集,并且存储到HDFS分布式文件系统中;所述的数据预处理为利用粗糙集的不协调率计算方法对爆破振动影响因子进行属性约简,具体包括以下步骤:步骤1(a):基于原始数据集,计算原始数据集中各条件属性的不协调率,不协调率的公式定义为:fi=(C‑Ci)/C (1)其中,fi为去掉条件属性i后的不协调率,C代表原始数据集,Ci代表去掉条件属性i之后不产生冲突的数据集,C‑Ci即不协调的数据集;步骤1(b):原始数据集中分别删除各条件属性i后,利用公式(1)计算出原始数据集中各条件属性i对决策属性的不协调率;步骤1(c):根据步骤1(b)中得到的不协调率,去掉不协调率低于设定阈值的条件属性,保留高于阈值的条件属性;步骤2:以步骤1(b)得到的各条件属性的不协调率,在原始数据集中删除不协调率低于阈值的条件属性后,从而生成新的数据集作为输入数据集,在各个节点上利用改进的基因表达式方法进行函数寻优,得到爆破振动效果预测函数;步骤2中所述的改进的基因表达式方法进行函数寻优,具体包括以下步骤:步骤2(a):对基因表达式方法中的个体染色体的结构进行调整,由原始“head+tail”结构调整为“head+body+tail”结构,head部分只能取运算集中的元素,body部分任意取运算集和终端集中的元素,tail部分只能取终端集中的元素;步骤2(b):搭建Spark分布式集群,在Spark分布式集群中各个节点将训练数据作为弹性分布式数据集(Resilient Distributed Datasets,RDD)输入,将每个个体根据GEP的编码规则编码成个体,生成新的种群RDD数据集;步骤2(c):将新生成的种群RDD数据集根据预先设定的适应度函数计算每个个体的适应度值;步骤2(d):根据达尔文适者生存原则,选择适应度值高于设定阈值的个体进入下一代,生成优胜劣汰后的种群RDD;步骤2(e):将步骤2(d)生成的种群RDD作交叉和变异操作;步骤2(f):当步骤2(e)的交叉、变异操作达到设定的次数s,或者将测试数据代入预测函数,所述的预测函数为适应度值最大的个体所对应的函数,计算出的结果与实际值的误差结果小于设定误差值,则得到最终预测函数,本步骤结束;否则,进入步骤2(c)进行下一轮迭代;在步骤2(c)到步骤步骤2(f)的迭代过程中,当迭代次数每迭代s/t次,则对各个节点上适应度值最大的个体进行个体扩散,扩散后再根据步骤2(f)所述的判断条件进行判断步骤是否结束,所述的t为节点间交流次数;所述个体扩散是指在集群中包含m个节点,其中1个节点作为主节点,其余m‑1个节点为从节点,每个从节点将本节点中适应度值最大的最优个体及从节点的编号发送给主节点,主节点从m‑1个最优个体出选出适应度值最大的个体,并将该个体及该个体的节点的编号一起广播给所有从节点,并替换所有从节点中适应度值最小的个体,若被广播的个体的节点编号与从节点的节点编号相等时,则该从节点不做替换;步骤3:将所需预测的工程爆破项目的数据参数输入到根据步骤2得到训练后的预测函数中,即可得到爆破振动峰值速度的预测值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学;陕西中爆安全网科技有限公司,未经西北工业大学;陕西中爆安全网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711254918.9/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理