[发明专利]基于遗传算法的自动机器学习数据建模方法在审

专利信息
申请号: 202010972405.7 申请日: 2020-09-16
公开(公告)号: CN112070237A 公开(公告)日: 2020-12-11
发明(设计)人: 董俊杰;王之元 申请(专利权)人: 天津大学
主分类号: G06N20/00 分类号: G06N20/00;G06N3/12
代理公司: 苏州拓云知识产权代理事务所(普通合伙) 32344 代理人: 李锋
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 遗传 算法 自动 机器 学习 数据 建模 方法
【权利要求书】:

1.基于遗传算法的自动机器学习数据建模方法,其特征在于,其包括以下步骤:

步骤一:设定多个管道,每个所述管道均包含四个模块,四个所述模块分别设置为数据预处理模块、特征工程模块、模型生成模块和模型评估模块;

步骤二:初始化遗传算法,首先定义遗传算法的关键参数:generations,population_size,offspring_size,mutation_rate,crossover_rate,然后定义优化参数:scoring,cv,subsample;

步骤三:遗传算法过程:

a.初始化:随机初始化n个线性管道;

b.淘汰:通过多目标遗传规划算法选择,最大化验证集准确率同时最小化每个管道的算子,选取定义的前d个管道;

c.分裂:将步骤2得到的d个管道复制t份共d*t个管道作为初始化子代;

d.变异:首先将5%子代与另5%子代的管道上的算子互换,然后将剩下的90%的子代,等概率进行增删,转移算子操作;

e.转到步骤二,重复该过程m次;

步骤四:将最优的管道生成的模型保存同时保存了最优参数,以便用于模型部署。

2.根据权利要求1所述的基于遗传算法的自动机器学习数据建模方法,其特征在于:所述步骤一中,所述数据预处理模块包括数据增强、缺失值计算、数据变换、数据集分割和数据标准化与归一化方法。

3.根据权利要求1所述的基于遗传算法的自动机器学习数据建模方法,其特征在于:所述步骤一中,特征工程模块主要为特征选择,主要包括过滤式、包裹式和嵌入式。

4.根据权利要求3所述的基于遗传算法的自动机器学习数据建模方法,其特征在于:所述过滤式有方差选择法、相关系数法、卡方检验和互信息法。

5.根据权利要求3所述的基于遗传算法的自动机器学习数据建模方法,其特征在于:所述包裹式主要为递归特征消除法。

6.根据权利要求3所述的基于遗传算法的自动机器学习数据建模方法,其特征在于:所述嵌入式主要由基于惩罚项的特征选择法、基于树模型的特征选择法。

7.根据权利要求2所述的基于遗传算法的自动机器学习数据建模方法,其特征在于:所述步骤二中,所述generations表示遗传算法进化次数,可理解为迭代次数;所述population_size表示每次进化中种群的大小;所述scoring表示损失函数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010972405.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top