[发明专利]一种基于机器学习的公式模型构建方法、系统及装置在审
申请号: | 202211236314.2 | 申请日: | 2022-10-10 |
公开(公告)号: | CN115292672A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 孙升;朱勇;张统一 | 申请(专利权)人: | 之江实验室;上海大学 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06F17/11;G06N20/00 |
代理公司: | 北京志霖恒远知识产权代理有限公司 11435 | 代理人: | 戴莉 |
地址: | 311121 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 公式 模型 构建 方法 系统 装置 | ||
1.一种基于机器学习的公式模型构建方法,其特征在于,包括以下步骤:
步骤S1:对用户给定的数据和待选基元函数集合,基于专家知识构建隐式方程,并对所述隐式方程中的变量进行无量纲化处理,得到无量纲变量;
步骤S2:根据所述待选基元函数集合,通过穷举组合构建各类项特征的特征空间进行组合,得到组合空间;
步骤S3:所述特征空间中各特征项及由各特征项组成的方程通过所述专家知识进行约束,获取方程的组合空间;
步骤S4:当所述组合空间中的方程组合数量超过预设阈值,则利用演化计算或LASSO回归的机器学习方法对所述组合空间中的方程进行回归系数求解;反之,则使用矩阵的伪逆方法对所述组合空间中的方程进行系数求解;最终,得到多个候选方程;
步骤S5:通过预设的评价公式,求解所述候选方程的评价系数,根据所述评价系数评价所述候选方程,排序靠前的所述候选方程即为最终结果。
2.如权利要求1所述的一种基于机器学习的公式模型构建方法,其特征在于,所述步骤S2具体包括以下子步骤:
步骤S21:所述待选基元函数集合包括幂函数和基元函数,对所述无量纲变量根据所述幂函数添加幂次,并对添加过幂次的无量纲变量进行乘法组合,得到含有幂次的无量纲变量和各含幂次无量纲变量相乘的组合构成子特征空间A;
步骤S22:将子特征空间A中的特征根据所述基元函数进行运算,得到子特征空间B;
步骤S23:将子特征空间A的特征和子特征空间B中的特征进行遍历乘法组合,得到组合特征空间C;
步骤S24:将子特征空间A、子特征空间B和组合特征空间C进行组合,得到组合空间。
3.如权利要求1所述的一种基于机器学习的公式模型构建方法,其特征在于,所述特征空间中各特征项及由各特征项组成的方程通过所述专家知识进行约束,所述专家知识通过机器学习中的规则和现有公式进行设立,规则如下:
无量纲变量指数的绝对值小于等于5;
特征空间中的单个特征项中无量纲变量的数量小于等于4;
特征空间中的单个特征中所有无因次变量的指数的绝对和小于等于6;
将任何同时包含exp函数和log函数的特征丢弃;
当给定的数据中的特征值由正负值组成,则将log函数和√函数丢弃;
当所述特征空间中特征的值的绝对值大于40,exp函数不会被应用;
方程的项数小于6;
exp函数和log函数不同时出现在一个方程中;
同一个元素函数不允许出现在方程的所有项中;
方程中的元素类型小于等于4;
当方程不满足上述规则,则将方程丢弃。
4.如权利要求1所述的一种基于机器学习的公式模型构建方法,其特征在于,所述步骤S5具体包括以下子步骤:
步骤S51:对于每个所述候选方程,将每个变量循环处理为因变量,将其他变量的数据代入方程求解,计算所述因变量的值与用户给定数据中相应的值之间的误差,当所述误差大于预设临界值,则所述候选方程对用户给定数据中相应的值的检验是失败的,所述因变量属于离群值,将所述候选方程丢弃;反之,得到多个最优方程;
步骤S52:利用定义分数、所述最优方程中的变量个数、所述最优方程中的最大项数、所述最优方程中重新检验的总次数、所述最优方程的个数和所述最优方程的复杂度构建评估公式;
步骤S53:利用所述评估公式对所述组合空间中的函数列表进行穷举搜索,获得更新后的分数;
步骤S54:将定义分数与更新后的分数组合为总分数,所述总分数排序靠前的所述候选方程即为最终结果。
5.如权利要求1所述的一种基于机器学习的公式模型构建方法,其特征在于,所述专家知识包括以下一种或任意多种函数:矩阵基本操作相关函数、矩阵分解的相关函数、同矩阵相关的基本数学函数、数据分析相关函数、数值微积分相关函数、随机数相关函数、随机变量的描述相关函数、随机变量的累积概率相关函数、随机变量的逆累积分布相关函数、随机变量的数字特征相关函数、参数估计相关函数、假设检验相关函数、统计与概率相关函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室;上海大学,未经之江实验室;上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211236314.2/1.html,转载请声明来源钻瓜专利网。