[发明专利]基于遗传编程的多元回归预测模型优化方法在审

申请号：	201710227808.7	申请日：	2017-04-10
公开（公告）号：	CN107145964A	公开（公告）日：	2017-09-08
发明（设计）人：	黄震华	申请（专利权）人：	同济大学
主分类号：	G06Q10/04	分类号：	G06Q10/04
代理公司：	上海科律专利代理事务所(特殊普通合伙)31290	代理人：	叶凤
地址：	200092 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种基于遗传编程的多元回归预测模型优化方法，通过初始多元回归预测模型簇构造和多元回归预测模型簇进化两个模块来获取最优的多元回归预测模型。初始多元回归预测模型簇构造模块生成用户指定数量的多元回归预测模型个体，并优化每个模型个体的权重参数。多元回归预测模型簇进化模块对初始多元回归预测模型簇进行解析之后，基于遗传编程策略实现选择、解析、交叉、变异和评估五个操作的迭代处理，并将最终的最优多元回归预测模型个体返回给用户。与现有技术相比，本发明具有准确度高、速度快以及泛化能力强等优点，能够有效应用于智能交通、电子商务、生物信息、医疗健康和社会公共安全等领域。
搜索关键词：	基于遗传编程多元回归预测模型优化方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于遗传编程的多元回归预测模型优化方法，其特征在于，包括初始多元回归预测模型簇构造和多元回归预测模型簇进化两个模块，所述初始多元回归预测模型簇构造模块，通过2个步骤来实现：步骤1.1：多元回归预测模型簇生成。从输入端获取所要预测问题的w个影响因素以及模型个体数量参数值m(m为正整数)，顺序产生m个多元回归预测模型个体分别表示为：其中y[z](1≤z≤m)为第z个模型个体的因变量，即该模型个体的预测值；n[z]为第z个模型个体的自变量个数，且n[z]≤w；a[z]i为第z个模型个体第i(1≤i≤n[z])个自变量的系数；r[z]i为第z个模型个体第i个自变量的次幂。每个模型个体中的自变量均取自且不重复。从而，这m个多元回归预测模型个体构成一个集合PM，即为多元回归预测模型簇。步骤1.2：簇内各模型个体参数优化。从输入端获取数据样本集合其中每个数据样本均由和两部分组成，为w个影响因素的取值，为实际预测值。然后，对于PM中的每一个模型个体基于Ψ，对中的n[z]个自变量系数a[z]1～a[z]n[z]进行迭代优化，并最终产生最优的多元回归预测模型个体。所述多元回归预测模型簇进化模块，通过5个步骤来实现：步骤2.1：多元回归预测模型簇选择。从输入端获取选择率的取值s(0<s<1)和数据样本集合计算模型簇PM中每个模型个体的预测准确度，并从中选取个预测准确度最高的模型个体，将它们组成集合OM，表示取上限整数，并从PM中删除OM中的模型个体。步骤2.2：多元回归预测模型簇解析。以步骤2.1中的模型簇PM为输入，对于其中的每一个模型个体将其转换成一棵二叉解析树BP[z]。BP[z]需要同时满足如下6个条件：1)任一个节点至多包含两个子节点，2)左叶子节点为自变量系数，3)右叶子节点为自变量及其次幂，4)叶子节点的父节点为乘法运算(即“×”号)，5)其余节点为加法运算(即“+”号)，6)右叶子节点关联中的一个影响因素标识符。从而，当所有模型个体转换完毕之后，将得到PM所对应的二叉解析树集合BM。步骤2.3：多元回归预测模型簇交叉。从输入端获取交叉率的取值c(0<c<1)，并从步骤2.2获得的BM中选取棵二叉解析树，如果为奇数，那么再从BM中选取一棵，使得最终共选取偶数棵(记为q)二叉解析树，然后，将所选取的二叉解析树分成q/2个组，每组包含两棵二叉解析树。接着，对每个分组所包含的两棵树进行交叉处理，即分别在这两个棵树上选取一个相容节点，然后互换以相容节点为根节点的子树，从而得到两棵新的二叉解析树。两个节点称为相容节点，它们需要满足：1)运算符号相同，或者2)均为左叶子节点，或者3)均为右叶子节点。当所有q/2个分组处理完毕之后，得到q棵新的二叉解析树，并将它们取代BM中原先q棵旧的树，从而得到更新后的集合BM。步骤2.4：多元回归预测模型簇变异。从输入端获取变异率的取值h(0<h<1)，并从步骤2.3更新的BM中选取棵二叉解析树。对于每棵被选取的二叉解析树进行变异处理，即执行如下4个变异操作中的任意一个操作：1)修改某一个左叶子节点所对应的自变量系数，2)修改某一个右叶子节点所对应的自变量次幂，3)删除以“×”号为根节点的子树，同时删除“×”号的父节点，4)删除以“+”号为根节点的子树，同时删除“+”号的父节点。当所有棵二叉解析树处理完毕之后，将它们取代BM中原先棵旧的树，从而得到更新后的集合BM。步骤2.5：多元回归预测模型簇评估。将步骤2.4得到集合BM中的每一棵二叉解析树转换成多元回归预测模型个体，并合并步骤2.1得到的OM，从而获得新的模型簇PM。从输入端获取数据样本集合对PM中的每个模型个体进行预测准确度评估，获取预测准确度最高的模型个体然后，从输入端获取预测准确度阈值γ(0<γ<1)，如果的预测准确度达到γ，那么将返回给用户，否则转到步骤2.1，进行下一轮的迭代处理。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于同济大学，未经同济大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710227808.7/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政；管理
G06Q10-02 .预定，例如用于门票、服务或事件的
G06Q10-04 .预测或优化，例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理，例如组织、规划、调度或分配时间、人员或机器资源；企业规划；组织模型
G06Q10-08 .物流，例如仓储、装货、配送或运输；存货或库存管理，例如订货、采购或平衡订单
G06Q10-10 .办公自动化，例如电子邮件或群件的计算机辅助管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于遗传编程的多元回归预测模型优化方法在审

专利文献下载