[发明专利]基于分布并行局部优化参数的最小二乘支持向量机软测量方法有效
申请号: | 201810190851.5 | 申请日: | 2018-03-08 |
公开(公告)号: | CN108388745B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 葛志强;张鑫宇 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06N3/12;G06N7/00;G06N20/10 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于分布并行局部优化参数的最小二乘支持向量机软测量方法,首先要对最小二乘支持向量机进行建模,获得局部优化后的最小二乘支持向量机模型,然后将训练集中样本平均分块,为每块中的样本标记数据块标签,并将具有相同标签的训练样本归为一个数据块中,然后在多台计算机上使用局部优化后的LSSVM分布并行地对每个数据块中的训练数据进行建模和对测试集数据进行预测,将多个数据块的预测结果取均值作为最终的预测结果。该方法在既保证了训练样本划分的随机性,又保证了预测精度,同时又在每个数据块中并行地进行建模和对测试集进行预测,大大减小了计算开销,使基于局部优化参数的LSSVM软测量算法同样能够在大规模数据集上得以应用。 | ||
搜索关键词: | 基于 分布 并行 局部 优化 参数 最小 支持 向量 测量方法 | ||
【主权项】:
1.一种基于分布并行局部优化参数的最小二乘支持向量机软测量方法,其特征在于,所述的基于局部优化参数的最小二乘支持向量机的建模过程如下:(a)将训练样本集和测试样本集进行归一化;(b)在归一化后的训练样本集中找到与每个归一化后的测试样本欧式距离最近的一个训练样本,并将这些所找到的训练样本合并为与测试样本集相同样本个数的局部优化目标集,同时在训练集中删除所挑选出的样本,由剩余的训练样本组成局部优化训练集;(c)以局部优化训练集作为训练,以局部优化目标集作为测试带入LSSVM模型中进行预测,并对局部优化目标集中每个样本的预测值与真实值偏差绝对值进行求和,并作为目标函数,设定LSSVM模型惩罚因子γ和径向基核函数参数σ2的取值范围,并以其作为约束条件;(d)采用智能优化算法对上一步的优化问题进行求解,返回最优LSSVM模型惩罚因子γ和径向基核函数参数σ2;(e)将步骤(d)中获得的优化模型参数代入LSSVM模型中,以全体训练集对模型进行训练,即获得基于局部优化后的最小二乘支持向量机模型;所述的基于分布并行局部优化参数的最小二乘支持向量机软测量方法具体包括如下步骤:步骤一:收集历史工业过程数据建立训练集,训练集中共有n个样本,每个样本具有m个易于测量的过程变量,以及一个需要被估计的质量变量,因此将训练样本集表示为S_train={(xi,yi)|i=1,2…,n},其中xi∈R1×m,yi∈R1,将样本中的过程变量表示为S_train(x),将样本中的质量变量表示为S_train(y),模型的测试集与训练集具有相同的形式,表示为S_test={(xi,yi)|i=1,2…,nt},nt为测试集中的样本个数;步骤二:将训练集中的样本平均分块,每块数据的样本个数与测试集样本个数的比为α,且α≥2;步骤三:采用如下公式计算训练集的分块个数Split_Num=floor(n/(α·nt))式中,Split_Num为训练集分块个数,n为训练样本个数,nt为测试样本个数,floor为向下取整;步骤四:为每块中的训练样本标记数据块标签,具体如下:(a)产生从1至Split_Num的间隔为1的升序整数序列Split_List作为每个数据块的标签序列,序列中的元素表示为Split_List[j],(j=1…Split_Num);(b)利用Split_List中的取值为训练集中样本(xSplit_Num×(i‑1)+1,ySplit_Num×(i‑1)+1)至样本(xi×Split_Num,yi×Split_Num)进行标记,其中i为标记的轮数,i的初始值为1,终值为ceil(n/Split_Num),其中,ceil为向上取整,且当完成第一轮标记时,采用随机排列函数为shuffle将Split_List的序列顺序随机打乱,打乱后的标签序列为Split_List=shuffle(Split_List),继续标记,以此类推;(c)判断i的取值是否到达ceil(n/Split_Num),或所有训练样本是否均已被标记,若是,则完成训练样本的标记;步骤五:将具有相同标签的训练样本归为一个数据块中,共形成Split_Num个数据块;步骤六:在多台计算机上使用基于局部优化的LSSVM分布并行地对每个数据块中的训练数据进行建模以及对测试集数据进行预测,共得到Split_Num个对测试集的预测结果,每个测试结果表示为ypkj,其中k=1…Split_Num,j=1…nt;步骤七:对Split_Num个预测结果取均值作为最终的预测结果,表示为![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810190851.5/,转载请声明来源钻瓜专利网。