[发明专利]基于半监督回归学习的多模型软测量方法无效
申请号: | 201210148588.6 | 申请日: | 2012-05-11 |
公开(公告)号: | CN102693452A | 公开(公告)日: | 2012-09-26 |
发明(设计)人: | 阎威武;李哲;王国良;陈世和;张曦 | 申请(专利权)人: | 上海交通大学;广东电网公司电力科学研究院 |
主分类号: | G06N7/02 | 分类号: | G06N7/02 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 回归 学习 模型 测量方法 | ||
技术领域
本发明涉及的是一种软测量仪表技术领域的方法,具体是一种基于半监督回归学习的多模型软测量方法。
背景技术
在目前的工业生产中,一般采用两种手段实现控制变量的测量:在线仪表的方法和离线测量分析的方法。但是这两种方法都存在一定的缺点和劣势:在线仪表进行测量的方法往往投入成本高,维护难度大,而离线测量分析的方法则由于人工因素的加入,容易测量过失误差变大,且测量滞后性严重,难以满足对实时性要求较高的系统。随着计算机技术的发展,软测量技术成为解决这一问题的有效方法,软测量技术是一种使用计算机建模技术对一些难以测量或者无法测量的变量进行预测的方法,这种难以测量的变量一般称为主导变量,与之相对,作为模型输入的另外一些相对容易测量的变量则一般称为辅助变量。软测量技术的输入是辅助变量,输出是主导变量,这种方法一般具有投入成本低、维护方便、可以实时测量的优点。
在传统的软测量技术中,往往仅仅使用少量的标记数据来进行建模,浪费了大量可以轻易获得的未标记数据的价值,而半监督学习是一种研究如何利用未标记样本来获得较好性能和推广能力的学习机器。近些年来,随着机器学习的不断发展以及未标记数据的日渐增加,半监督学习正逐渐成为一个研究热点。一般来说,标记数据的获取是比较“昂贵”的,在一个系统中,一般没有办法大量地获得标记数据来进行建立模型,而未标记数据因为并不需要人工地对数据进行标记,所以可以对其大量获取,并且研究发现,在未标记数据中存在能够表述数据结构特点的信息,如果能力对这些信息加以利用,在软测量技术中是可以有效地提高预测精度的。
随着现代社会经济和科技的迅猛发展,工业生产环境变得越来越复杂,想要在这样复杂的工业环境中做到系统控制准确,必然需要对系统有更加准确和多样化的认识。在软测量领域,因为测量的主导变量一般是能够主导控制策略变化的主要因素,所以如果软测量模型不准确,将会带来非常严重的控制问题。目前软测量建模的方法有很多种,每种方法都可能有它自己相对应或者擅长的领域,而如今的控制系统也往往出现多变量、非线性、强耦合、多工况、控制性能综合要求高等特点,是多种类型系统的组合或者耦合,对这种系统采用单一模型进行软测量建模,效果并不好。所以,对于复杂多工况的系统,有必要建立多个软测量模型,同时利用多个模型对系统的主导变量进行测量,最后再根据多组测量结果进行优化,从而有助于提高软测量模型的鲁棒性、准确性和可靠性。
发明内容
本发明针对传统软测量技术中并没有利用未标记数据及对于多工况、非线性强的复杂工业过程单一模型预测效果不好的问题,提供一种基于半监督回归学习的多模型软测量方法。
根据本发明的一个方面,提供一种基于半监督回归学习的多模型软测量方法,包括如下步骤:
步骤一:对数据进行聚类;
步骤二:根据数据分类结果采用多个子模型预测方案共同进行子模型预测,获得子模型预测结果;
步骤三:将多个子模型预测结果进行合并,得到预测结果。
优选地,所述步骤一,具体为:以加权式多模型软测量建模方法采用G-K模糊聚类算法对数据进行聚类。
优选地,所述步骤三,包括步骤:将子模型预测结果进行基于加权的优化。
优选地,所述步骤一,具体为:以切换式多模型软测量建模方法采用最小距离分类算法对数据进行聚类。
优选地,所述步骤三,包括步骤:将子模型预测结果进行基于切换的优化。
优选地,在软测量模型建模之前,首先通过数据聚类将作为模型输入的辅助变量数据根据它们之间的相似性进行分类,接着再根据分类结果采用不同的建模策略将一个系统拆分为多个软测量子模型共同进行变量预测,最后再把多个子模型的预测结果进行合并,形成一种多模型的软测量模型预测结果。
优选地,所述对数据进行聚类包括模糊聚类以及硬聚类,其中,模糊聚类是指一种不严格的聚类,即某一个数据点并不完全属于一个类别,数据点对各个类别的所述关系通过模糊隶属度来表现,模糊隶属度是一个范围在0到1内的小数,该小数越大,代表数据点与某一类别中的数据越相似,此外,同一数据点对所有类别的模糊隶属度加和为1;硬聚类是指一种严格的聚类,即某一个数据点是只能严格地属于某一个类别,这种方法不存在隶属度的概念,对某一数据点的所属关系来说,是非此即彼的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;广东电网公司电力科学研究院,未经上海交通大学;广东电网公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210148588.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:视频信号处理系统与方法
- 下一篇:一种制备间苯二甲胺的方法