[发明专利]一种基于插值算法的虚拟样本生成方法在审
申请号: | 202011346109.2 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112580692A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 朱群雄;张晓晗;贺彦林;徐圆;张洋 | 申请(专利权)人: | 北京化工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/02;G06F17/16 |
代理公司: | 北京太兆天元知识产权代理有限责任公司 11108 | 代理人: | 王宇 |
地址: | 100029 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 算法 虚拟 样本 生成 方法 | ||
本发明公开了一种基于插值算法的虚拟样本生成方法,在样本不平衡和不完全的情况下扩充样本量,提高精对苯二甲酸生产装置软测量建模的精度。本发明利用多维尺度分析算法获得高维原始样本在低维空间的投影,根据插值算法在样本稀疏区域生成虚拟样本,最后通过构建极限学习机神经网络获得原始样本空间虚拟样本的值,从而形成虚拟样本生成方法。本发明通过扩充样本集训练神经网络,可以提高软测量模型的精度和稳定性。本发明提供的基于插值算法的虚拟样本生成方法易于使用而且效果明显,具有优越的泛化性能和较好的稳定性,可以广泛应用于解决化工生产过程中的小样本建模。
技术领域
本发明涉及精对苯二甲酸生产技术领域,尤其涉及一种基于插值算法的虚拟样本生成方法。
背景技术
随着数据驱动方法在现代过程工业中被广泛应用于建立软测量模型,许多利用采集数据集来学习数据趋势的算法被提出。充分的有效样本和均匀的样本分布是建立精确的数据驱动模型的两个关键要求。充分的有效样本为提高软测量模型的精度和鲁棒性提供了保障。在现代流程工业中,有效样本难以获取的主要原因有:一、由于流程工业过程稳定、波动性小,难以采集到大量具有代表性的数据;二、由于采集到的数据通常具有缺失值、非线性和随机噪声等特点,难以提取出大量的有价值信息。由于样本量不充足和样本分布不均匀,建立精确、稳定的数据驱动模型比较困难,此类问题被视为小样本问题。小样本问题指由于样本规模较小、有效信息不足,而无法充分揭示样本整体特征的情况。
为了解决小样本问题,相关研究人员提出了众多方法。这些方法主要分为两类:机器学习方法和虚拟样本生成方法。机器学习方法包括支持向量机、基于灰色理论的方法和贝叶斯网络。作为一种经典的小样本学习算法,支持向量机通过间隔对数据分布进行结构化描述,减少了对样本数目和样本分布的要求,从理论上保证了模型的最大泛化能力。尽管支持向量机及其改进模型被广泛用于解决许多实际问题,但当样本数量十分稀少时,它们的工作性能不佳。基于灰色理论的方法是一种常用的不确定系统建模和分析工具。主要通过从部分已知信息来挖掘数据的深层次信息,弱化系统的随机性,从而使紊乱的原始数据列呈现出某种规律性,揭示了系统内部事物连续发展变化的过程。然而,灰色系统理论适用于呈指数规律变化的单维数据,无法适用于高维数据。同时,基于灰色理论的方法难以处理非等距时间数据列。贝叶斯网络是一种将现有数据与专家判断相结合,不确定知识的推理和表达方法。然而,从一个小样本集中获得贝叶斯网络的结构和参数是非常困难的。同样,其他机器学习方法解决小样本问题的性能也非常有限。
由于机器学习方法的局限性,虚拟样本生成技术作为一种样本扩充方法被提出。虚拟样本生成方法能够根据原始小样本信息生成虚拟样本,有效地扩充数据量,提高识别性能。基于虚拟样本生成的方法是近年来研究的热点。根据虚拟样本生成原理,虚拟样本生成技术通常分为以下三类:(1)基于采样的虚拟样本生成方法;(2)基于信息扩散的虚拟样本生成方法;(3)基于特征表达的虚拟样本生成方法。基于采样的虚拟样本生成方法通过采样分布了解样本的真实分布。此类虚拟样本生成方法的性能取决于能否找到一个合适的分布,这个分布通常由一个参数概率模型来拟合。而对于高维的工业过程数据,学习其样本的联合分布是很困难的。基于信息扩散的虚拟样本生成方法利用信息扩散原理推导扩散函数,并利用模糊理论在一定范围内生成新的样本。然而,扩散函数和扩散系数无法有效地确定,并且没有考虑实际样本的不对称性。基于特征表达的虚拟样本生成方法主要是利用特征提取方法对高维样本进行降维处理,以获得适合处理高维数据的特征空间。与其他两种虚拟样本生成原理相比,基于特征表达的虚拟样本生成思想更适用于处理复杂工业过程中的高维数据。因此,本发明正是基于这一原则展开的。
发明内容
为解决现有技术存在的局限和缺陷,本发明提供一种基于插值算法的虚拟样本生成方法,包括获得数据并进行数据预处理,MDS算法对原始数据进行降维处理,特征空间插值生成虚拟样本,对PTA过程醋酸消耗进行建模;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京化工大学,未经北京化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011346109.2/2.html,转载请声明来源钻瓜专利网。