[发明专利]一种基于插值算法的虚拟样本生成方法在审
申请号: | 202011346109.2 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112580692A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 朱群雄;张晓晗;贺彦林;徐圆;张洋 | 申请(专利权)人: | 北京化工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/02;G06F17/16 |
代理公司: | 北京太兆天元知识产权代理有限责任公司 11108 | 代理人: | 王宇 |
地址: | 100029 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 算法 虚拟 样本 生成 方法 | ||
1.一种基于插值算法的虚拟样本生成方法,其特征在于,包括获得数据并进行数据预处理,MDS算法对原始数据进行降维处理,特征空间插值生成虚拟样本,对PTA过程醋酸消耗进行建模;
所述获得数据并进行数据预处理的步骤包括:对现场采集的PTA数据中存在的缺失数据、异常数据和噪声数据进行处理,获得I个训练样本{(Xi,Yi)|i=1,2,…,I},其中Xi=[xi1,xi2,…,xin]代表第i个输入样本,Yi代表输出向量,xin代表第i个输入样本Xi的第n个变量,n个变量分别对应进料醋酸含量、进料流量、水回流量、NBA主回流量、NBA侧线回流量、蒸汽流量、塔顶采出量、进料温度、回流温度、塔顶温度、塔板温度、塔板温度、塔板温度、塔内压力、塔板之间可控温度点、回流罐液位、溶剂脱水塔的操作压力,所述输出向量为溶剂脱水塔塔顶电导率;
所述MDS算法对原始数据进行降维处理的步骤包括:设定I个样本之间的距离在原始空间的距离矩阵为D,获得降维到二维空间的样本矩阵Z的表达式如下:
其中,第i个样本和第j个样本在距离矩阵D中距离为dist[i,j],在样本矩阵Z中距离为||Zi-Zj||,dist[i,j]=||Zi-Zj||;
令B=ZTZ,得到获得表达式如下:
令所述样本矩阵Z被中心化,获得表达式如下:
获得表达式(6)如下:
获得表达式(7)如下:
将表达式(6)和表达式(7)代入表达式(4)得到表达式如下:
对所述距离矩阵D进行特征值分解,获得所述样本矩阵Z的表达式如下:
根据二维度的样本矩阵Z和距离矩阵D画出输入样本X在二维空间的邻域图。
2.根据权利要求1所述的基于插值算法的虚拟样本生成方法,其特征在于,所述特征空间插值生成虚拟样本的步骤包括:
根据小样本数据的二维空间邻域图,取相邻节点的路径中点,生成二维空间虚拟样本,得到小样本在二维空间的坐标值;
构建小样本数据二维空间的坐标值到原始空间的真实值的极限学习机,根据构建的极限学习机获得所述原始空间的虚拟样本值Xvir;
获取I个不同样本(xi,yi),其中xi=[xi1,xi2,…,xin]T∈Rn;yi=[yi1,yi2,…,yim]T∈Rm,n为网络输入层节点个数,m为网络输出层节点个数,网络具有K个隐含层节点,极限学习机网络的输出的表达式如下:
其中,Wk=(wk1,wk2,…,wkn)T是连接第k个隐含层神经元和输入层神经元的权值,βk=(βk1,βk2,…,βkm)T是连接第k个隐含层神经元和输出层神经元的权值,bk是第k个隐含层神经元的阈值,Wk·xi表示Wk和xi的内积,g(·)为激活函数;
根据获得表达式如下:
根据上述I个等式获得表达式如下:
Hβ=Y (12)
其中,为隐含层输出矩阵,
随机确定输入权重和阈值,使用极小范数最小二乘解方法计算输出权重,表达式如下:
其中,H+为H的广义逆矩阵,y为实际输出;
获得训练好的网络模型,计算所述网络模型的输出,表达式如下:
将所述网络模型的输出反归一化,获得所述网络模型的输出值;
构建所述输入样本X到所述输出向量Y的极限学习机网络,输入所述虚拟样本值Xvir,所述网络模型的输出为虚拟样本输出值yvir。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京化工大学,未经北京化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011346109.2/1.html,转载请声明来源钻瓜专利网。