[发明专利]一种基于自学习的方式建立纤维种类图谱库的方法有效
申请号: | 201811297788.1 | 申请日: | 2018-11-01 |
公开(公告)号: | CN109460471B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 黄激青;范礼阳;薛文韬;蒋红涛 | 申请(专利权)人: | 信融源大数据科技(北京)有限公司;特思豪(北京)科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100027 北京市朝阳区朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自学习 方式 建立 纤维 种类 图谱 方法 | ||
1.一种基于自学习方法建立纤维种类图谱库的方法,其特征是,采用稀疏自编码神经网络模型,针对采用同类型的检测设备得到的同类型的纤维图谱进行特征学习,得到纤维特征图谱,由此建立纤维种类图谱库;包括如下步骤:
1)采用稀疏线性神经网络模型作为深度学习图谱分类识别的编码模型;
2)针对样本纤维图谱x,采用编码模型提取x的纤维特征,并经Softmax分类器初步确定纤维的分类;具体将样本纤维图谱x输入到编码模型中,提取纤维特征向量,记为X;X表示输入的纤维图谱的二维特征向量;D为标准化基础矩阵,简称为基,用于表示纤维图谱中的波形;X由D中元素d及其线性系数α组合而成,表示为式1:
式1中,d1~dp分别表示基中的元素;α1~αp分别表示对应于di的权数;
3)如果编码模型的输出表明样本纤维图谱是一已知分类,则得到输出结果,结束操作;
4)如果编码模型的输出表明样本图谱是一未知分类,则将其归为编码模型的未知分类;
5)对该未知分类进一步细分,把含有相同关键字的图谱样本归为同一待定分类数据集;当一待定分类数据集中图谱的数据量达到预先设定阈值y后,确定一个新的纤维种类,采用该关键字命名纤维种类;具体执行如下操作:
51)随机从一待定分类集中取少量样本图谱,作为初始比对样本;对少量样本的样本图谱执行操作52)~55)进行预训练,得到此待定分类的初始化特征向量;之后继续步骤56);
52)随机从y张图谱中挑选N张图谱,y和N均为预设定值;
53)对N张图谱中的每张图谱,按照e*e的尺寸切割成小图片,作为掩模;e为常数,为预设值;
54)从掩模中随机挑选一系列样本图片,表示为[x1 x2 …];将图谱使用灰度均衡法对样本图片进行预处理,然后对像素信息进行归一化,通过受限玻尔兹曼机RBM学习机制得到一组初始化基[d1 d2 …];
55)确定目标优化函数,进行预训练得到样本的基D;
56)进行稀疏编码,得到稀疏向量,即线性系数α;
给定一个新的图谱z,利用训练得到的基D,重复步骤53)~55),得到一个稀疏向量α,即线性系数,为输入的图谱z的特征向量Z在神经网络中的参数,记为Hw,v(z);w表示模型参数中的特征向量的权重,v表示权重衰减项;
57)固定参数Hw,v(z),作为训练完成后的模型参数;用于计算相似度;
58)对编码模型的Softmax分类器进一步训练,得到优化的回归模型;更新Hw,v(z),得到新的编码模型;新的编码模型即含有新的纤维分类;
通过上述步骤,对编码模型通过调节稀疏系数/向量求解优化值,建立得到纤维种类的图谱库。
2.如权利要求1所述基于自学习方法建立纤维种类图谱库的方法,其特征是,同类型的检测设备包括近红外光谱仪、红外光谱仪或拉曼光谱仪;同类型的纤维图谱图包括红外光谱图、热重图谱或拉曼光谱图。
3.如权利要求1所述基于自学习方法建立纤维种类图谱库的方法,其特征是,步骤52)预设定值y和N取值为大于200;和/或,步骤53)中,预设定值e取值为8。
4.如权利要求1所述基于自学习方法建立纤维种类图谱库的方法,其特征是,步骤55)具体通过以下过程得到样本的特征向量的基D:
551)使用稀疏编码模型,通过系数α稀疏;在目标优化函数使用L1范数约束,目标优化函数为损失函数,表示为式3:
其中,α为稀疏系数/线性系数;αij是α中的元素;m为训练数据集中样本的个数;k为已知分类的个数;λ为常数;
552)通过训练样本,使得目标函数最小;训练过程为多次迭代,每次迭代均包括操作:固定样本基di,调整αi,使得上式目标函数最小;固定αi,调整di,使得上式目标函数最小;
553)通过多次迭代训练,得到样本的特征向量的基D。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于信融源大数据科技(北京)有限公司;特思豪(北京)科技有限公司,未经信融源大数据科技(北京)有限公司;特思豪(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811297788.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于会话的视频分类方法
- 下一篇:文本分类方法和装置、及电子设备