[发明专利]一种基于光谱的转基因稻谷智能分类器在审
申请号: | 201710179385.6 | 申请日: | 2017-03-23 |
公开(公告)号: | CN106918570A | 公开(公告)日: | 2017-07-04 |
发明(设计)人: | 许德刚;廉飞宇;郭娟;付麦霞;葛宏义;蒋玉英 | 申请(专利权)人: | 河南工业大学 |
主分类号: | G01N21/3586 | 分类号: | G01N21/3586;G06K9/62 |
代理公司: | 郑州科维专利代理有限公司41102 | 代理人: | 赵继福 |
地址: | 450001 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 光谱 转基因 稻谷 智能 分类 | ||
1.一种基于光谱的转基因稻谷智能分类器,其特征在于,包括以下步骤:
1)、标样和样品制备方案:
2)、标样和样品的太赫兹时域光谱数据的获取:
3)、分类器的设计;
3.1)、利用主成分分析法压缩原始数据空间维度:
3.2)、支持向量机分类模型的设计:
3.3)、支持向量机分类模型的参数优化。
2.根据权利要求1所述的一种基于光谱的转基因稻谷智能分类器,其特征在于:所述的步骤1)、标样和样品制备方案,标样用于建立各品系稻谷(包括转基因和非转基因的)的太赫兹标准光谱数据集,用于作为分类器的训练集;样品用于对转基因稻谷分类器的测试,用于作为测试集;制作标样的原材料来源于各稻谷品系的标准物质,标准物质从国家粮食局科学研究院购买,并具有标准物质证书;标准物质原材料在充分粉碎、研磨后,取120mg,加入40mg聚乙烯粉末,经均质器充分混合后,放置压片机进行压片;压片时保持压力10MPa三分钟,取出压片,用电子螺旋测微器测量厚度(精确到0.01mm)后,放置密封袋封好,密封袋贴标签注明品系名称和厚度,至此,标样制作完毕;样品制作过程同标样制作过程;标样或样品需在半小时内测试完毕,以避免标样放置在空气中发生的理化变化;标样或样品原材料在使用前保持水分含量在12%-15%左右,若水分过高,会影响样品对太赫兹辐射的吸收,因此需要使用烘干机进行烘干后再进行制样;12%-15%的水分参数确定来源于粮食安全储藏相关国家标准。
3.根据权利要求1所述的一种基于光谱的转基因稻谷智能分类器,其特征在于:所述的步骤2)、标样和样品的太赫兹时域光谱数据的获取,具体为:将标样放置于太赫兹时域光谱仪中,采用透射方式获取标样的太赫兹时域光谱数据;检测的环境条件设置为:环境温度:20℃,环境湿度:≤10%,每种稻谷品系制作30个标样,每个标样测量3次,取0.2T-1.2T波段作为有效数据进行平均,得到每个标样3次平均的时域光谱数据,再利用光谱仪本身的随机软件,获取该标样的太赫兹吸收谱数据,总共获取每种稻谷品系的30组原始吸收谱数据,作为主成分分析法的输入数据,经主成分分析法压缩数据空间后,由主成分分析法得到的该组数据的输出数据,作为支持向量机分类器的训练集;取30个稻谷样品,采用上述太赫兹测试方案,获取30组原始吸收谱数据,在经过主成分分析法的处理,获取主成分分析的输出数据集,作为支持向量机分类器的测试集。
4.根据权利要求1所述的一种基于光谱的转基因稻谷智能分类器,其特征在于:所述的步骤3.1)、利用主成分分析法压缩原始数据空间维度,具体为:取每个样本的0.2T-1.2T之间的256个光谱数据作为原始数据进行压缩;采用PCA算法抽取了原始太赫兹光谱数据的最有代表性的前四个特征向量,这四个特征向量的累计信息贡献率应达到不低于90%,覆盖原始数据绝大部分的信息;如果抽取的四个主成分的累计信息贡献率低于90%,则应采用更多的主成分,使所有主成分的累计贡献率达到不低于90%;实验证明,提取出的前四个主成分,累计信息贡献率已经达到995.2%,因此本专利发明建议采用PCA抽取的前4个主成分代替原始数据,这可使得原始数据从最初的256维降低至4维,大大简化了支持向量机模型的设计和模型的运算效率;利用PCA提取主成分的算法可通过matlab实现。
5.根据权利要求1所述的一种基于光谱的转基因稻谷智能分类器,其特征在于:所述的步骤3.2)、支持向量机分类模型的设计,具体为:用PCA对每个标样的数据进行前四个主成分的提取构成训练集,对每个实际样品的数据进行前四个主成分的提取构成测试集;利用训练集构造SVM分类器,核函数选择径向基函数,利用测试集对SVM分类器的分类性能进行测试;利用径向基核函数构造SVM分类器的算法可通过matlab实现。
6.根据权利要求1所述的一种基于光谱的转基因稻谷智能分类器,其特征在于:所述的步骤3.3)、支持向量机分类模型的参数优化,具体为:在支持向量机模型中,有两个重要的参数影响支持向量机的分类性能;一个是C参数,称为惩罚系数,表示对误差的宽容度,C值越高,表示越不能容忍出现误差,另一个是与径向基函数有关的y参数,它隐含地决定了数据映射到新的特征空间后的分布;支持向量机分类模型的建立过程实际上就是对这两个参数的寻优过程;
首先对γ参数进行寻优,设置不同的y参数值(本技术发明建议γ从0到5设置,间隔为0.5),再通过网格搜索法,确定对应的C值,构建不同的SVM分类模型,SVM分类模型的性能评估采用下面的指标(称为均方根误差):
式中N″代表测试集中的样本数,Yi是测试集中第i个样本的实际值,是模型对第i个样本的预测值;利用测试集中的数据,对构建的每个SVM模型进行RMSE计算,选取RMSE值最小的模型作为最终的分类器模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南工业大学,未经河南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710179385.6/1.html,转载请声明来源钻瓜专利网。