[发明专利]一种基于二分类的双峰发射线数据搜寻方法有效
申请号: | 201910612231.0 | 申请日: | 2019-07-08 |
公开(公告)号: | CN110334659B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 屈彩霞;杨海峰;蔡江辉;张继福;赵旭俊 | 申请(专利权)人: | 太原科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 太原高欣科创专利代理事务所(普通合伙) 14109 | 代理人: | 崔雪花;冷锦超 |
地址: | 030024 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分类 双峰 射线 数据 搜寻 方法 | ||
本发明公开了一种基于二分类的双峰发射线搜寻方法,首先利用相关子空间方法对双峰发射线数据做出特征提取,通过不同大小数据集,取不同参数时对相关子空间的个数和特征线分析,得出相关子空间的多条特征线;其次,根据相关子空间的特征线之间不同强弱的关联性,利用频繁模式挖掘和粗糙集理论将相关子空间分类;然后,利用支持向量机的方法对选出的训练集进行训练,从而构造出双峰发射线数据的分类模型;本发明的方法对于双峰发射线数据的搜寻具有可行性和有效性;在正样本比例极小的情况下,与其它方法相比,该方法可以将正样本的特征有效学习,从而构造出可用于双峰发射线数据分类的模型。
技术领域
本发明属于数据处理技术领域,具体为一种数据搜索的方法,尤其涉及一种基于二分类的双峰发射线数据搜寻方法。
背景技术
在高维海量的大数据背景下,传统的数据挖掘方法已经不能满足当前的数据需求。对数据所有属性进行处理的方法大大降低了计算效率,提高计算成本,维度灾难一直是高维数据中亟需解决的问题。并不是所有的属性都能够投入计算,我们需要利用有效的方法提取出有意义的属性,在这些提取出的属性上对数据进行处理降低了数据维度,同时也提高了数据处理方法的效率。
双峰发射线数据在天体光谱中所占比例极小,针对这种正负样本极不平衡的数据,有一些新的方法来挖掘其中的稀有数据,例如模式识别,离群点检测,分类等。这些方法在越来越广泛的领域中有更好的优势和性能,但是对于天文学特定背景的光谱数据集,由于各种独特的数据特征,到目前为止还没有很好的处理方法。因此考虑这些特性,针对特殊数据开发有效方法将具有重要意义,双峰发射线搜索方法可以归类为二进制分类问题,SVM(支持向量机)是一种用于小样本和高维度样本的有用的监督学习方法。在正样本和负样本的比例极不平衡的条件下,由小样本训练的支持向量可以特别用作从大数据集中搜索稀有对象的阈值。
在对双峰发射线数据进行研究的过程中,存在以下问题:1.双峰发射线特征多样性,该特征的位置不确定,特征轮廓多变,导致对该特征的描述难度加大;2.数据质量较低,具有双峰发射线的数据均来自河外天体的观测,其中有较多噪声和其他因素的干扰;3.当前的针对双峰发射线数据的研究,没有形成很好的识别模型。
发明内容
本发明克服现有技术存在的不足,提供一种基于二分类的双峰发射线数据搜寻方法,目的是降低算法的时间复杂度,提高搜寻双峰发射线数据的准确率、召回率和约减率。
本发明是通过如下技术方案实现的。
一种基于二分类的双峰发射线数据搜寻方法,其特征在于,包括以下三个阶段:利用相关子空间方法进行特征提取;对特征子空间做出分类;对每一类相关子空间上的数据进行二分类处理;具体包括以下步骤。
第一阶段:利用相关子空间方法进行特征提取。
在该阶段,目的是在所有的属性维度中提取出有意义的属性作为之后研究的属性。相关子空间方法能够从一批属性中发现与双峰发射线特征相关的属性,从而将这些属性归为特征子空间中。具体的步骤如下:
a)数据预处理:将现有已证认的双峰发射线数据作为相关子空间方法的预备数据集;对数据进行归一化处理,去红移得到训练数据集,截取数据中波长为和之间的数据作为相关子空间中的最终训练数据。
b)利用相关子空间方法进行特征提取:计算每个维度属性上,每条数据的局部数据集LDS(O,Fi);O为训练集中的数据,Fi为训练集中的第i维属性;利用KNN计算局部数据集、在每个属性维度上,计算每条数据的局部稀疏因子以及局部稀疏差异因子。
c)得到相关子空间RS并确定相关子空间个数和相关子空间的特征线。
d)对相关子空间做出特征描述:通过特征线的波长覆盖范围Wave、红蓝移之差RBS、线强比LSR三个特性来对特征线做具体描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原科技大学,未经太原科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910612231.0/2.html,转载请声明来源钻瓜专利网。