[发明专利]基于特征对的线性关系的数据分析方法有效

专利信息
申请号: 201710967812.7 申请日: 2017-10-18
公开(公告)号: CN107798217B 公开(公告)日: 2020-04-28
发明(设计)人: 林晓惠;张艳慧;王珏 申请(专利权)人: 大连理工大学
主分类号: G16B40/00 分类号: G16B40/00;G06K9/62
代理公司: 大连理工大学专利中心 21200 代理人: 温福雪;侯明远
地址: 116024 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于特征对的线性关系的数据分析方法,属于生物数据分析技术领域,一种从生物大数据中挖掘特征对之间有效的线性组合关系,并利用区分能力强的特征对的线性组合关系构建融合分类模型对生物样本进行分类的方法。本方法首先对每一对特征构造SVM分类模型的超平面,得到其线性组合关系;给出第一准则和第二准则评价每一对特征对线性组合关系的区分能力;选择区分能力最强的k≥1对组合关系构建融合分类模型。本发明的核心内容是通过SVM和成对分析挖掘隐藏在生物大数据中的重要信息,建立有效的分类模型,寻找疾病诊断的潜在生物标志物。
搜索关键词: 基于 特征 线性 关系 数据 分析 方法
【主权项】:
一种基于特征对的线性关系的数据分析方法,其特征在于,步骤如下:令F={f1,…,fp}表示特征集合,X={x1,x2,...,xn}表示样本集合,C={c1,c2}表示样本类标集合,Y={y1,…,yn}是n个样本的类标向量,其中,yt∈C,t∈{1,…,n};对于每一对特征fi和fj,1≤i≠j≤p,首先使用线性核函数在该特征对上构建SVM分类超平面αijfi+βijfj+γij=0,得到该特征对的线性组合关系;之后使用第一指标Δ和第二指标Γ,计算每对特征的线性组合关系的区分能力;特征对fi和fj的Δij和Γij计算方法如公式(1)‑(4)所示:Δij=|Pij(c1)‑Pij(c2)|  (1)Pij(cl)=P(αijfit+βijfjt+γij>0|yt=cl,t=1,2,..n),l=1,2---(2)]]>Γij=|uij(c1)‑uij(c2)|  (3)uij(cl)=Σyq=q(αijxti+βijxtj+γij)|{xt|yt=cl}|,t=1,2,..,n,l=1,2---(4)]]>其中:fit表示特征fi在样本xt上的取值;Pij(cl)表示类标为cl的样本中,特征对fi和fj的线性组合关系αijfi+βijfj+γij>0的频率;Δij表示两类样本的αijfi+βijfj+γij>0的频率差值的绝对值,取值范围是[0,1],Δij的值越大,表明该特征对的线性组合关系区分两类样本的能力越强;根据每一对特征的Δ值,对所有特征对进行降序排序;如果两对特征的第一指标Δ值相同,则采用第二指标Γ进一步比较两对特征的线性组合关系的区分能力;其中,为样本xt到直线αijfi+βijfj+γij=0的距离;根据排序结果,选择区分能力最高的、排序的前k≥1对特征,并利用简单多数投票方式构建融合分类器;对于所选特征对fi和fj,其对应的线性组合关系为αijfi+βijfj+γij,则基于特征对fi和fj的分类规则如下:其中,z为输入样本;LC‑k‑TSP方法流程如下:输入:训练数据集Data={(xt,yt),xt∈Rp,yt∈{c1,c2},t=1,2,...,n},特征集F={f1,f2,…,fp},选取的“特征对”数量为k;输出:选取的特征子集S,k对特征对的线性组合关系和融合分类器;开始:(1)初始化:特征子集S=Φ;F中所有特征标记为未选状态;(2)对于每一对特征对fi和fj,1≤i≠j≤p,使用线性核函数构造SVM分类器,得到该特征对的线性组合关系αijfi+βijfj+γij;(3)根据公式(1)‑(4)计算每对特征的第一指标Δ和第二指标Γ,并根据Δ和Γ对特征对进行降序排序,得到排序列表O;(4)从O上的第一对特征开始顺次考察每一对特征的状态,选择两特征状态均为未被选择的特征对fi和fj加入已选特征对集合S,输出该特征对的线性组合关系,并设置特征fi和fj的状态为已被选择;(5)重复(4),直至集合S中包含k对特征;(6)根据S中每一对特征的线性组合关系,构建一个分类器;对k个分类器采用简单多数投票的方式构建融合分类器。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710967812.7/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top