[发明专利]一种基于类间混合决策树的健康信息处理方法在审

专利信息
申请号: 202310089089.2 申请日: 2023-02-09
公开(公告)号: CN116230207A 公开(公告)日: 2023-06-06
发明(设计)人: 陈松灿;李丹 申请(专利权)人: 南京航空航天大学
主分类号: G16H50/20 分类号: G16H50/20;G06F18/214;G06F18/2431;G06N20/20;G06N5/01
代理公司: 江苏圣典律师事务所 32237 代理人: 于瀚文
地址: 210016 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 混合 决策树 健康 信息处理 方法
【权利要求书】:

1.一种基于类间混合决策树的健康信息处理方法,包括以下步骤:

步骤1,获取包含用户身体数据的训练集X;

步骤2,基于训练集X建立目标函数,并得到最优解;

步骤3,将数据划分为不相交的分区,直到节点变纯或样本数小于预定义的阈值。

2.根据权利要求1所述的方法,其特征在于,步骤1中,将包含用户身体数据的训练集X记为:

其中xi=[xi1,xi2,...,xid]T是第i个用户样本,i=1,2,...,n,d是xi的特征维度,xid∈R表示第i个用户的第d个特征值,yi∈{-1,+1}是第i个用户样本的标签,yi取值为-1时表示第i个用户患病,yi取值为1时表示第i个用户健康;x'∈U是一个Universum样本,U表示Universum集。

3.根据权利要求2所述的方法,其特征在于,步骤2包括:

步骤2-1,最小化两个用户样本x1,x2间的马氏距离dA(x1,x2)=(x1-x2)TA(x1-x2)等价于最大化其中A是一个d×d实对称正定矩阵;

最大化两类中心的马氏距离dA(m1,m2)等价于最小化其中m1和m2分别代表患病数据的类中心和健康数据的类中心,每个内部节点t的分裂准则对应的目标函数minA>0f(A)表示为:

minA>0f(A)=tr(A(Sw+Su))+tr(A-1Sb)    (2)

其中tr表示矩阵的迹,A>0表示A是一个正定矩阵;

Sb,Sw和Su分别定义为类间协方差矩阵、类内协方差矩阵和Universum类内协方差矩阵;

步骤2-2,目标是获得一个对角矩阵A=diag(w1,...,wj,...,wd),它的第j个对角元素wj表示候选特征j的判别性权重,特征j表示用户的第j个体征,取值为1~d,diag表示对角矩阵,在对角化度量矩阵约束下优化公式(2),得到f(w1,...,wj,...,wd);

步骤2-3,当f(A)的导数为零时,获得全局最优解,f(A)对wj求导;

步骤2-4,获得最优解。

4.根据权利要求3所述的方法,其特征在于,步骤2-1中,所述类间协方差矩阵Sb、类内协方差矩阵Sw和Universum类内协方差矩阵Su如下所示:

Sb=(m1-m2)(m1-m2)T

其中c是类序号,mc是类别C的中心,m1和m2分别表示患病数据的类中心和健康数据的类中心,xi'和mu'分别表示Universum样本及其类中心,上标T表示矩阵转置。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310089089.2/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top