[发明专利]一种糖尿病关键特征参数获取方法在审
| 申请号: | 202210177424.X | 申请日: | 2022-02-24 |
| 公开(公告)号: | CN114822835A | 公开(公告)日: | 2022-07-29 |
| 发明(设计)人: | 陈波;高秀娥;胡建刚;陈世峰;桑海涛;蒋潘玲 | 申请(专利权)人: | 岭南师范学院;岭南师院(湛江)教育服务有限公司 |
| 主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/20 |
| 代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 盖小静 |
| 地址: | 524048 广东省湛江市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 糖尿病 关键 特征 参数 获取 方法 | ||
1.一种糖尿病关键特征参数获取方法,其特征在于,包括:
对糖尿病相关原始数据进行代数组合并且进行标准化处理,得到糖尿病危险因素候选特征集;
通过RReliefF算法筛选与糖尿病相关的特征,构造最大相关性特征集;
通过mRMR算法剔除与糖尿病无关的冗余特征,构造最大相关最小冗余特征集;
采用改进FCL因果发现方法进行因果替换,获取糖尿病关键特征集。
2.根据权利要求1所述一种糖尿病关键特征参数获取方法,其特征在于,还包括:将所述糖尿病关键特征集输入至糖尿病预测模型,利用随机森林训练所述模型,得到预测精度,验证糖尿病关键特征集有效性。
3.根据权利要求1所述一种糖尿病关键特征参数获取方法,其特征在于,对糖尿病相关原始数据进行代数组合并且进行标准化处理,得到危险因素候选特征集,具体为:
在现有糖尿病危险因素基础上,对糖尿病相关原始数据进行代数组合,并将组合后的数据进行Z-score标准化处理,如式(1)所示,作为糖尿病危险因素候选特征集:
4.根据权利要求1所述一种糖尿病关键特征参数获取方法,其特征在于,通过RReliefF算法筛选与糖尿病相关的特征,构造最大相关性特征集,具体为:将糖尿病相关特征赋予权重作为评价值,依据所述评价值筛选与目标类别最大相关的特征集;
所述糖尿病相关特征的权重W[A]获取方式如下:
其中,NdC表示在不同预测值条件下的权重,NdA[A]表示在不同特征条件下的权重,NdCdA[A]表示在不同预测值、不同特征条件下的权重集。
5.根据权利要求1所述一种糖尿病关键特征参数获取方法,其特征在于,通过mRMR算法剔除与糖尿病无关的冗余特征,构造最大相关最小冗余特征集,具体为:
假设,两个随机变量(x,y),概率密度函数分别为p(x)和p(y),联合概率密度函数为p(x,y),则x与y的互信息:
最大相关度D表示为:
其中,I(xi;c)为糖尿病特征参数xi与目标类别c之间的互信息;
最小冗余度R表示为:
其中,I(xi;xj)为糖尿病特征参数xi与糖尿病特征参数xj之间的互信息。
结合所述I(xi;c)、I(xi;xj)2个互信息,得到差准则最优算法为:
通过所述最优算法,得到最大相关、最小冗余的一组糖尿病特征参数。
6.根据权利要求1所述一种糖尿病关键特征参数获取方法,其特征在于,采用改进FCL因果发现方法进行因果替换,获取糖尿病关键特征集,具体为:
假设,G为子集X={X1,X2,…,Xn}上的因果结构,其中1≤i≤n≤N;设G满足因果马尔可夫假设、因果忠诚性假设,其联合分布P(X)表示为:
给定糖尿病危险因素观察数据其中为n维向量,即1≤j≤m;令表示为包含的观测值,根据P(X)和G,糖尿病危险因素观察数据的对数似然度为:
7.根据权利要求6所述一种糖尿病关键特征参数获取方法,其特征在于,采用加性噪声模型作为因果关系生成机制,Fi是Xi的因果函数,有:
由式(8)和(9)得,糖尿病危险因素观察数据的对数似然度等于观察数据的噪声似然度,则观察数据的噪声似然度为:
式(10)为转换后的目标函数,其中S=G,F为观测噪声的因果结构;加入贝叶斯信息准则和调整阈值后,得到改进FCL算法模型:
式中,di为估计Xi采用的系数;
利用所述改进FCL算法模型,获取不同糖尿病特征参数的因果关系,采用果变量替代因变量的因果替代准则,得到糖尿病关键特征集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于岭南师范学院;岭南师院(湛江)教育服务有限公司,未经岭南师范学院;岭南师院(湛江)教育服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210177424.X/1.html,转载请声明来源钻瓜专利网。





