[发明专利]2型糖尿病发病危险因素对血糖影响的定量分析方法有效
申请号: | 201310074038.9 | 申请日: | 2013-03-08 |
公开(公告)号: | CN103198211B | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | 罗森林;陈松景;潘丽敏;韩龙飞;张铁梅 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及2型糖尿病发病危险因素对血糖影响的定量分析方法,属于生物信息处理及医学领域。本发明首先使用C4.5和EM聚类算法实现重要发病危险因素的选择;再根据性别和年龄对全体人群进行划分,进而利用BP神经网络算法对细化人群进行敏感度计算,最终通过敏感度实现多因素对血糖影响的定量分析。与现有大量统计学方法相比,本发明采用数据挖掘方法,在充分考虑多因素之间相互影响的同时,在细化人群中实现多因素对血糖影响的定量分析,大大提高了定量分析的准确率,并可为个体发病的细化干预提供判定方法。本发明可对个体2型糖尿病发病进行干预指导,不仅可以预防或延缓发病,而且该方法可应用推广到其它疾病危险因素的定量分析。 | ||
搜索关键词: | 糖尿病 发病 危险 因素 血糖 影响 定量分析 方法 | ||
【主权项】:
2型糖尿病发病危险因素对血糖影响的定量分析方法,其特征在于,所述方法包括以下步骤:步骤1,对2001‑2008年实测体检数据,进行数据清理,填充空缺值、识别孤立点、消除噪声并纠正数据中的不一致;再进行数据变换,包括数据格式转换、数据语义转换;最后在保证信息不丢失的情况下,通过数据归约删除重复因素和空缺值较多的因素,形成未患有2型糖尿病的全国抽样人群体检数据源S;步骤2,对数据源S采用EM聚类算法进行危险因素的粗选,然后采用融合EM聚类和C4.5算法的危险因素精选方法,筛选引起2型糖尿病的主要危险因素;步骤3,根据性别和年龄,对经步骤1得到的全国抽样人群体检数据源S进行划分,基于步骤2获得危险因素对9组细化人群分别训练BP神经网络模型,基于BP神经网络权重,采用一种多因素综合作用下的敏感度计算方法,计算出不同危险因素对血糖影响的敏感度,进而实现定量分析;其中,所述多因素综合作用下的敏感度计算方法为:设有n‑L‑1前向网络,式中n为BP神经网络模型输入变量的个数,L为BP神经网络模型的隐含层数目,1为模型输出变量的个数,网络输出有如下形式:y=f(x1,…,xn),式中x为BP神经网络模型的输入,y为BP神经网络模型的输出,通过对该式求二阶偏导来考察输入变量对输出变量的敏感度,设神经网络的隐层激活函数为对数S型函数f(x)=11+e-x]]>通过雅克比矩阵dydxT=(∂y∂x)m×n]]>式中:T为矩阵的转置运算,m为所用数据源的样本数目,n为输入变量的个数,把第j个输入xj变化与第j个输出yj=f(xj)改变联系起来意味着网络输出的敏感度依赖于输入的微小扰动,对于n个输入、具有L个神经元的隐含层和一个输出层的神经网络,第t个样本上输入变量xi和xk对输出变量y的敏感度为Sikt=S2Σj=1Lwijvj1Ijt(1-Ijt)Σj=1Lwkjvj1Ijt(1-Ijt)+S1Σj=1Lwijwkjvj1Ijt(1-Ijt)(1-2Ijt)]]>式中:S1为输出层激活函数对其输入的一阶导数,S2为输出层激活函数对其输入的二阶导数,为第t个样本上第j个隐层神经元的响应,vj1为输出神经元和第j个隐层神经元间的权重,wij为第i个输入神经元和第j个隐层神经元间的权重,wkj为第k个输入神经元和第j个隐层神经元间的权重。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310074038.9/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用