[发明专利]基于精准聚类的胃食管反流疾病危险因素提取方法及系统在审
| 申请号: | 201811589375.0 | 申请日: | 2018-12-25 |
| 公开(公告)号: | CN109685139A | 公开(公告)日: | 2019-04-26 |
| 发明(设计)人: | 刘万里;徐雷;黄玉珍;姚澜;李荣臻;夏吉安 | 申请(专利权)人: | 刘万里 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G16H50/20 |
| 代理公司: | 北京高沃律师事务所 11569 | 代理人: | 杜阳阳 |
| 地址: | 210000 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于精准聚类的胃食管反流疾病危险因素提取方法及系统。首先构建包含胃食管反流疾病危险因素的初始患者信息集;其次对初始患者信息集中的因素进行数据量化处理,得到量化数据矩阵;然后采用层次聚类算法对量化数据矩阵中的每个样本点进行聚类处理,得到层次聚类树状图;再者根据层次聚类树状图确定聚类数目,并将聚类数目与K‑Means聚类算法结合,对量化数据矩阵中的元素进行聚类,得到多个类簇;最后计算每个类簇中各个元素间的相关指数,并将相关指数最大的元素确定为胃食管反流疾病危险因素。本发明将两种聚类方法相结合,高效的筛选出引发胃食管反流疾病的危险因素,降低发病率。 | ||
| 搜索关键词: | 胃食管反流疾病 聚类 危险因素 矩阵 量化数据 层次聚类 患者信息 树状图 类簇 层次聚类算法 聚类处理 聚类算法 数据量化 样本点 构建 发病率 筛选 | ||
【主权项】:
1.一种基于精准聚类的胃食管反流疾病危险因素提取方法,其特征在于,所述方法包括:构建初始患者信息集;所述初始患者信息集为M行N列的数据集;所述初始患者信息集中的第i行第1列的因素为患者问卷ID号,且不同行中第1列的因素表示为不同的患者问卷ID号;所述初始患者信息集中的第1行第j列的因素为调查问卷的问题,且不同列中第1行的因素表示为不同的问题;所述初始患者信息集中的第i行第j列的因素为第i患者问卷ID号对第j问题的答案;其中,2≤i≤M,2≤j≤N;对所述初始患者信息集中的答案进行数据量化处理,得到量化数据矩阵;所述量化数据矩阵为M行N列的矩阵;所述量化数据矩阵中的第i行第1列的元素为患者问卷ID号,且不同行中第1列的元素表示为不同的患者问卷ID号;所述量化数据矩阵中的第1行第j列的元素为调查问卷的问题,且不同列中第1行的元素表示为不同的问题;所述量化数据矩阵中的第i行第j列的元素为第i患者问卷ID号第j问题答案的数据量化结果果;其中,2≤i≤M,2≤j≤N;采用层次聚类算法对所述量化数据矩阵中的每个样本点进行聚类处理,得到层次聚类树状图;第z个所述样本点代表所述量化数据矩阵中的第z行数据;所述样本点的个数与所述量化数据矩阵的列数相同,其中,2≤z≤M;根据所述层次聚类树状图确定聚类数目;根据所述聚类数目和K‑Means聚类算法,对所述量化数据矩阵中的元素进行聚类,得到多个类簇;计算每个所述类簇中各个元素间的相关指数,并将相关指数最大的元素确定为胃食管反流疾病危险因素;所述相关指数为相关系数平方的平均数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘万里,未经刘万里许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811589375.0/,转载请声明来源钻瓜专利网。





