[发明专利]一种基于深度神经网络的I型糖尿病风险评估系统在审
申请号: | 202110654175.4 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113393896A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 马玉昆;贾寒;黎松;孙琼琳;温颜华;韩仕伟;李伟华 | 申请(专利权)人: | 成都果壳医学科技有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/30;G16B20/50;G16B5/00;G06N3/08;G06N3/04 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 赵悦 |
地址: | 610200 四川省成都市成都高新*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 神经网络 糖尿病 风险 评估 系统 | ||
本发明属于指纹比对技术领域,涉及一种基于深度神经网络的I型糖尿病风险评估系统,包括:数据输入模块、位点获取模块、位点筛选模块、模型训练模块和模型检验模块;数据输入模块,用于输入或采集样本数据;位点获取模块,用于获取样本数据的全基因组位点的基因型信息;位点筛选模块,用于对基因型信息进行GWAS统计,对GWAS统计结果进行质量控制,并根据质量控制后的分析结果对位点进行筛选;模型训练模块,用于根据筛选后的位点对神经网络模型进行训练,以获得最优模型;模型检验模块,用于对最优模型进行检验。其在不增加任何实验成本的情况下,尽早地、大规模地实现高遗传风险患者的筛查,成本低、准确性高、操作简单方便。
技术领域
本发明涉及一种基于深度神经网络的I型糖尿病风险评估系统,属于生物检测技术领域,特别涉及疾病风险评估技术领域。
背景技术
I型糖尿病是一种自身免疫性疾病,其本质是因免疫系统特异性地攻击并摧毁自身胰岛β细胞,导致患者丧失胰岛功能,最终发展为I型糖尿病病人,I型糖尿病的常见风险因素有:家族史、遗传因素、年龄等。相比较于II型糖尿病患者,I型糖尿病发病年龄更小,受遗传因素影响更大,因此通过检测遗传基因尽早判别个体I型糖尿病的风险是意义重大的。
随着全基因组关联分析(GWAS)的发展和深入,越来越多复杂疾病/性状的遗传结构得到解析,也系统性地建立起了单核苷酸多态(SNP)与这些复杂性状之间的关联,疾病的遗传度也进一步得到解释。全基因组基因检测技术的同步发展和检测价格持续下降,也为大规模的人群筛查提供了便利条件。在研究日益精细且数据量逐渐增大的趋势下如何能够基于遗传信息进行疾病风险分级,人工智能技术的兴起为这种需求的落地提供了可能。
人工智能主要通过输入高质量的标注后的数据,经过AI系统多层次的训练,最终输出分类结果,用于新场景的预测。目前,最为常用的人工智能技术包括深度学习技术(deep learning),其核心算法为卷积神经网络(Convolutional Neural Networks,CNN)和循环神经网络(Recurrent Neural Networks,RNN)。但现有技术中将AI系统用于疾病风险预测的方法中,往往存在样品量小,以致预测结果与实际结果存在较大差异,且传统的疾病预测方法需要患者已经表现出一定的疾病迹象时,才能够对其疾病风险进行预测,导致疾病发现较晚,错过最佳防治时期;此外,还有一些疾病预测方法需要人工对学习的特征进行选定,这就导致学习结果高度依赖于特征选取水平,而且不同的特征选取方法可能会导致不同的结果。
发明内容
针对上述问题,本发明的目的是提供了基于深度神经网络的I型糖尿病风险评估系统,旨在不增加任何实验成本的情况下,尽早地、大规模地实现高遗传风险患者的筛查,成本低、准确性高、操作简单方便。
为实现上述目的,本发明采取以下技术方案:一种基于深度神经网络的I型糖尿病风险评估系统,包括:数据输入模块、位点获取模块、位点筛选模块、模型训练模块和模型检验模块;数据输入模块,用于输入或采集样本数据;位点获取模块,用于获取样本数据的全基因组位点的基因型信息;位点筛选模块,用于对基因型信息进行GWAS统计,对GWAS统计结果进行质量控制,并根据质量控制后的分析结果对位点进行筛选;模型训练模块,用于根据筛选后的位点对神经网络模型进行训练,以获得最优模型;模型检验模块,用于对最优模型进行检验。
进一步,数据输入模块的样本数据包括患有糖尿病的样本数据和对照样本数据,将样本数据拆分为训练集和检验集,训练集和检验集中均包括患有糖尿病的样本数据和对照样本数据,且训练集和检验集不存在样本数据重叠。
进一步,位点获取模块中采用芯片检测技术获取全基因组位点的基因型信息,芯片检测技术中通过多个芯片平台进行基因型信息的检测。
进一步,位点筛选模块中GWAS统计结果至少包括以下内容:染色体号、物理位置、突变位点ID、参考等位、效应等位、效应等位基因频率、对疾病的效应值、效应值标准差、与疾病关联的显著性P值、样本量大小和种族信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都果壳医学科技有限公司,未经成都果壳医学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110654175.4/2.html,转载请声明来源钻瓜专利网。