[发明专利]高阶SNP致病组合数据检测方法、系统、计算机设备在审
申请号: | 202011121291.1 | 申请日: | 2020-10-19 |
公开(公告)号: | CN112270957A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 拓守恒;李超;刘凡 | 申请(专利权)人: | 西安邮电大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B20/30 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 黄伟洪 |
地址: | 710061 陕西省西安*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | snp 致病 组合 数据 检测 方法 系统 计算机 设备 | ||
本发明属于致病SNP组合数据检测技术领域,公开了一种高阶SNP致病组合数据检测方法、系统、计算机设备,利用Plink从VCF文件中读取出PED,MAP格式数据,整理成SNP样本矩阵;根据数据中SNP位点和样本量的大小,设置搜索算法参数;将SNP样本数据读入,进行高阶SNP致病组合位点筛选,将和声搜索策略的全局搜索能力与差分演化算法的快速计算能力进行融合;进行迭代搜索;迭代过程结束后,合并4个独立种群中的个体;采用改进的G‑test统计检验方法进行样本的差异显著性检验;通过G‑test检验的SNP组合被认为是可能的高阶SNP致病组合。本发明有效地降低了对致病模型的偏好性。
技术领域
本发明属于致病SNP组合数据检测技术领域,尤其涉及一种高阶SNP致病组合数据检测方法、系统、计算机设备。
背景技术
目前:差分演化算法是一种智能搜索方法,基于群体的启发式优化算法,对优化目标的特征没有限定性条件,并且具有很强的全局搜索能力。对于如下优化模型:maximum f(X);其中,f(X)表示目标函数,旨在寻找一组X,使得目标函数值最大。差分演化的主要思想是:
(1)在搜索空间中随机初始化种群(包含多个待优化个体):
X1,X2,...,XNP(NP表示种群中个体的数量)。计算每个个体的适应值(关联强度):f(X1),f(X2),...,f(XNP);
(2)对每个个体进行变异,如对个体X1进行差分变异:
V1=Xr1+F(Xr2-Xr3);
(3)然后进行交叉操作:i=1,2,…,k.(k 表示X的维度);
(4)计算新个体U1的适应值;
(5)选择操作:如果f(X1)<f(U1),则用新个体U1替换种群的X1;
(6)重复(2)-(5),直到满足结束条件(如最大迭代次数)。当算法结束时,种群当中适应值最大的个体就是最优解。
高阶SNP致病组合位点:单核苷酸多态性(Single Nucleotide Polymorphism,SNP)是指在基因组水平上单个碱基位点变异引起的多态性,可能是单个碱基的转换(transition)或颠换(transversion),也可能是由于碱基的插入或缺失所致。在序列1中的一个碱基对C-G在序列2中表现为A-T,该位点就被称为1个SNP 位点。在人类全基因组上,这样的SNP位点超过300万个,通常情况下,绝大部分SNP不会给人类的健康带来威胁,但是,有些SNP变异位点与人类的健康密切关联。高阶SNP致病组合位点是指多个SNP共同作用于某一复杂疾病,如果某个人的基因组序列中这几个位点同时出现了SNP变异,得病的概率会明显升高,称这样的SNP组合为高阶SNP致病组合。
现有技术通过单个SNP与疾病状态进行相关性分析,已经发现了很多易感基因,然而,其解释性并不是很好。“高阶SNP组合是可能形成复杂疾病的重要原因”已经在生物医学界得到广泛认可,但是,由于高阶SNP组合的数量极大,在进行高阶SNP致病组合探测时,受“组合爆炸”问题的影响,现有计算机难以检测所有可能的SNP组合,成为现有技术遇到的重大挑战。另外,正确判断高阶SNP组合是否与疾病状态具有关联性也是一个重要且复杂的研究课题,现有方法往往存在对致病模型的偏好性,难以适用于所有致病组合的判断。
目前,针对致病SNP的检测方法,从搜索的角度可以分为以下几种:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011121291.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置