[发明专利]高阶SNP致病组合数据检测方法、系统、计算机设备在审
申请号: | 202011121291.1 | 申请日: | 2020-10-19 |
公开(公告)号: | CN112270957A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 拓守恒;李超;刘凡 | 申请(专利权)人: | 西安邮电大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B20/30 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 黄伟洪 |
地址: | 710061 陕西省西安*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | snp 致病 组合 数据 检测 方法 系统 计算机 设备 | ||
1.一种高阶SNP致病组合数据检测方法,其特征在于,所述高阶SNP致病组合数据检测方法包括:
数据预处理,利用Plink从VCF文件中读取出PED,MAP格式数据,整理成样本矩阵;
算法参数设置,根据数据中SNP位点和样本量的大小,设置搜索算法参数;
数据读取,将SNP样本数据读入,开始准备第一阶段搜索;
利用混合差分演化算法进行高阶SNP致病组合位点筛选,将和声搜索策略与差分演化算法相结合,旨在有效增强算法的全局搜索能力;该算法中,采用了四个独立的种群,并使用了四个具有互补性的关联性评价函数进行SNP组合的关联性评价;
开始进行优化迭代,直到达到最大迭代次数,算法终止;
迭代过程结束后,合并4个种群的个体,作为第一阶段的筛选结果;
采用改进的G-test统计检验方法进行差异显著性检验,进一步去除不显著的SNP组合;
通过G-test检验的SNP组合被认为是可能的高阶SNP致病组合。
2.如权利要求1所述的高阶SNP致病组合数据检测方法,其特征在于,所述高阶SNP致病组合数据检测方法的算法参数设置有最大进化代数MaxT,种群大小,交叉概率CR,缩放因子F,和声记忆库选择概率HMCR。
3.如权利要求1所述的高阶SNP致病组合数据检测方法,其特征在于,所述高阶SNP致病组合数据检测方法利用混合差分演化算法进行高阶SNP致病组合位点筛选包括:将和声搜索策略与差分演化算法相融合,随机初始化4个大小相同的种群,对其中每个个体,采用四个新型的且互补的关联性评价函数进行关联强度评价,评价函数的定义如下:
(1)互熵:ME(X)=H(X)+H(y)-H([X,y]);ni表示该SNP组合的样本中,第i个基因型的数量,n表示所有样本的总数量;
(2)贝叶斯网络:其中,I表示该SNP组合中基因型的数量,J表示疾病状态的数量;ni表示第i个基因型的总数量,nij表示第i个基因型在具有疾病j的样本数量;
(3)正则化联合熵:
表示第i个基因型在正常样本中的数量,表示第i个基因型在疾病样本中的数量;和分别表示X中第j个SNP的第S个基因型在正常样本和疾病样本中的数量;
(4)卡方值的倒数:Oi表示第i个基因型的样本数量,Ei表示第i个基因型的期望数量,采用卡方值而不是卡方检验P-Value,是因为卡方值能够更好地比较解得优劣性,而P-value在样本量较少时,很容易产生假阳性错误。
4.如权利要求3所述的高阶SNP致病组合数据检测方法,其特征在于,所述高阶SNP致病组合数据检测方法采用四个关联性评价函数:互熵,贝叶斯网络,正则化联合熵和卡方值;四个关联性评价函数的值越大表示SNP组合X与疾病状态的关联强度越强。
5.如权利要求1所述的高阶SNP致病组合数据检测方法,其特征在于,所述高阶SNP致病组合数据检测方法采用混合的差分演化搜索策略,该搜索策略采用将两个群体智能优化算法和声搜索与差分演化相结合,增强算法的全局搜索能力。
6.如权利要求1所述的高阶SNP致病组合数据检测方法,其特征在于,所述高阶SNP致病组合数据检测方法采用多种群和多目标函数评价方法,其中,多种群能够保持种群的多样性,增强算法检测多个高阶SNP致病组合的能力;多个关联性评价函数,可以增强算法的通用性,降低对致病模型的偏好性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011121291.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置