[发明专利]一种基于深度学习算法进行基因关联分析的方法有效
申请号: | 201710174877.6 | 申请日: | 2017-03-22 |
公开(公告)号: | CN107025386B | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 颜成钢;盛再超;彭冬亮;薛安克 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/30;G16B50/00 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杜军 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习算法进行基因关联分析的方法。本发明基于SNP集分析的方法需要借鉴来自同一个体不同位置但是相关的SNP信息,根据现有生物学知识将个体的SNP分成多个单元。首先在整个染色体层面,根据生物学相关知识,如接近基因组特征的原则,将全体SNP划分成多个SNP集。划分结束后,每一个SNP集输入到搭建的双向LSTM网络中,该网络是一个循环神经网络,它的状态包含上一时刻的陈旧信息,同时又是下一时刻权值变化的依据。LSTM网络学习完成后,可以通过网络的计算,输出对输入数据所需关注程度。本发明具有更好的敏感度和特异度,为临床医学、遗传病学和预防医学的发展研究开拓了新的领域。 | ||
搜索关键词: | 一种 基于 深度 学习 算法 进行 基因 关联 分析 方法 | ||
【主权项】:
一种基于深度学习算法进行基因关联分析的方法,其特征在于包括如下步骤:步骤1:根据现有生物学知识,在染色体层面按照基因分布进行分割,根据基因存在位置获得SNP的有效位置区间信息,以待后续分割SNP;步骤2:假设基于以人群的病例病情对照,采用n个独立个体的基因序列,在染色体层面上对SNP进行翻译,获得所需输入数据;步骤3:根据步骤1中获得的位置信息,将步骤2中获得的SNP序列根据有效位置区间信息对SNP进行分组,分成多个SNP集;步骤4:对于任意一个给定的SNP集,均包含有k个个体,每个个体有p个SNP,令第i个个体的SNP为Zi1,Zi2,Zi3,……Zip,i≤k;忽略基因的一般性原则,将每个SNP编码成trinary fashion形式,根据等位基因的影响,对序列中的纯合子、杂合子Zij进行赋值,其中Zij=0,1,2;病例控制状态设为Y,第i个个体记作Yi,其中Yi=1为Case,Yi=0为Control;使用SNP集作为x输入,病例控制状态设为Y输入;步骤5:搭建双向LSTM模型;使用双向LSTM的结构的目的是为了增加一个记忆存储单元,用于存储信息,它的状态包含上一时刻的陈旧信息,同时又是下一时刻权值变化的依据,能够更好地挖掘数据中更深层面的内容,由以下的函数复合得到:it=σ(Wxixt+Whiht‑1+Wcict‑1+bi)ft=σ(Wxfxt+Whfht‑1+Wcfct‑1+bf)ct=ftct‑1+ittanh(Wxcxt+Whcht‑1+bc)ot=σ(Wxoxt+Whoht‑1+Wcoct+bo)ht=ottanh(ct)公式中,Wxi为输入序列x与输入门之间的权值,Whi为隐藏层与输入门之间的权值;Wci为激活载体与输入门之间的权值,bi为输入门为t时的偏差值;Wxf为输入序列x与遗忘门之间的权值,Whf为隐藏层与遗忘门之间的权值,Wcf为激活载体与遗忘门之间的权值,bf为遗忘门为t时的偏差值;Wxc为输入序列x与激活载体之间的权值,Whc为隐藏层与激活载体之间的权值,bc为激活载体为t时的偏差值;Wxo为输入序列x与输出门之间的权值,Who为隐藏层与输出门之间的权值;Wco为激活载体与输出门之间的权值,bo为输出门为t时的偏差值;ht为t时刻的隐藏层;上述式子中σ是逻辑sigmoid函数,sigmoid(x)函数为:i,f,o,c分别为输入门、遗忘门、输出门和激活载体,其中i,f,o,c与h具有相同的维度,便于后续的矩阵计算,因此需要与隐藏向量h具有相同的大小;双向LSTM在水平的上具有相反的方向,通过堆叠放置中间的隐藏层,能够根据上一个隐藏层的输出,形成下一个隐藏层的输入;定义h0=x,输出为yyt=WhNyhtN+by]]>假设其中用于隐藏层的层数为N,则隐藏层代表的向量hn通过n=1~N,t=1~T进行迭代计算获得;其中前馈网络隐藏序列为反馈网络隐藏序列为yt=Wh→yht→+Wh←yht←+by]]>使用上述步骤中的SNP集作为X输入,病例控制状态设为Y输入;步骤6:按照步骤1中处理序列的方法,对待预测的基因序列进行处理,并将处理完的基因序列输入训练好的双向LSTM模型,从而得出该待预测的基因序列获病的概率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710174877.6/,转载请声明来源钻瓜专利网。