[发明专利]一种基于深度学习算法进行基因关联分析的方法有效

专利信息
申请号: 201710174877.6 申请日: 2017-03-22
公开(公告)号: CN107025386B 公开(公告)日: 2020-07-17
发明(设计)人: 颜成钢;盛再超;彭冬亮;薛安克 申请(专利权)人: 杭州电子科技大学
主分类号: G16B20/20 分类号: G16B20/20;G16B20/30;G16B50/00
代理公司: 杭州君度专利代理事务所(特殊普通合伙) 33240 代理人: 杜军
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于深度学习算法进行基因关联分析的方法。本发明基于SNP集分析的方法需要借鉴来自同一个体不同位置但是相关的SNP信息,根据现有生物学知识将个体的SNP分成多个单元。首先在整个染色体层面,根据生物学相关知识,如接近基因组特征的原则,将全体SNP划分成多个SNP集。划分结束后,每一个SNP集输入到搭建的双向LSTM网络中,该网络是一个循环神经网络,它的状态包含上一时刻的陈旧信息,同时又是下一时刻权值变化的依据。LSTM网络学习完成后,可以通过网络的计算,输出对输入数据所需关注程度。本发明具有更好的敏感度和特异度,为临床医学、遗传病学和预防医学的发展研究开拓了新的领域。
搜索关键词: 一种 基于 深度 学习 算法 进行 基因 关联 分析 方法
【主权项】:
一种基于深度学习算法进行基因关联分析的方法,其特征在于包括如下步骤:步骤1:根据现有生物学知识,在染色体层面按照基因分布进行分割,根据基因存在位置获得SNP的有效位置区间信息,以待后续分割SNP;步骤2:假设基于以人群的病例病情对照,采用n个独立个体的基因序列,在染色体层面上对SNP进行翻译,获得所需输入数据;步骤3:根据步骤1中获得的位置信息,将步骤2中获得的SNP序列根据有效位置区间信息对SNP进行分组,分成多个SNP集;步骤4:对于任意一个给定的SNP集,均包含有k个个体,每个个体有p个SNP,令第i个个体的SNP为Zi1,Zi2,Zi3,……Zip,i≤k;忽略基因的一般性原则,将每个SNP编码成trinary fashion形式,根据等位基因的影响,对序列中的纯合子、杂合子Zij进行赋值,其中Zij=0,1,2;病例控制状态设为Y,第i个个体记作Yi,其中Yi=1为Case,Yi=0为Control;使用SNP集作为x输入,病例控制状态设为Y输入;步骤5:搭建双向LSTM模型;使用双向LSTM的结构的目的是为了增加一个记忆存储单元,用于存储信息,它的状态包含上一时刻的陈旧信息,同时又是下一时刻权值变化的依据,能够更好地挖掘数据中更深层面的内容,由以下的函数复合得到:it=σ(Wxixt+Whiht‑1+Wcict‑1+bi)ft=σ(Wxfxt+Whfht‑1+Wcfct‑1+bf)ct=ftct‑1+ittanh(Wxcxt+Whcht‑1+bc)ot=σ(Wxoxt+Whoht‑1+Wcoct+bo)ht=ottanh(ct)公式中,Wxi为输入序列x与输入门之间的权值,Whi为隐藏层与输入门之间的权值;Wci为激活载体与输入门之间的权值,bi为输入门为t时的偏差值;Wxf为输入序列x与遗忘门之间的权值,Whf为隐藏层与遗忘门之间的权值,Wcf为激活载体与遗忘门之间的权值,bf为遗忘门为t时的偏差值;Wxc为输入序列x与激活载体之间的权值,Whc为隐藏层与激活载体之间的权值,bc为激活载体为t时的偏差值;Wxo为输入序列x与输出门之间的权值,Who为隐藏层与输出门之间的权值;Wco为激活载体与输出门之间的权值,bo为输出门为t时的偏差值;ht为t时刻的隐藏层;上述式子中σ是逻辑sigmoid函数,sigmoid(x)函数为:i,f,o,c分别为输入门、遗忘门、输出门和激活载体,其中i,f,o,c与h具有相同的维度,便于后续的矩阵计算,因此需要与隐藏向量h具有相同的大小;双向LSTM在水平的上具有相反的方向,通过堆叠放置中间的隐藏层,能够根据上一个隐藏层的输出,形成下一个隐藏层的输入;定义h0=x,输出为yyt=WhNyhtN+by]]>假设其中用于隐藏层的层数为N,则隐藏层代表的向量hn通过n=1~N,t=1~T进行迭代计算获得;其中前馈网络隐藏序列为反馈网络隐藏序列为yt=Wh→yht→+Wh←yht←+by]]>使用上述步骤中的SNP集作为X输入,病例控制状态设为Y输入;步骤6:按照步骤1中处理序列的方法,对待预测的基因序列进行处理,并将处理完的基因序列输入训练好的双向LSTM模型,从而得出该待预测的基因序列获病的概率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710174877.6/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top