[发明专利]利用卷积神经网络(CNNS)进行异常剪接检测在审
申请号: | 201880043867.1 | 申请日: | 2018-10-15 |
公开(公告)号: | CN110870020A | 公开(公告)日: | 2020-03-06 |
发明(设计)人: | K·贾加纳坦;K-H·法尔;S·卡拉佐普罗潘吉欧托普卢;J·F·麦克雷 | 申请(专利权)人: | 因美纳有限公司 |
主分类号: | G16B40/30 | 分类号: | G16B40/30;G16B20/00 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 卷积 神经网络 cnns 进行 异常 剪接 检测 | ||
1.一种训练剪接位点检测器的神经网络实现的方法,所述剪接位点检测器识别基因组序列中的剪接位点,所述方法包括:
在至少50000个供体剪接位点的训练实例、至少50000个受体剪接位点的训练实例以及至少100000个非剪接位点的训练实例上训练卷积神经网络(缩写为CNN),其中每个训练实例都是具有至少一个靶核苷酸的靶核苷酸序列,所述靶核苷酸在每一侧上由至少20个核苷酸侧接;
为了使用所述CNN评估训练实例,作为所述CNN的输入,提供进一步由至少40个上游上下文核苷酸和至少40个下游上下文核苷酸侧接的靶核苷酸序列;以及
基于所述评估,所述CNN产生三重得分作为输出,以给出所述靶核苷酸序列中的每个核苷酸是供体剪接位点、受体剪接位点或非剪接位点的可能性。
2.根据权利要求1所述的神经网络实现的方法,其中,所述输入包括在每一侧具有由100个核苷酸侧接的靶核苷酸的靶核苷酸序列。
3.根据权利要求1-2中任一项所述的神经网络实现的方法,其中,所述靶核苷酸序列进一步由200个上游上下文核苷酸和200个下游上下文核苷酸侧接。
4.根据权利要求1-3中任一项所述的神经网络实现的方法,还包括在150000个供体剪接位点的训练实例、150000个受体剪接位点的训练实例和1000000个非剪接位点的训练实例上训练所述CNN。
5.根据权利要求1-4中任一项所述的神经网络实现的方法,其中,所述CNN通过卷积层的数量、卷积滤波器的数量和子采样层的数量来参数化。
6.根据权利要求1-5中任一项所述的神经网络实现的方法,其中,所述CNN包括一个或多个全连接层和终端分类层。
7.根据权利要求1-6中任一项所述的神经网络实现的方法,其中,所述CNN包括维度改变层,所述维度改变层重塑先前输入的空间和特征维度。
8.根据权利要求1-7中任一项所述的神经网络实现的方法,其中,所述CNN通过残差块的数量、跳跃连接的数量和残差连接的数量来参数化。
9.根据权利要求1-8中任一项所述的神经网络实现的方法,其中,每个残差块包括至少一个批归一化层、至少一个修正线性单元(缩写为ReLU)层、至少一个维度改变层以及至少一个残差连接。
10.根据权利要求1-9中任一项所述的神经网络实现的方法,其中,每个残差块包括两个批归一化层、两个ReLU非线性层、两个维度改变层以及一个残差连接。
11.根据权利要求1-10中任一项所述的神经网络实现的方法,其中,所述CNN在一个时期期间分批评估所述训练实例。
12.根据权利要求1-11中任一项所述的神经网络实现的方法,其中,将所述训练实例随机采样成批,其中,每个批具有预定的批大小。
13.根据权利要求1-12中任一项所述的神经网络实现的方法,其中,所述CNN在10个时期内迭代所述训练实例的评估。
14.根据权利要求1-13中任一项所述的神经网络实现的方法,其中,所述输入包括具有两个相邻的靶核苷酸的靶核苷酸序列。
15.根据权利要求1-14中任一项所述的神经网络实现的方法,其中,所述两个相邻的靶核苷酸是腺嘌呤(缩写为A)和鸟嘌呤(缩写为G)。
16.根据权利要求1-15中任一项所述的神经网络实现的方法,其中,所述两个相邻的靶核苷酸是鸟嘌呤(缩写为G)和尿嘧啶(缩写为U)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于因美纳有限公司,未经因美纳有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880043867.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于提供未播放内容的系统和方法
- 下一篇:基于回归的动物体重估计