[发明专利]一种三代全长转录组辅助基因预测的方法在审
申请号: | 202110322129.4 | 申请日: | 2021-03-25 |
公开(公告)号: | CN113077842A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 郑洪坤;刘福䶮;李绪明;李婧姬;王晶 | 申请(专利权)人: | 北京百迈客生物科技有限公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B30/10 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 钱云 |
地址: | 101300 北京市顺义区南*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 全长 转录 辅助 基因 预测 方法 | ||
1.全基因组水平基因结构预测的方法,其特征在于,包括:
使用物种的二代测序数据和同源物种基因信息预测物种基因结构,获取物种的二代测序数据和同源物种基因信息中内含子剪切位点信息的交集;
所述交集与物种三代全长转录组数据中的内含子剪切位点进行合并;
所述合并后的内含子剪切位点用于鉴定并纠正物种三代全长转录组数据预测基因结构得到的内含子剪切位点,获取转录本。
2.根据权利要求1所述的方法,其特征在于,所述交集的获取包括:
基于二代Illumina平台得到的转录组数据预测所述物种基因结构和基于同源物种基因信息数据预测所述物种基因结构,获取reads数大于2的内含子剪切位点,且确保内含子剪切位点位于内含子与位于外显子的比值大于0.5。
3.根据权利要求1所述的方法,其特征在于,所述物种三代全长转录组数据中的内含子剪切位点的获取包括:
基于三代Nanopore平台得到的全长转录组数据预测物种基因结构,获取所述三代全长转录组数据中所剪切内含子以GT开头,AG结尾,或所剪切内含子以GC开头,AG结尾;read数大于5的内含子剪切位点。
4.根据权利要求1所述的方法,其特征在于,所述转录本的获取,包括:
所述合并后的内含子剪切位点左右延伸10-30个碱基,与物种三代全长转录组数据预测物种基因结构得到内含子剪切位点取交集,落在交集中的内含子剪切位点,用所述合并后的内含子剪切位点来替换。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述转录本与所述物种的基因组信息进行比对后,采用genemaker-ST实现全基因组水平基因结构预测。
6.用于全基因组基因结构预测的三代全长转录本,其特征在于,使用权利要求1-5任一项所述方法获取。
7.根据权利要求6所述的三代全长转录本,其特征在于,还包括,由PASA组装非全长的转录本得到。
8.根据权利要求7所述的三代全长转录本,其特征在于,若所述三代全长转录本对应到基因组上的剪接位点相同,进行所述三代全长转录本的去冗余。
9.权利要求1-5任一项所述的方法或权利要求6-8任一项所述的三代全长转录本在可变剪接预测中的应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百迈客生物科技有限公司,未经北京百迈客生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110322129.4/1.html,转载请声明来源钻瓜专利网。