[发明专利]一种细菌ncRNA预测方法有效
申请号: | 201610412510.9 | 申请日: | 2016-06-14 |
公开(公告)号: | CN107506614B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 张翼;陈栋;程超 | 申请(专利权)人: | 武汉生命之美科技有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B25/10;G16B50/30 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 张火春 |
地址: | 430075 湖北省武汉市东湖新技术开发区高新*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于生物信息技术领域,尤其涉及利用Illumina二代测序获得的碱基片段结合PeakCalling方法进行细菌非编码RNA的分析预测方法。该方法包括剔除rRNA的细菌二代测序数据;获得数据后,对数据进行以下分析:先对数据进行去污染和去低质量分析,获得Clean reads;然后将reads比对到细菌基因组上;进行转录单元的初步预测;过滤掉已注释的mRNA和ncRNA,获得预测的ncRNA;将ncRNA注释到已知的ncRNA数据库Rfam,获得最终的预测结果。本发明可以非常精确地预测细菌基因组中未注释的ncRNA,弥补了实验手段的不足,为后期的实验和科学研究提供很有利的支持。 | ||
搜索关键词: | 一种 细菌 ncrna 预测 方法 | ||
【主权项】:
一种基于Illumina的转录组测序数据和PeakCalling方法的细菌ncRNA预测方法,其特征在于,包括如下步骤:通过Illumina测序平台获取某一物种至少一组rRNA剔除的转录组的原始测序数据;过滤所述各组原始测序数据中的不合格数据,获得所述各个转录组的待分析数据;对所述各转录组获得的待分析数据进行如下步骤的分析和筛选:1)将所述各个转录组的待分析数据分别比对到所述物种的参考基因组;2)利用bedtools等软件统计参考基因组中每个位置的比对深度,对全基因组的比对深度进行定量分析;3)根据比对深度,利用Peak Calling方法,获得参考基因组中所有的转录单元;4)获得转录单元后,统计每个转录单元的宽度,比对上的reads数,RPKM标准化方法获得的表达丰度,最高的深度,最高深度的位置等信息;5)和待测细菌所属物种已知的基因注释比较,获得新的ncRNA预测结果;6)对ncRNA进行启动子和终止子预测,获得预测结果;7)如果有多于1个样品,则2到5个样品的ncRNA预测结果进行合并,获得合并后的预测结果;8)将合并后的ncRNA预测结果比对到Rfam数据库中,获得ncRNA的功能注释结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉生命之美科技有限公司,未经武汉生命之美科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610412510.9/,转载请声明来源钻瓜专利网。