[发明专利]一种基于单核苷酸多态性预测开放阅读框的方法及系统在审
申请号: | 202210325529.5 | 申请日: | 2022-03-30 |
公开(公告)号: | CN114639442A | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 宋波;姜梦云;宁卫东;程时锋 | 申请(专利权)人: | 中国农业科学院农业基因组研究所 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B30/00;G16B40/00 |
代理公司: | 深圳市韦恩肯知识产权代理有限公司 44375 | 代理人: | 李华双 |
地址: | 518124 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 核苷酸 多态性 预测 开放 阅读 方法 系统 | ||
本发明公开了一种基于单核苷酸多态性预测开放阅读框的方法,以及预测开放阅读框的系统。本发明利用群体基因组变异数据中编码序列中核苷酸多态性的3碱基周期性,检验和筛选待测基因序列中的开放阅读框,并统计开放阅读框中密码子的使用频率,结合核苷酸多态性的3碱基周期性和密码子使用频率统计结果,统计分析综合评定小开放阅读框的预测概率,从而实现在基因组中对小开放阅读框的准确预测。
技术领域
本发明属于生物技术领域,具体涉及一种基于单核苷酸多态性预测开放阅读框的方法,以及预测开放阅读框的系统。
背景技术
开放阅读框(Open reading frame,ORF)是DNA序列中具有编码蛋白质潜能的序列,其在基因组中的注释是下游分析和使用参考基因组所需的最重要的过程之一。目前,人们开发了各种算法来预测基因组中的ORF,但这些基于序列的方法无法预测小开放阅读框(small ORF,sORF)。近年来的研究表明,sORF编码的短于100个氨基酸的多肽在植物对非生物和生物胁迫的响应、人类的致癌作用以及一些与癌症治疗相关的生物过程中发挥着重要作用。长期以来,由于sORF的长度较短,且使用了非标准的起始密码子(CUG,GUG,UUG),其预测一直存在问题。
现有技术中,核糖体印迹测序技术(Ribo-seq)可以对核糖体保护的mRNA印记(RPFs)进行分析,可以用于精确预测包括酵母、人类、动物和植物在内的许多物种中被翻译的sORF。但这些物种大多是简单的模式生物,通常是二倍体纯合基因组,而Ribo-seq技术在复杂基因组中的应用鲜有报道。一个典型的真核核糖体的印记长度为28个碱基,对于序列的精确定位来说太短了,而这个问题在多倍体复杂基因组中会更加突出。许多植物基因组都是高重复和高杂合的多倍体复杂基因组,这极大地限制了Ribo-seq技术在这些植物中的应用。由于许多重要农作物,如小麦(六倍体)和棉花(四倍体),都是多倍体,因此有必要开发新的方法和工具用于解决多倍体复杂基因组中小编码框的鉴定问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于单核苷酸多态性预测开放阅读框的方法及系统。本发明利用群体基因组变异数据中编码序列中核苷酸多态性的3碱基周期性,引入密码子的使用频率,通过统计分析综合评定编码框的预测概率值,进而预测复杂基因组中的编码框。
本发明的目的是通过以下技术方案来实现的:一种基于单核苷酸多态性预测开放阅读框的方法,包括以下步骤:
S1、获取待预测的转录本信息,提取候选长开放阅读框;
S2、评估待预测的候选长开放阅读框中单核苷酸多态性的变化规律,根据预设的第一筛选条件筛选真实长开放阅读框;
S3、统计所述真实长开放阅读框中各密码子的使用频率;
S4、从所述转录本信息中提取候选开放阅读框,评估待预测的候选开放阅读框中单核苷酸多态性的变化规律和密码子使用频率,将符合预设的第二筛选条件的候选开放阅读框作为预测结果。
进一步的,提取所述候选长开放阅读框和候选开放阅读框的依据为:以起始密码子AUG开头,以终止密码子UAG、UAA或UGA结尾,且候选长开放阅读框和候选开放阅读框的序列长度为3的整数倍。
进一步的,所述候选长开放阅读框的长度大于900bp,所述候选开放阅读框的长度大于100bp。
进一步的,评估待预测的所述候选长开放阅读框中单核苷酸多态性的变化规律包括:
S21、获取待预测样本的群体变异数据,计算待预测的候选长开放阅读框中各位点的核苷酸多样性值;
S22、分别检验候选长开放阅读框中第3n个碱基的核苷酸多样性值是否大于第3n-2个碱基和第3n-1的核苷酸多样性值,其中,1≤n≤L/3,L为候选长开放阅读框的长度,得到P1和P2,计算合并后的P值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业科学院农业基因组研究所,未经中国农业科学院农业基因组研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210325529.5/2.html,转载请声明来源钻瓜专利网。
- CYP3A基因的多态性检测用探针、多态性检测方法、药效评价方法以及多态性检测用试剂盒
- 多态性检测用探针、多态性检测方法、药效判定方法以及多态性检测用试剂盒
- 多态性检测用探针、多态性检测方法、药效判定方法以及多态性检测用试剂盒
- 慢性牙周炎相关单核苷酸多态性检测用探针和引物、及其试剂盒
- 一种开发烟草中具多态性SSR分子标记的方法
- 一种用于检测UGT1A1基因多态性的引物、探针、试剂盒及检测方法
- 大泷六线鱼单核苷酸多态性位点及引物
- 一种焦磷酸测序法检测肠促胰素作用相关的单核苷酸多态性的试剂盒及方法
- 氨基糖苷类药物相关12s rRNA基因突变位点检测试剂盒
- 伊立替康的治疗效果预测方法及应用该方法的试剂盒