[发明专利]一种基于三代全长和二代转录组测序挖掘花椒叶片萜类化合物合成关键基因的方法在审
| 申请号: | 202111021607.4 | 申请日: | 2021-09-01 |
| 公开(公告)号: | CN115295073A | 公开(公告)日: | 2022-11-04 |
| 发明(设计)人: | 许锋;刘晓梦;唐宁;陈泽雄;张威威;廖咏玲;叶家保;杨晓燕 | 申请(专利权)人: | 长江大学 |
| 主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B30/00;G16B50/00;C12Q1/6869;C12Q1/6895 |
| 代理公司: | 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 | 代理人: | 李平丽 |
| 地址: | 434023*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 全长 二代 转录 组测序 挖掘 花椒 叶片 化合物 合成 关键 基因 方法 | ||
1.一种基于三代全长和二代转录组测序挖掘花椒叶片萜类化合物合成关键基因的方法,其特征在于,所述方法包括:
步骤1、测定了竹叶花椒和荣昌无刺花椒的三个不同发育时期,即幼叶、成熟叶和老叶中的萜类化合物的成分和含量,比较差异;
步骤2、分别提取竹叶花椒和荣昌无刺花椒的幼叶、成熟叶和老叶的总RNA,并提取竹叶花椒和荣昌无刺花椒幼叶、成熟叶和老叶时期混合样的总RNA,分别测序并构建全长转录组以及转录组数据集,获得原始数据;
步骤3、对步骤2获得的原始数据进行校正后得到高质量序列,将高质量序列过滤后得到干净数据,将所述干净数据进行组装处理,获得竹叶花椒与荣昌无刺花椒的全长转录组数据库和转录组数据库;
步骤4、对步骤3中得到的全长转录组数据库和转录组数据库进行可变剪接候选事件以及简单重复序列预测,并对可变剪接候选事件的真实性进行验证;
步骤5、对步骤3中得到的全长转录组数据库和转录组数据库进行转录本序列的编码区序列以及lncRNAs预测;
步骤6、对步骤3中的转录组数据库中的基因,进行功能注释以及转录因子的预测,鉴定样本之间的差异表达基因,并根据功能注释以及差异基因信息筛选与萜类化合物合成相关的酶基因以及转录因子;
步骤7、对步骤5中的lncRNAs的靶基因进行预测,根据lncRNAs靶基因预测信息对步骤6中筛选得到的基因的lncRNAs进行调控网络分析;
步骤8、对步骤6中的基因进行加权基因共表达网络分析,并通过可视化网络构建基因调控网络图,筛选得到与萜类代谢高连通性的hub基因;
步骤9、对步骤1中的显著差异的萜类化合物以及步骤8中的hub基因进行相关性分析,选择其中与萜类化合物含量具有相关性的基因,作为萜类化合物合成的关键基因。
2.根据权利要求1所述的方法,其特征在于,所述步骤3中,将原始序列转换成ROI序列以获得全长序列和非全长序列,使用ICE算法将来自同一转录本的RoI序列进行聚类分析,得到一致性序列,并使用非全长序列对得到的一致序列进行校正,获得高质量序列。
3.根据权利要求1所述的方法,其特征在于,所述步骤3中,对高质量序列进行过滤的方法为:去除其中rRNA重复和含接头的数据,并去除质量值Q≤20,碱基超过50%的低质量数据,得到干净数据。
4.根据权利要求1所述的方法,其特征在于,所述步骤4中,采用BLAST软件对全长转录组数据库和转录组数据库中的所有序列进行两两比对,比对结果满足:1)两个序列长度均大于1000bp,并且比对中有两个HSPs;且2)可变剪接Gap大于100bp,距离3'/5'末端至少100bp;且3)允许全部的可变转录本5bp的overlap的序列,被认为是候选可变剪接事件。
5.根据权利要求1所述的方法,其特征在于,所述步骤5中,分别使用CPC分析、CNCI分析、pfam蛋白结构域分析和CPAT分析四种方法进行lncRNAs预测,其中长度超过200nt并且具有两个以上外显子的转录物被选为lncRNA候选物。
6.根据权利要求1所述的方法,其特征在于,所述步骤6中,将花椒的转录组数据库中的基因,在Nr,Swiss-Prot,Pfam,KEGG,GO和COG数据库中利用BLASTN软件进行序列比对和功能注释,其中E-value10-5;接着使用iTAK软件对数据库中的转录因子进行预测和分类;然后使用DESeq2分析在竹叶花椒和荣昌无刺花椒中三个不同发育时期叶片中差异表达的基因,采用Benjamini-Hochberg方法对原有假设检验得到的显著性p值进行校正,以错误发现率小于0.01且差异倍数≥2作为差异表达基因的筛选标准;根据注释信息以及差异表达基因信息筛选与萜类化合物合成相关的结构基因和转录因子。
7.根据权利要求1所述的方法,其特征在于,所述步骤7中,通过样本间lncRNA与mRNA的表达量相关性分析方法来预测lncRNA的靶基因。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长江大学,未经长江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111021607.4/1.html,转载请声明来源钻瓜专利网。





