[发明专利]确定棉纤维发育过程中上调基因和下调基因的方法在审
申请号: | 201410366425.4 | 申请日: | 2014-07-29 |
公开(公告)号: | CN105296604A | 公开(公告)日: | 2016-02-03 |
发明(设计)人: | 陈全家;曲延英;倪志勇;李月;刘超;康定明 | 申请(专利权)人: | 新疆农业大学 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68;C12N15/29;C07K14/415;C12N15/11;C12N15/53;C12N9/02;C12N15/82 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 李志东 |
地址: | 830052 新疆维吾尔自治区*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 棉纤维 发育 过程 上调 基因 下调 方法 | ||
1.一种确定在棉花纤维发育过程中上调或者下调基因的方法,其特征在于,所述方法包括:
(1)分别从处于棉纤维发育第一时期和第二时期的样本中获得第一转录组和第二转录组,对所述第一和第二转录组进行测序,获得第一转录组测序数据和第二转录组测序数据,所述第一转录组测序数据和第二转录组测序数据各自包含多个读段;
(2)分别基于步骤(1)中的第一转录组测序数据和第二转录组测序数据进行一级组装,获得第一一级组装数据和第二一级组装数据,所述第一一级组装数据和第二一级组装数据各自由多个一级基因构成;
(3)合并获自步骤(2)的第一一级组装数据和第二一级组装数据,利用所述第一一级组装数据和第二一级组装数据中有重叠的一级基因进行二级组装,获得二级组装数据,所述二级组装数据由多个二级基因构成;
(4)基于步骤(3)的二级组装数据和参考基因的重叠关系进行三级组装,获得三级组装数据,所述三级组装数据由多个三级基因构成;
(5)计算所述三级组装数据中各个三级基因在所述棉纤维发育第一时期样本和所述棉纤维发育第二时期样本中的表达量;
(6)确定获自步骤(5)的各三级基因的在所述棉纤维发育第一时期样本和所述棉纤维发育第二时期样本中的表达量的差异是否显著,以确定所述在棉纤维发育过程中的上调基因或者下调基因。
2.权利要求1所述的方法,其特征在于,所述样本来源于棉花胚珠。
3.权利要求1所述的方法,其特征在于,所述棉纤维第一时期和第二时期分别选自0DPA、5DPA、10DPA、15DPA和25DPA中的任两个不同的时期,所述样本来源于同一棉种。
4.权利要求1所述的方法,其特征在于,所述棉纤维第一时期和第二时期为选自0DPA、5DPA、10DPA、15DPA和25DPA中的任一同一时期,所述样本来源于不同棉种。
5.权利要求1所述的方法,其特征在于,步骤(1)的测序包括进行所述第一转录组和第二转录组测序文库构建,所述测序文库构建包括步骤:
a)分别从所述处于棉纤维发育第一时期的样本和处于棉纤维发育第二时期的样本中获得第一mRNA和第二mRNA;
b)打断从a)中获得的第一mRNA和第二mRNA,获得第一mRNA片段和第二mRNA片段;
c)分别以b)中的第一mRNA片段和第二mRNA片段为模板,反转录合成第一cDNA第一链和第二cDNA第一链;
d)分别以从c)中获得的第一cDNA第一链和第二cDNA第一链为模板,获得第一双链cDNA和第二双链cDNA;
e)分别对从d)中所得的第一双链cDNA和第二双链cDNA进行末端修复,加A以及连接测序接头,获得所述第一转录组测序文库和所述第二转录组测序文库。
6.权利要求5所述的方法,其特征在于,于步骤e)中连接测序接头之后,进一步对连接测序接头的片段进行大小选择。
7.权利要求1所述的方法,其特征在于,步骤(2)中的一级组装包括:
a)通过分别拼接所述第一转录组测序数据中的有重叠关系的读段或者所述第二转录组测序数据中的有重叠关系的读段,获得第一重叠群和第二重叠群,所述第一重叠群和第二重叠群各自包含多个重叠片段;
b)基于所述第一转录组测序数据中的有距离关系的读段或者所述第二转录本测序数据中的有距离关系的读段,以及所述有距离关系的读段在各自重叠群中的重叠片段上的位置,分别对所述第一重叠群或者所述第二重叠群中的重叠片段进行拼接,获得所述第一一级组装数据和第二一级组装数据,所述有距离关系的读段是指来自所述转录组测序文库两端的读段。
8.权利要求1所述的方法,其特征在于,进行步骤(3)的二级组装之前,对所述第一一级组装数据和第二一级组装数据合并后的数据去冗余。
9.权利要求1所述的方法,其特征在于,步骤4)中的参考基因是已知棉花的Unigene库。
10.权利要求1所述的方法,其特征在于,进行步骤(5)之前包括,确定所述三级基因的编码区序列。
11.权利要求10所述的方法,其特征在于,所述三级基因的编码区序列是通过将所述三级基因比对已知蛋白数据库来确定的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆农业大学,未经新疆农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410366425.4/1.html,转载请声明来源钻瓜专利网。