[发明专利]一种基于基因表达量与性状动态相关性预测玉米未知基因功能的方法有效
申请号: | 201710169145.8 | 申请日: | 2017-03-21 |
公开(公告)号: | CN107058525B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 李慧;许秀勤;车荣会;李鹏;裴腊明;高幸幸;何琳琳 | 申请(专利权)人: | 济南大学 |
主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869;C12Q1/6895;G16B25/00 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 李桂存 |
地址: | 250022 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 基因 表达 性状 动态 相关性 预测 玉米 未知 功能 方法 | ||
1.一种基于基因表达量与性状动态相关性预测玉米未知基因功能的方法,其特征在于,包括以下步骤:
(1)收集玉米自交系授粉后15天的籽粒转录本测序获得基因表达量数据;
(2)动态关联分析LA模型的建立;
所述动态关联分析LA模型具体采用以下方法建立:LA的数学定义如下:
LA(X,Y|Z)=Eg'(z) 公式1
其中,所述X、Y和Z为玉米籽粒中基因表达量数据;假设X,Y,Z是均值为0,方差为1的连续随机变量,则X,Y的相关性表示为E(XY);当Z=z时,g(z)=E(XY|Z=z),g(z)检测的是当Z=z时,XY基因对的共表达模式,g(z)的导数表示为g'(z),该值可用于共表达模式变化的期望测定,当Z符合标准正态分布时,LA值可简单的表示为LA(X,Y|Z)=E(XYZ);
X,Y,Z代表具有正态分布表达谱的三个基因,则LA(X,Y|Z)表示为:E(XYZ)=(x1y1z1+x2y2z2+...+xmymzm)/m 公式2
LA用来反应基因对共表达模式的动态变化,即当Z基因表达量较高时,XY基因对的表达量呈正相关(co-regulated),E(XY|Z=1)为正数;当Z基因表达量较低时,XY基因对的表达量呈负相关(contra-regulated),E(XY|Z=0)为负数,因此基因对的表达调控模式由正相关(co-regulated)转变为负相关(contra-regulated),LA值记为正;相反,基因对的表达调控模式由负相关(contra-regulated)转变为正相关(co-regulated),LA值记为负;
(3)LA显著性评估;
(4)挖掘玉米全基因组基因共表达模式的动态关联;
(5)对显著LA结果的基因进行功能注释,预测未知基因的功能;
所述玉米自交系分成了两组:一组为热带,一组为亚热带、温带,小组内采用完全随机区组法,设2 个重复,每个自交系每个重复播种1 行,所有材料均进行自交,收获未成熟的授粉后15天的籽粒,每个自交系的两个重复各取3-4 穗,每穗取1-2 粒籽粒,混合提取籽粒总RNA,随机选择368个样品用于RNA-seq。
2.根据权利要求1所述的方法,其特征在于,所述RNA-seq包括以下步骤:首先,用Po ly(T)寡聚核苷酸从总RNA中抽取全部带Po ly(A)尾的RNA,主要为mRNA,然后将截获的mRNA随机打断成片段,用六碱基随机引物合成cDNA第一链,并加入逆转录酶合成cDNA第二链,经过试剂盒纯化并对cDNA片段进行末端修饰,连接测序接头,再经琼脂糖凝胶电泳回收目的大小片段,进行PCR扩增,用Illumina GAⅡ基因分析系统进行序列测定及分析,获得基因的表达量数据。
3.根据权利要求1所述的方法,其特征在于,所述动态关联分析LA模型的评估步骤如下:混合所有基因的表达量值;在每次模拟中,用放回随机抽样法随机抽取一对基因(X,Y)的表达量值,Z基因取全基因组所有基因,计算XY基因对在全基因组的LA值,可分别得到LA的正极大值和负极小值;重复模拟一百万次,分别得到LA的正值参考分布和负值参考分布,用LA正负参考分布的99%分位数作为LA正负显著性阈值。
4.根据权利要求1所述的方法,其特征在于,所述全基因组基因共表达模式的动态关联分析的结果按照LA值的大小进行过滤,对显著LA的基因进行功能注释,预测未知基因功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学,未经济南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710169145.8/1.html,转载请声明来源钻瓜专利网。