[发明专利]一种基于ADMIXTURE-MCP模型估计水产动物基因组品种组成的新方法有效
申请号: | 202010189230.2 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111354417B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 王扬帆;任强;倪萍;胡晓丽;黄晓婷;邢强;焦文倩;张玲玲;王师;胡景杰;包振民 | 申请(专利权)人: | 中国海洋大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B35/20 |
代理公司: | 青岛博展利华知识产权代理事务所(普通合伙) 37287 | 代理人: | 杨春雷 |
地址: | 266071 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 admixture mcp 模型 估计 水产 动物 基因组 品种 组成 新方法 | ||
1.一种基于ADMIXTURE-MCP模型估计水产动物基因组品种组成的新方法,所述方法包括步骤:
1)获得某一水产动物未知品种的基因组SNP标记数据;
2)对步骤1)中所述的SNP数据进行筛选,筛选出的SNP要有较高的信息含量,可以准确鉴定和区分现有的水产动物品种;
3)对步骤2)中所筛选的SNP使用均态分布的SNP,减少或删除处于高度连锁不平衡的SNP;
4)对参考水产动物进行筛选;
5)对于步骤4)中筛选的水产动物应为纯种或者是每个品种中代表性的动物个体,认为这些动物个体SNP的基因型具有独立的多项分布,用以计算某一水产动物的某品种属于某些特定品种的可能性;
6)估计水产动物基因组品种组成;
7)在对步骤6)计算品种组成时,用Gi代表个体基因型在SNP等位基因的数量,所述Gi为0、1或2,qij表示j种群中第i个SNP处等位基因的频率,已知k参考值或已知等位基因频率的祖先群体,让xi代表第j个种群的ADMIXTURE比例,并且是ADMIXTURE系数的向量,在给定等位基因频率和ADMIXTURE比例的情况下,将定义为SNPi的权重等位基因频率;
8)在步骤7)中所述群体遵循Hardy-Weinberg平衡法则(HWE),观察基因型Gi在i位点的概率为:
对于给定ADMIXTURE比例的向量,个体所观察到的基因型g的对数似然可定义为:
其中gi是位点i观察到的基因型;
上述似然函数(1)也可写成各位点基因型的函数:
其中C是常数;
对于k群体给定的等位基因频率矩阵qij(1≤i≤nand1≤j≤k),目标为确定当ADMIXTURE系数受最大约束(xj≥1和∑jxj)时,向量的估计。
2.根据权利要求1所述的方法,对步骤1)中使用LD的r20.30作为删除SNP的尺度。
3.根据权利要求1所述的方法,对步骤7)中传统模型ADMIXTURE对某一水产动物不同品种的相似基因序列产生小分量的问题进行了优化,使用MCP稀疏优化方法产生稀疏解来降低估计GBC噪音。
4.根据权利要求1所述的方法,对步骤8)中通过最大化数据稀疏性对参数的非凸惩罚MCP的似然对数,得到模型(2)的稀疏解的估计:
其中
λ(λ0)并且
MCP的参数为凹性参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国海洋大学,未经中国海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010189230.2/1.html,转载请声明来源钻瓜专利网。