[发明专利]基于克隆DNA混合池的全基因组测序方法有效
申请号: | 201310288791.8 | 申请日: | 2013-07-10 |
公开(公告)号: | CN103388025A | 公开(公告)日: | 2013-11-13 |
发明(设计)人: | 罗美中;潘永龙 | 申请(专利权)人: | 华中农业大学 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68 |
代理公司: | 武汉开元知识产权代理有限公司 42104 | 代理人: | 王和平 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 克隆 dna 混合 基因组 方法 | ||
1.基于克隆DNA混合池的全基因组测序方法,其特征在于:包括以下步骤:
1)提取全基因组DNA,构建BAC文库;
2)构建BAC克隆混合池;
3)提取BAC克隆混合池的DNA;
4)对步骤3)中的BAC克隆混合池的DNA利用NGS进行双末端测序;
5)扫描各个混合池的序列,获得各个混合池的特征序列集合与k-mer集合;
6)根据混合池的特征序列集合与k-mer集合,解析出各个克隆的特征序列集合与k-mer集合;
7)利用克隆的特征序列集合构建克隆重叠群;
8)利用克隆重叠群将克隆的k-mer集合分割成小的k-mer集合并定位到克隆重叠群上;
9)对步骤4)中混合池的NGS序列进行拼装得到序列重叠群;
10)将序列重叠群定位到克隆重叠群上,并利用测序的双末端信息连接序列重叠群,确定它们的方向,得到克隆重叠群的序列;
11)利用分子标记确定克隆重叠群的相对位置与方向,将克隆重叠群的序列连接成整条染色体序列,得到全基因组序列;
其中,关于克隆特征序列集合与k-mer集合的解析的总算法如下:
某一物种BAC文库的克隆总数为a,构建的混合池总数为x,则;
第κ维,索引为λ混合池的k-mer集合表示为:P(κ,λ);
包含某一给定克隆的混合池的k-mer集合为:{P(δ)|δ<m, P(δ)∈P};
包含同一克隆的混合池的k-mer集合的交集,即克隆的IKS为:
某一克隆在混合池中的排除并集EUKS为:;
某一克隆k-mer集合的所有排除并集的交集为:;
某一克隆的最终k-mer集合FKS为:CF=Cx-CIx。
2.根据权利要求1所述的基于克隆DNA混合池的全基因组测序方法,其特征在于:所述序列重叠群定位与整合算法如下:
1)克隆重叠群的分割
根据克隆重叠群中克隆的相对位置,将克隆的k-mer集合分割成更小的区块,假设有两个克隆属于同一个重叠群并相互重叠,其中集合A为其中一个克隆的k-mer集合,集合B为另一个克隆的k-mer集合,那么这两个克隆的k-mer集合可以分解成3个子集,即共有的k-mer集合(A∩B),A特有的k-mer集合(A-B)和B特有的k-mer集合(B-A)。两者共有的k-mer集合位于它们特有的k-mer集合之间,这样三个k-mer的相对位置就确定了,根据这一算法,对每一个克隆重叠群的所有的克隆,按照它们相对位置,从一端开始逐一分割,从而将一个克隆重叠群中所有克隆的k-mer集合分割成小的子集,并且这些子集的相对位置是确定;
2)序列定位与整合
对各个混合池的NGS序列利用短序列拼装软件如velvet分别进行拼装,再将拼装结果合并,利用长序列拼装软件如PCAP进行进一步拼装,得到序列重叠群,然后将每一个序列重叠群分解成k-mer集合,与上一步得到的所有小区块的k-mer集合求交集,找出其中交集元素总数最多的区块,这样就将序列重叠群定位到了克隆重叠区的小区块上,如果定位到的同一个克隆重叠群的序列包含有相互重叠的部分,则需要分别再次拼装合并相互重叠的序列,然后再次定位合并后的序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中农业大学,未经华中农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310288791.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:湿法球磨联合酶法提取黑豆多肽的方法
- 下一篇:高精强力液压机