[发明专利]分析生物体的基因组DNA的方法和计算机系统有效
申请号: | 201710362635.X | 申请日: | 2012-04-13 |
公开(公告)号: | CN107368705B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | R.卓马纳克;B.A.彼得斯;B.G.科尔马尼 | 申请(专利权)人: | 完整基因有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张文辉 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分析 生物体 基因组 dna 方法 计算机系统 | ||
1.分析生物体的基因组DNA的方法,所述方法包括:
在一个或多个计算装置处接受与来自多个等分试样的基因组DNA的片段对应的多个读段,基因组DNA的每个片段用等分试样特异性标签序列加标签,并且每个读段包含来自基因组DNA的片段的序列和等分试样特异性标签序列,其中所述多个等分试样的每个等分试样中含有的基因组DNA小于单倍体基因组当量(haploid genome equivalent);
通过鉴定所述等分试样特异性标签序列测定所述读段起源的等分试样;
如下用所述一个或多个计算装置从读段产生定相序列:
鉴定与所述生物体的基因组的至少一部分对应的多个杂合基因座;并且
对所述多个杂合基因座定相以产生第一单元型和第二单元型,所述定相使用与所述多个杂合基因座对应的读段的起源的等分试样以测定所述杂合基因座处的哪些等位基因在相同的单元型上,所述定相序列对应于所述生物体的基因组的至少一部分,其中对所述多个杂合基因座定相包括:
对于多个杂合基因座对的每对,
测定所述对的杂合基因座处在读段上的等位基因之间的共享等分试样数目的矩阵,所述对的所述杂合基因座位于彼此的规定距离内。
2.权利要求1所述的方法,其中对所述多个杂合基因座定相进一步包括:
使用每个矩阵计算杂合基因座的相应对的得分和方向;并且
使用所述得分和方向测定所述第一单元型和第二单元型。
3.权利要求2所述的方法,其中所述方向规定所述相应对的第一杂合基因座的哪个等位基因与所述相应对的第二杂合基因座的第一等位基因连接,并且其中正向方向规定两个等位基因与在列表中一样连接,并且反向方向规定两个等位基因以列表的相反次序连接。
4.权利要求3所述的方法,其中对杂合基因座的相应对的连接计算得分,并且其中所述计算包括:
测定所述正向方向的第一数值;和
测定所述反向方向的第二数值,其中基于所述第一数值和所述第二数值的较大者测定所述方向。
5.权利要求2所述的方法,其中对杂合基因座的相应对的连接计算得分,并且其中所述计算包括:
测定杂质数值,所述杂质数值是除了连接的两个矩阵要素外的矩阵要素的和与所述矩阵要素的总和的比率;并且
使用所述杂质数值和所述两个矩阵要素计算所述得分。
6.权利要求5所述的方法,其中基于所述杂质数值和与所述连接对应的所述两个矩阵要素,使用模糊推理引擎(fuzzy inference engine)测定所述得分。
7.权利要求2所述的方法,其中使用所述得分和所述方向测定所述第一单元型和所述第二单元型包括:
基于所述得分和方向,优化杂合基因座的对之间的连接图。
8.权利要求7所述的方法,其中通过产生最小跨度树优化所述图。
9.权利要求7所述的方法,其中优化所述连接图提供多个子树,所述方法进一步包括:
将所述多个子树中的每个简化成重叠群,从而形成多个重叠群;和
使用来自所述生物体的亲本的测序信息定相多个重叠群以产生所述第一单元型和所述第二单元型。
10.权利要求7所述的方法,其进一步包括:
当第一杂合基因座没有在一个方向上与另一个杂合基因座的至少两个连接和在另一个方向上与另一个杂合基因座的至少一个连接时,从图上除去作为节点的第一杂合基因座。
11.权利要求1所述的方法,其中测定杂合基因座的特定对处在读段上的等位基因之间的共享等分试样数目的矩阵包括将读段定位到所述特定对的杂合基因座,并且计算共享所述等位基因之间的等分试样的定位读段。
12.权利要求1所述的方法,其进一步包括:
用所述一个或多个计算装置产生所述第一和第二单元型的装配序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于完整基因有限公司,未经完整基因有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710362635.X/1.html,转载请声明来源钻瓜专利网。