[发明专利]对染色体测序结果进行GC校正的方法及装置有效
申请号: | 201410339920.6 | 申请日: | 2011-06-29 |
公开(公告)号: | CN104120181B | 公开(公告)日: | 2017-06-09 |
发明(设计)人: | 蒋馥蔓;陈会飞;柴相花;袁玉英;张秀清;陈芳 | 申请(专利权)人: | 深圳华大基因股份有限公司 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68;C12M1/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 李志东 |
地址: | 518083 广东省深圳市盐田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 染色体 结果 进行 gc 校正 方法 装置 | ||
1.一种用于建立染色体的覆盖深度和GC含量之间的关系的方法,所述方法包括:
从多于一个样品获得涵盖所述染色体的多个多核苷酸片段的序列信息;
基于所述序列信息将所述片段分配至染色体;
基于每个样品的所述序列信息计算所述染色体的覆盖深度和GC含量;并且
确定所述染色体的所述覆盖深度和GC含量之间的关系。
2.根据权利要求1所述的方法,其中所述分配是通过将所述片段的序列与人基因组参考序列比较进行的。
3.根据权利要求1所述的方法,其中所述染色体的所述覆盖深度是分配至所述染色体的片段数目与所述染色体的参考独特读段数目之间的比值。
4.根据权利要求3所述的方法,其中所述覆盖深度是标准化的。
5.根据权利要求4所述的方法,其中所述标准化是相对于另一染色体的所述覆盖度进行计算的,或者相对于所有其他常染色体的所述覆盖度进行计算的,或者相对于所有其他染色体的所述覆盖度进行计算的。
6.根据权利要求1所述的方法,其中所述染色体的所述GC含量是分配至所述染色体的所有片段的平均GC含量。
7.根据权利要求1所述的方法,其中所述染色体是染色体1、2、……、22、X或Y。
8.根据权利要求4所述的方法,其中所述关系为以下公式:
cri,j=f(GCi,j)+εi,j,j=1,2,…,22,X,Y,
其中f(GCi,j)代表样品i、染色体j的覆盖深度和相应GC含量之间的关系的函数,εi,j代表样品i、染色体j的残差。
9.根据权利要求1所述的方法,其中所述覆盖深度和GC含量之间的关系是通过局部多项式回归计算的。
10.根据权利要求9所述的方法,其中所述关系是非强线性关系。
11.根据权利要求10所述的方法,其中所述关系通过loess算法确定。
12.根据权利要求8所述的方法,进一步包括:根据以下公式计算拟合覆盖深度:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因股份有限公司,未经深圳华大基因股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410339920.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于电子商务的智能存储箱
- 下一篇:车辆上报信息的处理方法和装置