[发明专利]一种针对胚胎染色体的序列数据处理装置有效
申请号: | 201710347798.0 | 申请日: | 2017-05-17 |
公开(公告)号: | CN107239676B | 公开(公告)日: | 2018-04-17 |
发明(设计)人: | 糜庆丰;陈样宜;黄铨飞;彭春方;饶兴蔷;罗东红 | 申请(专利权)人: | 东莞博奥木华基因科技有限公司 |
主分类号: | G06F19/22 | 分类号: | G06F19/22 |
代理公司: | 广州嘉权专利商标事务所有限公司44205 | 代理人: | 谭英强 |
地址: | 523808 广东省东莞市松山湖高新技*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 胚胎 染色体 序列 数据处理 装置 | ||
技术领域
本发明涉及数据处理技术,尤其涉及一种针对胚胎染色体的序列数据处理装置,适用于胚胎染色体非整倍体检测技术中。
背景技术
染色体异常是导致自然流产、出生缺陷、胎儿多发畸形等重要临床因素。所述染色体异常包括有染色体数目异常和染色体微缺失微重复。其中,孕早期原因未明的自然流产中大部分是染色体非整倍体所致,B超显示存在多发畸形的胎儿中10%异常存在染色体非整倍体,出生缺陷的新生儿中约20%也为染色体异常所致。因此,对染色体异常进行检测,这一方面对于早期自然流产,有利于排查流产是否为胎儿染色体异常所致,特别是对多次未明原因的孕早期反复流产的孕妇,可以对夫妻双方进行染色体异常检测,以减少再次妊娠时异常患儿出生的可能性;另一方面,有利于早期发现胎儿异常是否为染色体异常所致,为医生提供诊断的辅助信息,从而实现胎儿异常的早期治疗,进而降低出生缺陷。
此外,近年来,人类辅助生殖技术的快速发展使得“试管婴儿”技术逐渐应用于临床,帮助更多不孕不育或年龄较大或携带遗传疾病的夫妻获得下一代。然而大量临床研究发现,在体外受精形成的胚胎中,大约一半左右的胚胎存在染色体异常的现象,这往往是许多孕妇会出现反复种植失败或自然流产或死产的主要原因[1]。而且随着孕妇年龄增加,胚胎发生染色体异常的风险也越高,极大地限制了辅助生殖技术的成功率。因此,胚胎植入前能对胚胎染色体异常的准确筛查,进而选择健康的胚胎植入,是能显著提高试管婴儿的妊娠率和活产率。
目前,针对染色体异常检测的方法主要包括有FISH、微阵列-比较基因组杂交(array-CGH)技术和高通量测序技术。荧光原位杂交技术(fluorescence in situ hybridization,FISH)是早期染色体异常检测的黄金标准。虽然FISH具有快速、特异性高等优势,但是由于受到探针种类和标记荧光素种类限制,使得该技术仅能一次对部分染色体数目异常进行检测,而不能在全基因组的水平上进行检测。目前更为普遍应用于染色体异常检测的方法是微阵列-比较基因组杂交(array-CGH)技术[2]。相比FISH技术,array-CGH技术可以仅通过一次杂交实验就能检测全部23对染色体数目变化,但是其检测的分辨率取决于探针的密度(探针未覆盖的区域是无法检测到的),若要从全基因组水平上检测23对染色体异常的情况,就必须增加探针的数量,大大地增加了成本费用。而随着高通量测序成本的降低,近几年来,基于高通量测序技术进行胚胎染色体非整倍体检测的方法逐渐成为主流。
基于高通量测序技术来检测胚胎染色体非整倍体的主要过程如下:1)、获取合理数量的DNA模板(流产物组织或胚胎组织则可以直接酶切或超声将DNA片段化;而囊胚细胞或者卵裂细胞由于起始的DNA模板为微克级别所以需要提前进行单细胞扩增);2)、选择一定片段大小的DNA分子(如150-250bp);3)、构建文库,在上述DNA分子两端加上测序用接头;4)、上机测序获得一定长度的序列(reads);5)、利用比对软件将序列(reads)比对到人类参考基因组,过滤重复序列和低质量的序列,得到各染色体不同位置的序列数目(reads number)和序列比例(reads ratio);6)、利用统计模型判断胚胎是否存在染色体异常。当胚胎出现染色体非整倍体时,相应染色体总数会有一定比例的升高或降低,因此可以与一定量样本构成的参考集合相比较或者自身样本内比较来判断染色体是否存在异常。染色体异常检测的统计学方法主要可以分为参考样本集合比较和自身样本内比较两种方法。
参考样本集合比较的代表性方法是Z检验[3]:Z检验模型利用大量正常样本构建参考数据库,得到参考数据集中各染色体的读长比例(reads ratio)的均值和标准差,然后计算待测样本在每条染色体中的Z-score,根据Z-score来判断样本是否为非整倍体。但是,Z检验模型所存有的主要问题是待测样本的Z-score大小对参考数据集的模型依赖性很强,如果待测样本和参考样本集合的数据一致性低的时候会导致灵敏性和特异性严重降低。对于胚胎植入前非整倍体筛查(PGS),胚胎的起始DNA含量约为6.6pg~30pg,DNA起始的模板含量非常低,所以需要进行全基因组扩增(whole genome amplification,WGA)然后测序,而全基因组扩增会引入严重的GC偏好,这往往导致待测样本和参考数据集样本的一致性很差,可见,Z-score模型不适用于胚胎植入前染色体非整倍体检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞博奥木华基因科技有限公司,未经东莞博奥木华基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710347798.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用