[发明专利]各人种单倍型祖源数据库的构建方法在审
申请号: | 202210564500.2 | 申请日: | 2022-05-23 |
公开(公告)号: | CN114783527A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 宋清;马丽 | 申请(专利权)人: | 广州鸿溪见杉科技有限公司 |
主分类号: | G16B50/00 | 分类号: | G16B50/00;G16B20/30;G16B20/20 |
代理公司: | 广州凯东知识产权代理有限公司 44259 | 代理人: | 曾志环 |
地址: | 510300 广东省广州市黄埔区(广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 各人 种单倍型祖源 数据库 构建 方法 | ||
本发明公开了各人种单倍型祖源数据库的构建方法,步骤包括:大小不同的提取框从各人种的单倍型序列提取信息,并标记人种信息;比对同一人种内SNP位点相同的片段,将SNP位点相同且SNP位点上碱基信息相同的片段进行合并;比对各人种间SNP位点相同的片段,找出SNP位点相同且SNP位点上碱基信息相同的片段,标记其对应的所有人种信息。本发明优点有:同一单倍型的遗传信息在不同SNP位点数量的片段中储存,利于待测单倍型比对;SNP位点相同且SNP位点碱基信息相同的片段均标记其对应的所有人种信息,避免在查找疾病关联基因时受到祖源信息不全的干扰而影响准确性。
技术领域
本发明涉及生物信息技术领域,尤其涉及基于SNP的祖源数据整理技术。
背景技术
从人类基因组水平来看,大部分人类遗传变异是SNP。人类基因组中约1000bp就有一个SNP位点,其广泛存在于非编码区和编码区。不同人种的个体身上携带的SNP是有差异的,从古到今人类多次发生长途迁徙,后代混血是普遍的现象,造成个体上的基因组里可能存在多个不同人种的遗传信息。因此,仅从肤色等外表性状来区分个体为哪个人种来源是不科学的。
除了人们的身高、肤色、体型等性状的差异跟SNP有关,还有罹患某些遗传疾病的概率、免疫系统对某些疾病的抵御能力水平等也跟SNP有关。针对个体或特定群体的遗传学信息分析需要掌握目标个体或群体的基因来源于哪个人种,了解祖源信息才能精准分析个体或群体罹患某些遗传疾病的概率、免疫系统对某些疾病的抵御能力水平等。这就需要祖源数据库里的遗传信息全面、分类正确,虽然现有的祖源数据库收录了不少生物医学发展以来获得的人种相关的祖源信息,但是同一遗传信息可能是多个人种祖源共有,有可能其分类不一定准确,仅将该遗传信息标记为其中某些人种祖源存在而忽略了另外的人种祖源中也有存在,导致被忽略的人种祖源遗传信息分析不到位,制约遗传信息与生物医学发展进程。若能将SNP分析应用于完善祖源分类,将提高查找目的基因/个人遗传信息的祖源准确性,对分析SNP与遗传疾病关联、分子诊断、精准医学、制药以及个体化用药有指导作用。
发明内容
本发明的目的在于提供一种各人种单倍型祖源数据库的构建方法,以解决现有技术中数据库信息不够全面,导致待测样本单倍型中的遗传信息不能得到最正确的归类,不能准确追溯到祖源的问题。
为了达到上述目的本发明采用如下技术方案:
各人种单倍型祖源数据库的构建方法,步骤包括:
(1)收集各人种的全基因组数据,以单个单倍型序列为样本单位;
(2)设置提取框,所述提取框从单倍型序列的一端向另一端移动并提取位于所述提取框内片段的SNP信息,并将每个所述片段标记对应的人种信息,同一人种内的片段按每个片段最接近5’端或3’端的SNP位点先后将每个片段按序暂存,直到每个人种的每个单倍型序列的SNP信息均被提取完毕;
(3)比对同一人种内SNP位点相同的片段,将SNP位点相同且SNP位点上碱基信息相同的片段进行合并;
(4)比对各人种间SNP位点相同的片段,找出SNP位点相同且SNP位点上碱基信息相同的片段,标记其对应的所有人种信息。
进一步地,所述提取框从单倍型序列的一端向另一端移动是逐个SNP移动的;
所述提取框从单倍型序列的5’端向3’端移动或从单倍型序列的3’端向5’端移动。
进一步地,所述提取框的大小是能够提取10-200个连续SNP。
进一步地,所述步骤(2)中,有2个以上不同大小的提取框移动提取同一个单倍型序列的SNP信息,直到每个人种的每个单倍型序列的SNP信息均被每个提取框移动提取完毕。
进一步地,所述2个以上不同大小的提取框同时移动提取或分批次移动提取同一个单倍型序列的SNP信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州鸿溪见杉科技有限公司,未经广州鸿溪见杉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210564500.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:MO源除氧提纯方法
- 下一篇:单倍型祖源数据库的使用方法