[发明专利]各人种单倍型祖源数据库的构建方法在审
申请号: | 202210564500.2 | 申请日: | 2022-05-23 |
公开(公告)号: | CN114783527A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 宋清;马丽 | 申请(专利权)人: | 广州鸿溪见杉科技有限公司 |
主分类号: | G16B50/00 | 分类号: | G16B50/00;G16B20/30;G16B20/20 |
代理公司: | 广州凯东知识产权代理有限公司 44259 | 代理人: | 曾志环 |
地址: | 510300 广东省广州市黄埔区(广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 各人 种单倍型祖源 数据库 构建 方法 | ||
1.各人种单倍型祖源数据库的构建方法,其特征在于:
步骤包括:
(1)收集各人种的全基因组数据,以单个单倍型序列为样本单位;
(2)设置提取框,所述提取框从单倍型序列的一端向另一端移动并提取位于所述提取框内片段的SNP信息,并将每个所述片段标记对应的人种信息,同一人种内的片段按每个片段最接近5’端或3’端的SNP位点先后将每个片段按序暂存,直到每个人种的每个单倍型序列的SNP信息均被提取完毕;
(3)比对同一人种内SNP位点相同的片段,将SNP位点相同且SNP位点上碱基信息相同的片段进行合并;
(4)比对各人种间SNP位点相同的片段,找出SNP位点相同且SNP位点上碱基信息相同的片段,标记其对应的所有人种信息。
2.根据权利要求1所述的各人种单倍型祖源数据库的构建方法,其特征在于:
所述提取框从单倍型序列的一端向另一端移动是逐个SNP移动的;
所述提取框从单倍型序列的5’端向3’端移动或从单倍型序列的3’端向5’端移动。
3.根据权利要求1所述的各人种单倍型祖源数据库的构建方法,其特征在于:
所述提取框的大小是能够提取10-200个连续SNP。
4.根据权利要求1-3任一所述的各人种单倍型祖源数据库的构建方法,其特征在于:
所述步骤(2)中,有2个以上不同大小的提取框移动提取同一个单倍型序列的SNP信息,直到每个人种的每个单倍型序列的SNP信息均被每个提取框移动提取完毕。
5.根据权利要求4所述的各人种单倍型祖源数据库的构建方法,其特征在于:
所述2个以上不同大小的提取框同时移动提取或分批次移动提取同一个单倍型序列的SNP信息。
6.根据权利要求4所述的各人种单倍型祖源数据库的构建方法,其特征在于:
所述2个不同大小的提取框选自:能够提取20个连续SNP的提取框、能够提取21个连续SNP的提取框、能够提取22个连续SNP的提取框......和能够提取200个连续SNP的提取框。
7.根据权利要求4所述的各人种单倍型祖源数据库的构建方法,其特征在于:
所述2个不同大小的提取框选自:能够提取20个连续SNP的提取框、能够提取50个连续SNP的提取框、能够提取80个连续SNP的提取框、能够提取120个连续SNP的提取框、能够提取160个连续SNP的提取框、能够提取200个连续SNP的提取框。
8.根据权利要求1或6或7所述的各人种单倍型祖源数据库的构建方法,其特征在于:
步骤还包括:
(5)同一人种内,最接近5’端或3’端的SNP位点相同的片段归为相同的小组。
9.根据权利要求8所述的各人种单倍型祖源数据库的构建方法,其特征在于:
步骤还包括:
(6)同一人种内,SNP位点相同的片段归为相同的小组。
10.根据权利要求1所述的各人种单倍型祖源数据库的构建方法,其特征在于:
所述步骤(1)中,各人种的全基因组数据收集自Hapmap项目、国际千人基因组计划、奇云诺德。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州鸿溪见杉科技有限公司,未经广州鸿溪见杉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210564500.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:MO源除氧提纯方法
- 下一篇:单倍型祖源数据库的使用方法