[发明专利]一种基于单细胞测序数据唯一片段序列捕获方法在审

专利信息
申请号: 202011200039.X 申请日: 2020-10-30
公开(公告)号: CN112309500A 公开(公告)日: 2021-02-02
发明(设计)人: 潘星华;林贯川;黄仲曦;章建平 申请(专利权)人: 广州序科码生物技术有限责任公司;南方医科大学
主分类号: G16B30/00 分类号: G16B30/00;G16B50/30;G06F8/30
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 颜希文
地址: 510530 广东省广州市高新技*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 单细胞 序数 唯一 片段 序列 捕获 方法
【说明书】:

发明提供了一种基于单细胞测序数据捕获唯一片段序列的方法,其特征在于,包括以下步骤:基于单细胞测序文库中的DNA片段,以DNA片段上前10bp‑20bp碱基作为识别序列,对含有相同所述识别序列的DNA片段进行归类,通过计算机软件将同类型的DNA片段生成一个数据集,从该数据集获得用于分析单细胞全基因组唯一序列。本发明使用生物信息学手段进行数据识别,使得在基因组建库过程中无需设计和通过实验插入含有UMI的固有接头序列,简化了单细胞测序过程,并缩短了时间和降低因接头序列过长所导致的引物二聚体形成的发生概率。本方法在测序数据分析之前即可去除重复的序列,对于拷贝数变异分析而言,无其它相同的序列混杂,只剩下唯一的序列片段,即可更忠实的反应基因组的情况。

技术领域

本技术方法涉及二代测序中单细胞测序领域,具体涉及一种基于单细胞测序数据唯一片段序列捕获方法。

背景技术

二代测序正快速发展,测序价格越来越经济实惠,但群体细胞中无法解释的细胞间异质性问题突出。为解决这一问题,单细胞测序技术应运而生。必须在研究肿瘤等多种疾病的机制,单细胞全转录组测序技术中独辟蹊径,建库技术采用了单一分子识别标签序列(UMI),使得分析后保证在转录组建库后的每一条mRNA分子都是可识别的唯一序列。但一般的单细胞全基因组测序建库技术要经历预扩增、片段化、末端补平、加接头、扩增成库等一系列步骤,总体耗时长,效率低,费用高。虽然现今有转座酶的介入后,建库效率虽然提高,但是扩增成库需要经过聚合酶链式反应(PCR)是不变的,而过程中并没有增加单一分子识别标签序列,兼之在建库过程中由于片段化后长短不一和不同的GC含量会导致PCR偏好性。重要的是,因为单细胞全基因组建库目的是为了分析拷贝数变异和单核苷酸变异,所以在扩增后存在PCR偏好性会导致单一分子无法忠实的反映原基因组的拷贝数变异,致使测序结果在拷贝数分析中偏差值高而最终使得测序分析结果可信度大大降低。

发明内容

为了解决上述技术问题,本发明提出一种单细胞测序数据处理方法,包括:使用两种编程语言-R语言和python,以PCR建库方法扩增出来的片段的前10-20bp作为特异性分子识别标签序列(UMI),在二代测序全基因组建库过程中,捕获唯一片段。让随后的CNV和SNP分析中能忠实的反应基因组的信息。

为实现上述目的,本发明采取的技术方案为:

一种基于单细胞测序数据捕获唯一片段序列的方法,包括以下步骤:基于单细胞测序文库中的DNA片段,以DNA片段上前10bp-20bp碱基作为识别序列,对含有相同所述识别序列的DNA片段进行归类,通过计算机软件将同类型的DNA片段生成一个数据集,从该数据集获得用于分析单细胞全基因组唯一序列。

进一步地,所述识别序列通过使用计算机程序获得,将编写的代码输入即可获得识别序列。

进一步地,所述计算机程序包括python程序或R语言程序,其中python程序的代码具体如下:

python程序的代码具体如下:

R语言程序的代码具体如下:

本发明的有益效果:本发明的一种基于单细胞测序数据捕获唯一片段序列的方法,能准确、高效、简便地处理单细胞测序数据。通过R和python编程语言设计的代码获得长度为10-20bp的识别序列,对于单细胞基因组建库后100-150bp的短片段序列具有足够的特异性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州序科码生物技术有限责任公司;南方医科大学,未经广州序科码生物技术有限责任公司;南方医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011200039.X/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top