[发明专利]一种能够识别EpCAM蛋白的核酸适体及其制备方法与应用有效
| 申请号: | 201910850939.X | 申请日: | 2019-09-10 |
| 公开(公告)号: | CN110592093B | 公开(公告)日: | 2023-08-25 |
| 发明(设计)人: | 杨朝勇;宋彦龄;宋佳;郑媛 | 申请(专利权)人: | 上海交通大学医学院附属仁济医院 |
| 主分类号: | C12N15/115 | 分类号: | C12N15/115;C12N5/09;G16B40/00;G16B40/30;G01N33/68;G01N33/574 |
| 代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹 |
| 地址: | 200001 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 能够 识别 epcam 蛋白 核酸 及其 制备 方法 应用 | ||
本发明提供了一种能够识别EpCAM蛋白的核酸适体,其特征在于,其为SEQ ID NO:1~SEQ ID NO:11中任一序列所示的DNA片段。本发明通过多维度分析框架筛选得到的能够识别EpCAM蛋白的核酸适体具有比蛋白抗体更高的亲和力与特异性,将成为EpCAM检测的有力工具,在肿瘤早期诊断、循环肿瘤细胞捕获等领域具有良好的应用前景。
技术领域
本发明属于生物传感器技术领域,具体涉及一种核酸适体、核酸适体的衍生物及其筛选方法和应用。
背景技术
EpCAM(Epithelial cell adhesion molecule)上皮细胞粘附分子属于黏附分子家族,也称为17-A,ESA,EGP40,Trop-1,KSA,CD326,TACSTD1,CO17-1A,GA733-2等,表达在人部分正常上皮细胞和大多数恶性上皮细胞表面,对肿瘤生物学特性起重要作用,对EpCAM蛋白的识别可用于循环肿瘤细胞的捕获。而目前对EpCAM蛋白的识别常用的是基于特异性抗体,但EpCAM抗体具有价格昂贵、稳定性差、批次差异大等缺点,导致临床检测效果、循环肿瘤细胞捕获效果不甚理想。筛选并获得高特异性、高亲和力识别EpCAM蛋白的核酸适体具有重要意义,其将成为EpCAM检测的有力工具,有望用于肿瘤早期诊断、循环肿瘤细胞捕获等领域。
核酸适体(aptamer)是通过指数富集配基的系统进化技术(SELEX)筛选得到的,能特异结合靶物质的单链寡聚核苷酸(ssDNA或ssRNA)。核酸适体与抗体功能类似,但是与抗体相比具有更多的优势,具有更高的亲和力与特异性;无免疫原性;能够化学合成,成本低;可进行标记;稳定性好,易于保存等优点。核酸适体的靶分子更为广泛,包括金属离子、氨基酸、核酸、多肽、蛋白质,并从单一靶标扩展至完整的病毒颗粒及细胞等复合物靶标。因此,核酸适体具有广泛的应用前景。
基于数据挖掘、机器学习等分析手段辅助核酸适体筛选是一种新的理念和趋势,其主要可分为基于机器模拟、深度学习等开展的适体设计和基于文库二代测序数据挖掘开展的适体识别。前者多基于分子对接建模,但因已解析的蛋白、核酸结构以及蛋白-核酸复合结构太少,几乎没有进展;对于后者,自2010年以来越来越多的工作证明文库二代测序数据能够辅助指数富集的配体系统进化技术(SELEX)体系,帮助提高筛选成功率从而减少筛选轮次、甄定更多更好的适体、理解体外指数富集配体系统进化过程。
二代文库高通量测序数据为适体筛选工作带来了新的机遇,但是文库数据复杂度高、数据量庞大、进化机制复杂且相应机制研究基础少,使得二代核酸文库测序数据的分析算法开发缓慢。此外,该类算法受灵敏度低、准确率低、计算耗时长等阻遏,并没有真正被广泛应用到文库序列分析当中。因此开发高灵敏度、准确、高效的分析平台是目前更好利用二代测序数据辅助SELEX体系的核心。
首先,有效的数据过滤是实现文库高通量数据高效处理的前提,但现有数据过滤方法单一、低效。主要基于随机抽样或者简单的设置核酸适体频率阈值进行过滤,易造成很多假阴性结果,特别是低频高性能适体的丢失。因此,发展更加合适的过滤手段是该领域亟待解决的重要问题之一。
其次,准确、高效的序列家族分类方法是理清文库组成的唯一途径,但现有方法存在适用面窄、效率低等问题。早期的家族分析基于一致性序列的统计,但文库构成复杂,简单的序列统计往往无法真正归纳出文库序列组成。因此,之后发展的算法多基于序列相似性进行序列家族分类(如AptaCluster等),而如何度量序列之间的相似性成为这些算法的核心。目前已有的文库序列相似性度量主要基于编辑距离(Levenshtein distance,LD)和局部敏感哈希(Locality-Sensitive Hashing,LSH)。这些度量方式或无法考虑碱基插入、丢失,或要求序列等长,适用面窄。且这些算法的计算耗时长,随着测得的序列数目增加计算耗时接近平方阶增长,使得其无法高效解决核酸文库二代测序数据的分析问题而未得到广泛应用。因此,现今急需寻找更加高效且广泛适用的核酸序列相似性度量和分类方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学医学院附属仁济医院,未经上海交通大学医学院附属仁济医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910850939.X/2.html,转载请声明来源钻瓜专利网。





