[发明专利]利用多数据平台发现长链非编码RNA分子标志物运用ceRNA机制的方法及系统和应用在审
申请号: | 201910675977.6 | 申请日: | 2019-07-25 |
公开(公告)号: | CN110415764A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 陈瑞;恽俊;李晓波;高娜 | 申请(专利权)人: | 东南大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B25/00;G16B50/30 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 211102 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 直肠癌 分子标志物 非编码RNA 数据平台 应用 长链 发现 生物信息学分析 生物靶向治疗 公共数据库 生物信息学 生物学研究 表达数据 测序数据 分析处理 分析流程 分析效率 复杂疾病 公共数据 基因功能 基因生物 生物效应 数据资源 预后评估 重要意义 高通量 可用 整合 疾病 预测 科研 | ||
本发明公开了一种多数据平台发现长链非编码RNA分子标志物运用ceRNA机制的方法及系统和应用。基于TANRIC公共数据资源的直肠癌LncRNA测序数据,运用多样的生物信息学分析手段,对LncRNA表达数据进行分析处理,识别与直肠癌相关的LncRNA,对LncRNA相关ceRNA机制探究,最终形成LncRNA‑miRNA‑mRNA‑疾病互作图。本发明采用丰富多样的生物信息学手段,整合数据资源,建立一套完整的分析流程,可有效发现直肠癌相关LncRNA分子通过ceRNA机制发挥其生物效应,在此过程中利用了公共数据库高通量数据,降低科研成本,提高分析效率。本发明可发现多个风险LncRNA,对复杂疾病的生物靶向治疗、基因功能预测、ceRNA机制探究及基因生物效应与预后评估都有重要意义,可广泛应用于生物学研究工作中,也可用于临床相关应用。
技术领域
本发明涉及一种生物统计学方法及系统和其应用,尤其涉及一种利用多数据平台发现长链非编码RNA分子标志物运用ceRNA机制的方法及系统和其应用。
背景技术
生物信息学是一门交叉学科,覆盖了生命科学、数学、统计学、物理学、化学、信息学和计算机技术等多门学科领域。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。生物信息学的研究工具主要有计算机、软件和互联网,研究对象主要有核酸序列和蛋白质序列。生物信息学旨在对大量的原始学数据进行存储、编辑、处理、传播和分析,归纳数据中的变化规律,揭示数据中所蕴含的生物学奥秘,同时为试验设计提供理论支持和指导,缩短科研周期。随着测序技术的成熟,各种各样的生物学数据突飞猛增,研究者为方便管理利用这些数据建立了生物信息学数据库。生物信息学数据库包含了大量的生物学原始数据,是生物信息学研究的出发点,也是其根本。而当下如何充分利用公共数据资源、高效整合数据、深入挖掘分析已成为生物信息学的一个重要课题。
TANRIC数据库为提供给癌症研究一个全面的LncRNA资源,从TCGA等独立研究中收集整合了大规模的RNA-seq数据集,并通过TANRIC提供了经过处理的表达数据。目前发布的数据包括8143个样本,包括三个部分。第一部分包括UCSC癌症基因组中心和TCGA数据库组织样本集:20个肿瘤类型的6309个肿瘤样本和11个组织的564个正常样本。其他癌症组将陆续添加。(ii)第二部分由独立的肿瘤组织样本组组成:多形胶质母细胞瘤274例,肾透明细胞癌97例,肺腺癌83例。其他独立的样本集将在可用时添加。(iii)第三部分由肿瘤细胞系组成:来自CCLE的739个细胞系样本。据我们所知,该数据库为目前现有癌症基因组LncRNA的最大公开可用的数据库,且数据涉及内容包含表达谱、拷贝数变异、突变、临床信息等,且数据量在逐年递增。该数据库试图通过应用基因组分析技术,特别是采用大规模的基因组测序,旨在找到具有致癌和抑癌作用的LncRNA,从而探索癌症疾病的发生、发展机制,在此基础上创新性发展新的诊断和治疗方法,为预防癌症提供新的思路。
长链非编码RNA(long non-coding RNA,LncRNA)是一类转录本长度超过200nt、不编码蛋白的RNA。长链非编码RNA起初被认为是基因组转录的“噪音”,不具有生物学功能。然而,近年来的研究表明长链非编码RNA能在表观遗传、转录及转录后水平上调控基因表达,参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程,与人类疾病的发生、发展和防治都有着密切联系。长链非编码RNA通常较长,具有mRNA样结构,有些具有poly(A)尾巴,有些没有poly(A)尾巴,分化过程中有动态的表达与不同的剪接方式,与编码基因相比,长链非编码RNA表达量更低。且具有组织特异性即不同组织之间的长链非编码RNA表达量不同和时空特异性即同一组织或器官的不同生长阶段,其中的长链非编码RNA表达量也会变化。长链非编码RNA可从染色质重塑、转录调控及转录后加工等多种层面实现对基因表达的调控。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910675977.6/2.html,转载请声明来源钻瓜专利网。