[发明专利]一种基于circRNA位置信息预测RNA结合蛋白的方法有效
申请号: | 202110333465.9 | 申请日: | 2021-03-29 |
公开(公告)号: | CN113096729B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 洪林君;吴珍芳;蔡更元;臧旭鹏;刘德武;李紫聪;顾婷;徐铮;黄思秀 | 申请(专利权)人: | 华南农业大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B30/00 |
代理公司: | 佛山市君创知识产权代理事务所(普通合伙) 44675 | 代理人: | 许菲菲 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 circrna 位置 信息 预测 rna 结合 蛋白 方法 | ||
本发明涉及基因工程技术领域,特别涉及一种基于circRNA位置信息预测RNA结合蛋白的方法。本发明基于circRNA染色体位置信息,得到circRNA同方向起始位置前100个碱基的染色体位置信息,然后在Linux系统上利用生物信息学软件bedtools获得circRNA同方向前侧位置序列,并进一步得到circRNA同方向前侧位置序列的motif;从已知数据库中下载已知蛋白质的motif的meme格式文件,将其与circRNA同方向前侧位置序列的motif进行比对、匹配,进而得到circRNA的RNA结合蛋白。该方法能够批量预测circRNA的RBP,不受数量和物种的限制。
技术领域
本发明涉及基因工程技术领域,特别涉及一种基于circRNA位置信息预测RNA结合蛋白的方法。
背景技术
Circular RNA,简称为circRNA,被称作环状RNA,是具有共价闭环结构、既没有5’至3’极性、也没有聚腺苷酸化尾巴的非编码RNA,由前体mRNA反向剪接产生,需要典型的剪接体机制,且互补序列和特异性蛋白因子均可促进这种剪接。研究表明,circRNA普遍存在于各种组织和器官的发育中,参与一些特定生物学过程,包括转录调控、细胞之间的信息传递等,且在人类疾病的发生和发展中发挥重要作用。
RNA结合蛋白(RNA binding protein),简称为RBP,在RNA的转录后调控中起关键作用,可以通过与特定的顺式调控元件相互作用,组装核糖核蛋白复合物以结合RNA序列,影响靶标RNA的表达和功能。研究表明,在circRNA生命周期的各个阶段,包括circRNA的生成、转录后调控、功能执行、特定修饰和潜在的细胞外转运途径等生物学过程中都有RBP的参与,RBP可以通过与circRNA剪接起始侧翼序列相结合,从而调控circRNA的生成。
目前已知公开数据库中,只有circinteractome数据库能够预测circRNA的RBP,但由于其数据库的限制,一次最多只能输入20条circRNA,且只能预测具有公共circRNA ID的人类circRNA,这就对研究其他物种,例如猪、牛、羊等的科研工作者造成了极大的约束。随着高通量测序技术的不断进步,越来越多物种不同状态下的组织被测序处理,大量的circRNA被发现,由于这些新发现的circRNA没有公共的ID信息,且不属于人,只有基于测序获得的染色体位置信息,想要通过现有的数据库来预测获得这些circRNA的RBP几乎不可能。
发明内容
为了克服现有技术的不足和缺点,本发明的目的在于提供一种基于circRNA位置信息预测RNA结合蛋白的方法。
本发明的目的通过下述技术方案实现:
一种基于circRNA位置信息预测RNA结合蛋白的方法,包含如下步骤:
(1)提取待测样本总RNA,进行高通量circRNA测序,得到circRNA染色体位置信息;基于circRNA染色体位置信息,将所有circRNA染色体位置信息整理为后缀名为.bed的bed文件,命名为circRNA_location.bed;
(2)基于步骤(1)得到的circRNA_location.bed文件,通过软件python运行location_change.py文件,得到名为circRNA_flank_location.bed的文件;该bed文件内包含基于上述circRNA染色体位置信息所获得的circRNA同方向起始位置前100个碱基的染色体位置信息,即RBP可能结合的位点,该位置信息用于后续的分析;
(3)从NCBI或Ensembl下载步骤(1)中待测样本对应物种的参考基因组核苷酸序列文件,基于步骤(2)得到的circRNA同方向起始位置前100个碱基的位置信息文件circRNA_flank_location.bed,在Linux系统上利用生物信息学软件bedtools获得circRNA同方向前侧位置序列,进而得到名为circRNA_flank_sequence.fa的序列信息文件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南农业大学,未经华南农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110333465.9/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置