[发明专利]微藻蛋白质特征序列标签匹配的快速检测方法及系统有效
申请号: | 201611162740.0 | 申请日: | 2016-12-15 |
公开(公告)号: | CN106709273B | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 王帅;郑立;孙承君;韩笑天;高珂 | 申请(专利权)人: | 国家海洋局第一海洋研究所 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B50/30 |
代理公司: | 青岛海昊知识产权事务所有限公司 37201 | 代理人: | 张中南;邱岳 |
地址: | 266061 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质序列 微藻 蛋白质特征 交集运算 快速检测 序列标签 算法 蛋白质 匹配 标准蛋白质 蛋白质组学 时间复杂度 相似性程度 给定序列 检测数据 检索效率 列表模块 配置处理 输出模块 输入模块 重要意义 数据集 同源性 序列集 转换 准确率 检索 采集 检测 研究 | ||
基于微藻蛋白质特征序列标签匹配的蛋白质快速检测方法及系统,包括采集微藻样品,获得其蛋白质序列集,转换成标准蛋白质序列集,并进行拆分配置处理,将其转换为对于一个给定序列片段的键/值对列表,将键/值对列表进行汇总后做交集运算,当结果非空,则确定该数据集某条数据含有特征蛋白质序列。其系统主要包括检测数据输入模块、键/值对列表模块、检测识别模块、特征值交集运算模块、输出模块。本发明通过蛋白质序列检索以判断蛋白质的同源性和相似性程度,较传统逐条数据进行对比的方式,算法的鉴定准确率和效率有显著提高,大大提升了检索效率,不仅具有良好的实用性,而且算法的时间复杂度低,性能高,对于蛋白质组学的研究具有重要意义。
技术领域
本发明属于微藻基因开发利用技术领域,特别是涉及一种基于微藻蛋白质特征序列标签匹配的蛋白质检测方法及系统。
背景技术
海洋微藻是水体生态系统中主要的初级生产者,占海洋生物物种的40.86%,有体积小、数量大、细胞结构简单、生长周期短、生物量大、光合效率高、适应力强、不受气候限制、易培养等优点,因此受到了人们的广泛关注,微藻中所含有的微藻不饱和脂肪酸具有维护生物膜的结构和功能、离子通道的调节、调控基因的表达、参与活性物质的合成、预防和治疗心血管疾病、调节免疫系统功能等生理功能和生物学效应。脂肪酸去饱和酶是催化脂肪酸链特定位置形成双键,从而产生不饱和脂肪酸的一类酶类大家族。
由于对相关酶的蛋白质序列进行逐条分析时,可以针对其蛋白质序列中的某功能域进行分析,因此提取目标蛋白质的特征序列,并对其进行特征序列标签的匹配和搜索可提高获得目标蛋白质序列的效率。
蛋白质组学是了解基因功能的最重要的途径之一。而蛋白质组学研究中一项基本而又尤为重要的一步就是蛋白质序列的鉴定,也就是确定蛋白质的一级结构,即一个氨基酸串。现今存在有20种氨基酸,并且每个蛋白质的一级结构均能表示为一个由20种氨基酸组成的序列,每个氨基酸用固定字母表示。由于序列决定结构,结构决定功能,因此研究蛋白质序列是生物信息学领域的一个关键问题,为进一步研究蛋白质的功能提供依据,需要有效的序列分析方法。
蛋白质序列搜索是蛋白质科学的重要研究方向,研发速度快和精度高的鉴定算法是该方向的一个主要问题。确定蛋白质功能最可靠的方法是进行数据库的相似性搜索。现有方法的搜索结果只注明目标序列的匹配部分,并不能提供该序列的全部信息,有时甚至得出模棱两可的结果,对用户产生误导,且都需要辅以人工搜索,面对大量数据集时耗时长。
因此,为了准确、快速的在大量蛋白质组数据中搜索到所需要的目标序列,需要一种可进行大数据处理,快速提升检索速度,有效的在大量蛋白质序列组中对目标蛋白质序列进行特征序列标签的匹配和搜索的方法,达到提高搜索结果速度的目的以对脂肪酸去饱和酶序列进行分析。
发明内容
本发明的目的是提供一种基于微藻蛋白质特征序列标签匹配的蛋白质快速检测方法及系统,以克服现有技术的不足。
基于微藻蛋白质特征序列标签匹配的蛋白质快速检测方法,其特征在于包括以下步骤:
步骤1:采集微藻样品,对样品进行RNA提取,样品纯度要求:OD值应在1.8至2.2 之间;电泳检测28S:18S至少大于1.8,样品浓度:总RNA浓度不低于400ng/μg,用①Oligo(dT)富集mRNA,去除rRNA,将RNA随机打断,用随机引物和逆转录酶从RNA片段合成cDNA 片段,cDNA片段末端修复,连接测序接头;②对于small RNA,进行3’和5’端接头连接,逆转录合成cDNA片段,最终将①和②的cDNA片段制备测序文库并进行测序,获得转录组测序的基因序列,之后翻译为蛋白质序列集;
或者根据所采集微藻的种类同时从美国国家生物技术信息中心(NBCI)下载对应的蛋白质序列集,并与上述蛋白质序列集合并;
步骤2:对步骤1得到的蛋白质序列集进行预处理,得到标准蛋白质序列集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家海洋局第一海洋研究所,未经国家海洋局第一海洋研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611162740.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种长焦镜头
- 下一篇:一种电池焊接、整形设备