[发明专利]一种构建异化砷还原酶蛋白数据库的方法在审

专利信息
申请号: 201910527109.3 申请日: 2019-06-18
公开(公告)号: CN110310708A 公开(公告)日: 2019-10-08
发明(设计)人: 胡敏;刘传平;李芳柏 申请(专利权)人: 广东省生态环境技术研究所
主分类号: G16B50/00 分类号: G16B50/00;G16B20/00
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 郭炜绵
地址: 510316 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种构建异化砷还原酶蛋白数据库的方法,该方法包括以下步骤:在蛋白数据库Uniprot检索异化砷还原酶蛋白序列,获取原始序列,搜索原始序列的功能结构域并获取对应的蛋白序列;进行多序列比对,构建相关功能结构域的隐马尔科夫模型;检索Genebank,获得具有该功能结构域的蛋白序列;去除高度同源和不符合要求的蛋白序列,对筛选得到的蛋白序列添加物种注释信息,整合所有蛋白序列,完成异化砷还原酶蛋白数据库的构建。利用本发明提供的方法,可以完成异化砷还原酶蛋白序列数据库的构建,不仅为了解自然异化砷还原微生物多样性提供基础数据,同时可为异化砷还原基因的引物设计、数据分析和序列的物种注释提供数据支撑。
搜索关键词: 还原酶蛋白 蛋白序列 构建 功能结构域 数据库 原始序列 检索 隐马尔科夫模型 物种 蛋白数据库 多序列比对 还原微生物 序列数据库 还原基因 基础数据 数据分析 数据支撑 引物设计 注释提供 注释信息 整合 去除 同源 搜索 多样性 筛选
【主权项】:
1.一种构建异化砷还原酶蛋白数据库的方法,其特征在于包括以下步骤:(1)在蛋白数据库Uniprot检索异化砷还原酶蛋白序列;将检索获得的全部蛋白序列进行长度分布统计,删除长度偏移平均长度±20%的序列;(2)选择注释为砷还原酶或者相关蛋白、无重复的蛋白序列作为原始序列,搜索原始序列的功能结构域,并获取功能结构域对应的蛋白序列;(3)将功能结构域的蛋白序列进行多序列比对;以对齐的结构域蛋白序列为种子,构建相关功能结构域的隐马尔科夫模型;(4)检索Genebank蛋白数据库,获得具有该功能结构域的蛋白序列;去除高度同源和不符合要求的蛋白序列,保留的序列要同时符合以下标准:a)注释信息包含异化砷还原酶蛋白名字;b)注释信息不存在部分蛋白、推测蛋白和假定蛋白;c)E值小于1e‑10;d)比对长度大于序列的30%;e)比对得分大于60;(5)对筛选得到的蛋白序列添加物种注释信息,并计算序列的长度、对应酶蛋白的分子量大小及等电点;整合所有蛋白序列,完成异化砷还原酶蛋白数据库的构建。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东省生态环境技术研究所,未经广东省生态环境技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910527109.3/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于CRISPR/Cas9的sgRNA的设计方法-201610341946.3
  • 刘琦;啜国晖;陈亚男;闫纪芳 - 同济大学
  • 2016-05-20 - 2019-10-18 - G16B50/00
  • 本发明涉及一种基于CRISPR/Cas9的sgRNA的设计方法,其特征在于,该方法包括下列步骤:获取sgRNA和对应的Cas9的酶切效率的值;建立个性化sgRNA设计模型;运用NDCG算法衡量建立的个性化sgRNA设计模型的质量并更新数据库;设计sgRNA并给出每个sgRNA的评估值。与现有技术相比,本发明具有准确率高、特征完整、应用范围广与分析数据广的特点。
  • 一种构建异化砷还原酶蛋白数据库的方法-201910527109.3
  • 胡敏;刘传平;李芳柏 - 广东省生态环境技术研究所
  • 2019-06-18 - 2019-10-08 - G16B50/00
  • 本发明公开了一种构建异化砷还原酶蛋白数据库的方法,该方法包括以下步骤:在蛋白数据库Uniprot检索异化砷还原酶蛋白序列,获取原始序列,搜索原始序列的功能结构域并获取对应的蛋白序列;进行多序列比对,构建相关功能结构域的隐马尔科夫模型;检索Genebank,获得具有该功能结构域的蛋白序列;去除高度同源和不符合要求的蛋白序列,对筛选得到的蛋白序列添加物种注释信息,整合所有蛋白序列,完成异化砷还原酶蛋白数据库的构建。利用本发明提供的方法,可以完成异化砷还原酶蛋白序列数据库的构建,不仅为了解自然异化砷还原微生物多样性提供基础数据,同时可为异化砷还原基因的引物设计、数据分析和序列的物种注释提供数据支撑。
  • 生命体系中等位基因竞争性反应QM/MM方法-201610804349.X
  • 白杨;白羽 - 北京理工大学
  • 2016-09-06 - 2019-09-20 - G16B50/00
  • 本发明涉及一种判断生命体系致病基因反应速率算法,具体为一种生命体系中等位基因竞争性反应QM/MM方法。(1)从蛋白质、核酸等数据库下载相应的分子晶体结构文件,从中选择若个比较合理的分子结构,(2)先用Tinker程序计算MM部分的能量、电荷以及能量梯度,(3)用Gaussian98程序对QM部分进行优化,(4)用tinker中的Newton程序对MM部分进行构型的优化,(5)选取合适的反应坐标,(6)得到了反应路径,进行计算。通过应用本专利中提出的计算方法,可以为诸如镰刀形红细胞贫血症等基因疾病找到合适的治疗方案,即寻找使致病基因不能发生反应或者反应速率慢于正常基因的条件。这对医学是非常有意义的。
  • 一种非小细胞肺癌基因变异及药物解读多数据库交互系统-201810697971.4
  • 杨达梅;杨丽;黄梦珠;周琴;陈雷 - 迈凯基因科技有限公司
  • 2018-06-29 - 2019-08-06 - G16B50/00
  • 本发明实施例公开了一种非小细胞肺癌基因变异及药物解读多数据库交互系统,包括:非小细胞肺癌基因变异信息数据库、非小细胞肺癌药物治疗数据库以及非小细胞肺癌文献信息数据库;各数据库用于存储对应的数据;其中,非小细胞肺癌药物治疗数据库包括非小细胞肺癌基因变异与药物治疗批准信息数据库、非小细胞肺癌基因变异与药物治疗专家共识信息数据库以及非小细胞肺癌基因变异与药物治疗临床试验信息数据库。通过建立多数据库交互系统,能够存储非小细胞肺癌基因变异及药物相关数据,该交互系统数据量完善且易于使用。
  • 一种基于DNA编码化合物数据库的系统及其分析方法-201811394303.0
  • 郑明月;陆晓杰;刘小红;蒋华良;李召军 - 中国科学院上海药物研究所
  • 2018-11-21 - 2019-07-16 - G16B50/00
  • 本发明公开了一种基于DNA编码化合物数据库的系统,其特征在于,包括实体库模块、测序模块、解码模块和构效关系存储模块;所述实体库模块用于存储实体数据;所述测序模块用于筛选所述实体数据并对其测序,生成DNA编码文件;所述解码模块用于定义配置文件,解码所述DNA编码文件,生成解码文件并生成构效关系;所述构效关系存储模块用于存储所述构效关系。采用本发明的一种基于DNA编码化合物数据库的系统及其分析方法,提出一种快速且充分的解码方法及数据分析方法,具有更加快捷,高效,高质量的特点。
  • 一种疾病基因变异及药物解读多数据库交互系统及方法-201810700191.0
  • 杨达梅;杨丽;周琴;黄梦珠;陈雷 - 迈凯基因科技有限公司
  • 2018-06-29 - 2019-06-21 - G16B50/00
  • 本发明实施例公开了一种疾病基因变异及药物解读多数据库交互系统及方法,包括:基因变异和疾病信息数据库、药物治疗数据库以及疾病与变异文献信息数据库;基因变异和疾病信息数据库用于存储基因变异和疾病信息相关的数据;药物治疗数据库用于存储药物治疗相关的数据;疾病与变异文献信息数据库用于存储疾病与变异文献相关的数据;其中,药物治疗数据库包括疾病及基因变异与药物治疗批准信息数据库、疾病及基因变异与药物治疗专家共识信息数据库以及疾病及基因变异与药物治疗临床试验信息数据库。通过建立多数据库交互系统,能够存储基因变异及药物相关数据,该交互系统数据量完善且易于使用。
  • 一种药物基因组学分析系统-201910086122.X
  • 张暋;马新利;佘维;谷晓辉 - 郑州金域临床检验中心有限公司
  • 2019-01-29 - 2019-06-18 - G16B50/00
  • 本发明提供了一种药物基因组学分析系统,包括数据转化模块、数据分析模块和数据整合模块;数据转化模块用于接收MassARRAY下机结果,从所述下机结果中获取基因序列,并获得所述基因序列相对应的实验号、Rs号和基因分型结果;数据分析模块用于接收所述实验号、Rs号、基因分型结果和基因序列,并遵循药物‑基因规则,获得与基因相关联的药物信息;数据整合模块用于接收并整合临床信息和与基因相关联的药物信息。本发明提供的药物基因组学数据分析系统代替了人员对MassARRAY下机结果进行整理,以及对基因分型结果进行数据库、指南和文献的比对,同等条件下的分析速率是分析报告人员的数百倍,缩短了分析报告周期。
  • 一种用于干细胞制剂的生产存储管理系统及方法-201910117704.X
  • 赵进军;谷广其;杨桂花;赵宇飞;李张鹏 - 和携科技(北京)有限公司
  • 2019-02-15 - 2019-06-07 - G16B50/00
  • 本发明公开了一种用于干细胞制剂的生产存储管理系统,所述生产存储管理系统包括应用支撑模块和基础运行模块,其中,所述应用支撑模块由应用模块层和支撑模块层构成,所述基础运行模块由应用程序服务器、数据库和平台基础服务器层构成。本发明提供的生产存储管理系统和方法能够便捷高效地进行数据信息的录入和修改,确保能够保证客户干细胞能够第一时间进行采集和入库存储,优化了检测步骤和流程,使得采集后的干细胞检测更快速、高效和及时,显著降低了检测成本,避免了资源浪费。
  • 处理生物样本的方法以及分析系统-201410448599.5
  • B.冯阿尔曼 - 霍夫曼-拉罗奇有限公司
  • 2014-09-04 - 2019-05-21 - G16B50/00
  • 本发明涉及一种引导对分析系统(100)的计算机系统(101)的用户输入的方法,该分析系统(100)包含进行生物样本的分析的体外诊断(IVD)设备(107),该IVD设备(107)与计算机系统(101)耦合,该计算机系统(101)包含显示设备(113);处理器(103);以及配置成存储可在该处理器(103)上执行的多个应用(126)的存储器(105),其中多个应用(126)的第一应用(127)包含当被执行时,在显示设备(113)上生成第一图形用户界面(121)的指令;该第一应用(127)进一步包含当被执行时,控制IVD设备(107)执行IVD任务的指令;以及其中该存储器(105)进一步包含描述该组用户界面元素(A‑I)的每一个的显示位置的几何数据。
  • 生物序列指纹-201811255595.X
  • I·M·克尔曼;K·布里迪斯;S·马克尔;D·罗杰斯 - 达索系统美国公司
  • 2018-10-26 - 2019-05-07 - G16B50/00
  • 根据本发明的一个实施例,生物序列的特征被表示在包括位集合并且还可以包括针对所述特征的计数、字符串或连续值的指纹中。所述指纹能够与机器学习和统计方法一起使用。这对于(但不限于)药物发现过程而言是特别有利的。所述方法准许关于生物序列执行结构活性关系(SAR)和定量结构活性关系(QSAR)研究。
  • 用于基因产品的检索方法-201610687440.8
  • 刘杨 - 杭州布理岚柏科技有限公司
  • 2016-08-18 - 2019-05-07 - G16B50/00
  • 本发明提供了用于基因产品的检索方法,属于信息检索领域,包括构建同源基因数据库,获取待检索的关键词,确定与关键词对应的唯一特征标签,根据唯一特征标签,对关键词进行拓展,获取拓展关键词,根据拓展关键词进行网络检索。通过根据待检索的关键词获取唯一特征标签,基于唯一特征标签对关键词进行拓展处理,最终根据得到的拓展关键词进行全网检索,由于拓展关键词中包含了与待检索的关键词对应的多重限定,从而保证在互联网上能够搜索到与关键词关联性最强的资源,降低其他无关资源对搜索结果的干扰。
  • 利用云计算环境来共享生物相关数据的方法和系统-201480017580.3
  • 旻睿·理查·沈;查尔斯·林 - ILLUMINA公司
  • 2014-01-23 - 2019-04-12 - G16B50/00
  • 本公开提供了一种用于将各种信息(例如,协议、分析方法、样品制备数据、测序数据等)转移或分配给基于云的网络的新颖方案。例如,该技术涉及云计算环境(12),该云计算环境被构造成从一个或多个单独的样品制备装置(38)、测序装置(18)和/或计算系统接收该信息。该云计算环境(12)又可以生成供该云计算环境(12)使用的信息和/或将所生成的信息提供给所述装置以引导基因组分析工作流程。另外,该云计算环境(12)可以用来方便供通用样品制备盒使用的样品制备制备协议的共享和/或监测该样品制备协议的流行性。
  • 自动化引物选择方法及系统-201611032940.4
  • 周斌;李乐;熊艳文 - 华智水稻生物技术有限公司
  • 2016-11-15 - 2019-03-29 - G16B50/00
  • 本发明公开一种自动化引物选择方法及系统,能实现从标记(引物混合溶液)存储库中挑选需要的标记并使用的自动化。方法包括:获取需要使用的引物的混合溶液名称,得到混合溶液所在的存储盒的标签号、存储混合溶液的储存管在存储盒的存储位置以及储存管中混合溶液的存储量;获取使用量,在判断获知使用量不多于存储量与液体移液站能吸取的最少量与损耗量之和的差值且存储量多于最少量时,取出对应的存储盒,打开盒盖,放在适配器上,将引物反应板放在指定位置;将存储位置和使用量整理成清单,发送给液体移液站,使之吸取需要使用的引物的混合溶液,喷在引物反应板孔内;在吸取混合溶液完毕后,将存储盒放回原来位置,更新信息数据库。
  • 面向生物组学大数据计算的云平台系统及方法-201610413045.0
  • 唐碧霞;赵文明;朱军伟;王彦青 - 中国科学院北京基因组研究所
  • 2016-06-14 - 2019-03-26 - G16B50/00
  • 本发明公开了一种面向生物组学大数据计算的云平台系统及方法,涉及用于维护或管理的装置技术领域。所述系统包括系统管理模块、数据管理模块、应用程序管理模块、流程管理模块、任务管理模块、数据可视化操作模块以及用户与权限管理模块。所述云平台系统利用高性能计算集群系统的分布式计算和管理模式,并利用WEB技术及计算机远程调用、远程控制以及云计算等技术手段,实现与高性能计算集群系统的无缝连接,实现对大数据的管理与利用,并实现对生物组学大数据的在线、可视化、自由定制流程与工具的深度挖掘、分析与利用。系统可促进高性能集群计算系统在生物组学大数据领域的应用,也可促进生物组学大数据的深度挖掘、分析与产业化应用。
  • 基于代理的多尺度药物协同预测方法-201711156248.7
  • 章乐;高红杰 - 西南大学
  • 2017-11-20 - 2019-02-15 - G16B50/00
  • 本发明提出了一种基于代理的多尺度药物协同预测方法,通过建立药物间的协同模型,对药物的相互作用进行效果估算,具体包括:步骤1、实验数据的预处理;步骤2:建立细胞生存状态规则;步骤3:运用机器学习算法对模型中参数进行分步估计;步骤4:模型验证,利用真实数据集以及模拟数据集对模型进行测试,通过显著性差异分析药物协同预测模型的准确性;步骤5:利用药物协同指数对模型的准确性进行二次验证。本方法可以探索多种药物组合作用下对细胞生命状态的影响规律,以及药物的协同作用和协同强度的大小。
  • 化学试剂库存管理方法、电子设备及计算机可读存储介质-201810953579.1
  • 刘斌 - 苏州创腾软件有限公司
  • 2018-08-21 - 2019-01-29 - G16B50/00
  • 本发明实施例涉及一种化学试剂库存管理方法、电子设备及计算机可读存储介质,包括:向服务器发送领取请求,所述领取请求包括:化学试剂的信息、所述化学试剂的存储位置;对所领取的化学试剂上的识别标签进行识别,向所述服务器发送领取确认信息,所述领取确认信息中包含对所述化学试剂的识别标签进行识别的识别结果。本发明实施例提供的一种化学试剂库存管理方法、电子设备及计算机可读存储介质降低了化学试剂的管理成本,提高了管理化学试剂的效率。
  • 一种基于池化时间序列特征表示的细胞分裂事件识别方法-201710024820.8
  • 苏育挺;王珊;刘安安 - 天津大学
  • 2017-01-13 - 2019-01-29 - G16B50/00
  • 本发明公开了一种基于池化时间序列特征表示的细胞分裂事件识别方法,所述细胞分裂事件识别方法包括以下步骤:在样本数据库中,提取样本相关特征,将所有样本特征的集合定义为初始特征库;初始特征矩阵的每一横向维度为一个时间序列,将多种池化算子应用于时间金字塔结构,将池化后的结果级联为一个向量,作为样本的最终表示;分别计算训练集和测试集的核矩阵,应用支持向量机作为分类器,获取最终的预测结果。本发明避免了对序列的每一帧进行分析,而是将整个序列在空域和时域上联合作为整体,保留了帧与帧之间的时域关系,提高了序列分类预测结果,可以应用于多种视频序列内容分析。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top