[发明专利]利用多数据平台发现长链非编码RNA分子标志物运用ceRNA机制的方法及系统和应用在审

专利信息
申请号: 201910675977.6 申请日: 2019-07-25
公开(公告)号: CN110415764A 公开(公告)日: 2019-11-05
发明(设计)人: 陈瑞;恽俊;李晓波;高娜 申请(专利权)人: 东南大学
主分类号: G16B20/00 分类号: G16B20/00;G16B25/00;G16B50/30
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 柏尚春
地址: 211102 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种多数据平台发现长链非编码RNA分子标志物运用ceRNA机制的方法及系统和应用。基于TANRIC公共数据资源的直肠癌LncRNA测序数据,运用多样的生物信息学分析手段,对LncRNA表达数据进行分析处理,识别与直肠癌相关的LncRNA,对LncRNA相关ceRNA机制探究,最终形成LncRNA‑miRNA‑mRNA‑疾病互作图。本发明采用丰富多样的生物信息学手段,整合数据资源,建立一套完整的分析流程,可有效发现直肠癌相关LncRNA分子通过ceRNA机制发挥其生物效应,在此过程中利用了公共数据库高通量数据,降低科研成本,提高分析效率。本发明可发现多个风险LncRNA,对复杂疾病的生物靶向治疗、基因功能预测、ceRNA机制探究及基因生物效应与预后评估都有重要意义,可广泛应用于生物学研究工作中,也可用于临床相关应用。
搜索关键词: 直肠癌 分子标志物 非编码RNA 数据平台 应用 长链 发现 生物信息学分析 生物靶向治疗 公共数据库 生物信息学 生物学研究 表达数据 测序数据 分析处理 分析流程 分析效率 复杂疾病 公共数据 基因功能 基因生物 生物效应 数据资源 预后评估 重要意义 高通量 可用 整合 疾病 预测 科研
【主权项】:
1.一种利用多数据平台发现长链非编码RNA分子标志物运用ceRNA机制的方法,其特征在于:包括如下步骤:步骤1,样本数据下载和整理,获取LncRNA表达数据与其临床信息,选定目标疾病直肠癌和测序平台下载数据,数据包含癌样本、癌旁样本和对应的正常样本;步骤2,对LncRNA表达数据的差异表达分析;步骤3,将步骤2得到的LncRNA表达数据按照变化幅度排序,变化率越大的排名越靠前,筛选排名靠前的30个LncRNA作为相关LncRNA;步骤4,将步骤3筛选出的30个LncRNA表达数据与其对应样本的分期、转移、浸润等临床信息,进行生物信息统计学分析,进一步筛选与疾病发生发展相关具有统计学意义的LncRNA;步骤5,应用预测网站或软件预测LncRNA通过ceRNA机制调控的microRNA,并应用靶基因预测网站或软件作为预测靶基因的工具,获取靶基因,从而完成ceRNA调控网络的构建;步骤6,对靶基因进行功能分析并筛选出与疾病相关的条目,筛选出疾病相关靶基因;步骤7,对步骤6筛选出的疾病相关靶基因在样本数据中进行疾病相关生存分析,获取疾病预后相关靶基因;步骤8,将上述步骤1‑7中得到的数据进行合并,构建LncRNA‑miRNA‑mRNA‑疾病互作图。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910675977.6/,转载请声明来源钻瓜专利网。

同类专利
  • 利用多数据平台发现长链非编码RNA分子标志物运用ceRNA机制的方法及系统和应用-201910675977.6
  • 陈瑞;恽俊;李晓波;高娜 - 东南大学
  • 2019-07-25 - 2019-11-05 - G16B20/00
  • 本发明公开了一种多数据平台发现长链非编码RNA分子标志物运用ceRNA机制的方法及系统和应用。基于TANRIC公共数据资源的直肠癌LncRNA测序数据,运用多样的生物信息学分析手段,对LncRNA表达数据进行分析处理,识别与直肠癌相关的LncRNA,对LncRNA相关ceRNA机制探究,最终形成LncRNA‑miRNA‑mRNA‑疾病互作图。本发明采用丰富多样的生物信息学手段,整合数据资源,建立一套完整的分析流程,可有效发现直肠癌相关LncRNA分子通过ceRNA机制发挥其生物效应,在此过程中利用了公共数据库高通量数据,降低科研成本,提高分析效率。本发明可发现多个风险LncRNA,对复杂疾病的生物靶向治疗、基因功能预测、ceRNA机制探究及基因生物效应与预后评估都有重要意义,可广泛应用于生物学研究工作中,也可用于临床相关应用。
  • 基于鸽群优化算法识别关键蛋白质的方法-201910662124.9
  • 雷秀娟;杨晓琴;张宇辰 - 陕西师范大学
  • 2019-07-22 - 2019-11-01 - G16B20/00
  • 本发明公开了一种基于鸽子优化算法识别关键蛋白质的方法,通过将蛋白质相互作用网络转化为无向图、获取蛋白质对应的亚细胞定位信息以及功能注释信息、对蛋白质相互作用网络中结点和边进行处理、初始化鸽子位置、执行指南针操作、地标操作产生关键蛋白质。本发明方法能准确地识别关键蛋白质;仿真实验结果表明,灵敏度、特异性、F测度、阳性预测值、阴性预测值以及正确率等指标较优;与其他关键蛋白质识别方法相比,将鸽子算法的优化特性与蛋白质相互作用网络的拓扑特征以及蛋白质内在的生物特性进行结合来识别关键蛋白质,提高了关键蛋白质的识别准确率。
  • 一种基于旋转森林算法的miRNA-疾病相关性预测方法-201910710936.6
  • 王磊;闫欣 - 枣庄学院
  • 2019-08-01 - 2019-11-01 - G16B20/00
  • 本发明提供了一种新的融合多源信息的计算方法来预测miRNA与疾病之间的潜在关系,这些多源信息包括miRNA序列信息、miRNA功能相似性信息和疾病语义相似性信息和已知miRNA‑疾病关系信息。本发明首先根据miRNA功能相似性和疾病语义相似性分别计算miRNA与疾病的相似性矩阵,并将它们与高斯交互谱核相似性矩阵相结合来得到miRNA‑疾病的相似性描述符。其次,使用自然语言处理技术提取出miRNA序列的特征信息,并与miRNA‑疾病相似性描述符相融合,使用深度学习算法对融合信息的特征进行客观提取,挖掘出隐藏其中的高级抽象特征。最后,使用旋转森林分类器准确预测出潜在的miRNA‑疾病间关系。
  • 一种肝细胞癌可变剪接事件预后模型及其构建方法和应用-201910755282.9
  • 张东;段艺 - 段艺
  • 2019-08-18 - 2019-10-29 - G16B20/00
  • 本发明涉及一种肝细胞癌的可变剪接事件预后模型及其构建方法和应用。本发明系统地评估了肝细胞癌患者的预后可变剪接变异,构建了基于26个可变剪切事件的肝细胞癌可变剪接预后模型,进一步结合临床病理变量验证其独立预后能力,并获得了肝细胞癌患者总体生存相关的关键可变剪接事件。本发明研究结果表明,纳入最终可变剪接预后模型的候选事件与肝细胞癌调控有关,并且相关的关键事件可能作为肝细胞癌潜在的生物标志物或是治疗靶点,对破译肝细胞癌在肿瘤形成和发病机制的潜在机制上具有临床意义。
  • 一种基于整数组合的网络模体子树枚举和统计方法-201710939244.X
  • 骆嘉伟;李光辉;刘智明;王伟胜;蔡洁 - 湖南大学
  • 2017-09-30 - 2019-10-25 - G16B20/00
  • 本发明公开了一种基于整数组合的网络模体子树枚举和统计方法,该方法首先利用整数的组合操作设计一种有效的非导出子树的枚举方法;其次,通过在子树枚举的过程中同时搜索一个根树的方式对所枚举的子树进行一个部分的分类来有效减少子树同构的判断数目;最后,通过把所查找子树的规范化标记存储在内存中的方法来去除规范化标记的查询过程,有效地提高了子树计数的方式。本发明实现简单、快速,相比于现存的子树统计方法,MTMO方法在运行时间上具有较明显的性能加速,且能用于查找更大规模的子树。
  • 基于决策树与线性回归模型预测癌症合成致死基因对的方法-201910613818.3
  • 郭丽;殷子博;杨国伟;钱博文 - 南京邮电大学
  • 2019-07-09 - 2019-10-18 - G16B20/00
  • 本发明为基因预测领域,公开了基于决策树模型和线性回归模型的癌症合成致死基因对预测方法。本方法主要分为数据训练阶段和合成致死基因对测试阶段。步骤依次为,首先基于多组学数据中提取包含所有突变基因对覆盖率、DNA甲基化、mRNA表达谱、拷贝数变异数据作为模型特征值进行聚类、去除假阳性、归一化处理,并且训练决策树模型以及线性回归模型。其次,利用决策树模型和线性回归模型分别预测在多种癌症中可能存在的合成致死基因对,得出合成致死基因对在不同癌症中的分布图谱。最后,对比两种模型得出在泛癌中均存在的合成致死基因对508对。本发明能较准确的预测多种癌症中可能存在的合成致死基因对,为癌症的精准治疗提供依据。
  • 基因调控非线性动力系统的路径粒子群优化方法-201511004086.6
  • 王金鹤;翟畅;孟凡云 - 湖州师范学院
  • 2015-12-25 - 2019-10-15 - G16B20/00
  • 本发明涉及一种基因调控非线性动力系统的路径粒子群优化方法,令x(t)=(x1,x2,...,x14)T∈R14为状态变量,其允许集为x1,x2,...,x5分别表示细胞外生物量、甘油、1,3‑PD、乙酸、乙醇;x6,x7,...,x14分别表示细胞内甘油、3‑HPA的浓度、1,3‑PD的浓度、mR、自由调节蛋白浓度R、mGDHt、甘油脱水酶GDHt的浓度、mPDOR、1,3‑PD氧化还原酶PDOR的浓度。本发明通过优化算法给出了甘油歧化反应最可能的路径辨识,引入了新的细胞外相对误差的定义,得到的结果稳定性强,加入众多判别条件,使之与连续发酵实际问相题体切合,提高了运算效率和准确性。
  • 一种大规模标注lncRNA功能的方法-201610406692.9
  • 张祖平;邓磊;张敬普 - 中南大学
  • 2016-06-12 - 2019-10-01 - G16B20/00
  • 本发明公开了一种大规模标注lncRNA功能的方法,根据lncRNA‑蛋白质的共表达数据及相互作用数据、lncRNA的表达谱数据和蛋白质的相互作用数据,构建一个全局的异构无向图,通过Katz度量计算lncRNA顶点和蛋白质顶点的相似性,从而依据相似蛋白质的功能标注信息对未知的lncRNA进行功能标注。本发明与现有的技术相比,在考虑lncRNA‑蛋白质共表达信息的基础上,也整合了lncRNA‑蛋白质相互作用数据、lncRNA的表达谱数据和蛋白质的相互作用数据。独立测试表明,本发明预测的召回率、准确性和F‑measure都比其它的方法更高,效果更好。由于本发明是一种基于图的全局计算方法,所以可以一次标注出大量的lncRNA,有效的克服了以前局部方法一次只能标注少量lncRNA功能的问题。
  • 蛋白质序列数据库并行搜索鉴定方法与装置-201910604573.8
  • 李肯立;李闯;唐卓;陈建国;刘勇刚;李克勤;廖湘科 - 湖南大学
  • 2019-07-05 - 2019-09-24 - G16B20/00
  • 本申请涉及一种蛋白质序列数据库并行搜索鉴定方法、装置、计算机设备和存储介质,其中,方法包括:预处理待鉴定的实验质谱数据集和蛋白质序列数据库,对蛋白序列数据库中每条蛋白序列进行模拟酶切,获取理论质谱数据集;分别提取实验质谱数据集对应的每个实验质谱图的质谱峰,生成搜索查询集合,并根据搜索查询集合在蛋白质序列库中搜索理论质谱数据集,获取候选肽段序列集合;根据每个实验质谱图及其对应的候选肽段序列集合,生成候选肽段并打分;整合打分结果,并进行肽段到蛋白质的推断,得蛋白质鉴定结果,采用并行处理的方式显著提高蛋白质序列数据库搜索鉴定效率。
  • 一种基于LightGBM的circRNA鉴别方法-201910247423.6
  • 邓怡云;曾甜;戴宪华 - 中山大学
  • 2019-03-29 - 2019-09-17 - G16B20/00
  • 为克服现有技术的不足,本发明的目的在于利用lightGBM方法对于circRNA进行鉴别。主要步骤包括以下:(1)将大数据样本的circRNA以(.bed)文件形式输入,其中包含染色体号、序列起始位点、正负链标记。(2)将circRNA(.bed)文件根据起始位点等相关信息映射到全人类基因组(hg19版本)上,得到circRNA序列信息(.fasta)文件。(3)提出了一种特征融合算法,用于提取circRNA形成过程的相关特征。(4)根据lightGBM算法,利用其中的GOSS与EFB分别进行样本数据的采样和特征抽样,使用Histogram‑based算法将连续的特征映射到离散的buckets中,组成多个的bins,利用多个bins建立直方图。即将连续变量离散化。(5)调整树的最大深度max_depth、叶子可能具有的最小记录数min_data_in_leaf、每次迭代时用的数据比例bagging_fraction等参数,获取模型最佳参数。
  • 基于网络表示学习的表型关联关系分析方法-201910501477.0
  • 彭佳杰;惠薇薇;管姣姣;尚学群 - 西北工业大学
  • 2019-06-11 - 2019-09-17 - G16B20/00
  • 本发明公开了一种基于网络表示学习的表型关联关系分析方法,用于解决现有表型方法准确度差的技术问题。技术方案是以蛋白质交互网络为载体,将表型映射到网络中作为子网,向量化表示表型子网,并作为表型的特征向量,利用提取到的表型特征,计算表型特征之间的欧氏距离作为表型之间的相似度。该方法可以更好的挖掘出表型的特征,更全面的衡量表型之间的相似度,进行准确的表型关联关系分析。本发明使用蛋白质交互网络,将网络表示学习应用于表型研究,为网络的每一个表型子网生成特征向量来进行表型关联关系分析,提高了表型关联关系分析的能力。实验表明,本发明不仅能够很好的预测表型之间的关系,还可以为表型生成特征向量,表型方法准确度好。
  • 一种评估微生物群落宏基因(或普通生物群落宏遗传)多样性和相似性的概念和方法-201810159081.8
  • 马占山;李连伟 - 中国科学院昆明动物研究所
  • 2018-02-11 - 2019-09-06 - G16B20/00
  • 本发明公开了一种评估微生物群落宏基因(或普通生物群落宏遗传)多样性和相似性的概念和方法,包括用Hill numbers度量单基因水平(Metagenomic Gene:MG)和功能基因群(Metagenomic Functional Gene Cluster:MFGC)水平的宏基因多样性及其相似性。其中多样性包括alpha‑宏基因多样性、beta‑宏基因多样性和gamma‑宏基因多样性,相似性用于比较两个或两个以上群落宏基因多样性。宏基因多样性指数能有效评估和监测人体、动物以及环境微生物群落的宏基因多样性和相似性,并为菌群相关疾病的研究和诊断治疗以及环境微生物宏基因监测提供科学依据和技术体系。本发明同样适用于宏遗传多样性(Metagenetic Diversity),可用于评估和监测任何生物群落的宏遗传多样性和相似性。
  • 一种数据处理装置及数据处理方法-201610462727.0
  • 许进 - 北京大学
  • 2016-06-23 - 2019-09-06 - G16B20/00
  • 本发明提供一种数据处理装置及其处理方法,其中,处理指令输入模块连接控制器,控制器连接所述第一开关和第二开关;控制器根据处理指令输入模块输入的处理指令向第一开关和第二开关发送第一指令和第二指令,使第一容器中预存的第一反应物进入第三容器,第二容器内预存的第二反应物进入第三容器中,与第一反应物在第三容器中预存的反应介质作用下反应成聚合体,控制检测器检测聚合体,根据检测结果确定聚合体是否为处理结果。该装置及方法只需要一次运算即可求出问题的全部解,处理效率高。
  • 基于Caffe的堆栈降噪自编码基因信息特征提取的方法-201610600542.1
  • 余孟春;何庆瑜;特伦斯·古力;谢清禄;闫磊 - 广州麦仑信息科技有限公司
  • 2016-07-27 - 2019-08-30 - G16B20/00
  • 本发明公开了基于Caffe的堆栈降噪自编码基因信息特征提取的方法,该基于Caffe的堆栈降噪自编码基因信息特征提取的方法具体步骤如下:S1:数据准备,S2:搭建基于Caffe的堆栈降噪自编码基因特征提取模型,S3:逐层训练堆栈降噪自编码基因特征提取模型,S4:使用有标签基因数据微调堆栈降噪自编码基因特征提取模型,S5:使用训练好的基因特征提取模型搭建基因性状识别系统,本发明的技术方案采用深度学习的算法框架,在图像特征提取的基础上,通过训练分类识别模型,以此可进行对待测基因的特征提取和进一步的分类识别。
  • 测序数据读段重新比对的方法-201780077066.2
  • G·贝里;庄瀚宇;J·戈登;陈晓;S·坦纳 - 宜曼达股份有限公司
  • 2017-11-15 - 2019-08-23 - G16B20/00
  • 本发明涉及测序数据读段重新比对。一种方法是从序列比对数据集获得读段序列与参考序列的初始比对,并对所述初始比对进行重新比对处理。重新比对处理包含鉴定候选插入缺失,所述候选插入缺失包含比对读段中的零或多个插入缺失以及在比对读段近端比对的零或多个插入缺失,如序列比对数据集指示;至少基于从比对读段中去除由初始比对指示的任何插入缺失来创建扁平化比对读段;并基于针对候选重新比对中的每个候选重新比对将候选插入缺失中的至少一个相应候选插入缺失引入扁平化比对读段来确定读段序列与参考序列的候选重新比对。所述方法进一步基于选择标准来提供初始比对或候选重新比对中的所选候选重新比对。
  • 基于基因检测后报告系统模块解锁功能的处理方法-201910219922.4
  • 董扬;许则滩;王超君;段胜常;吕杨眉 - 云南纳博生物科技有限公司
  • 2019-03-21 - 2019-07-09 - G16B20/00
  • 本发明公开了一种基于基因检测后报告系统模块解锁功能的处理方法,包括以下步骤:(1)通过基因检测获取受检者的遗传信息;(2)比对基因库中相关数据,获取与所述遗传信息相对应的表征信息;(3)将基因信息与表征信息录入报告系统,生成相应的基因检测报告;所述基因检测报告包括开放状态报告、锁定状态报告;所述开放状态报告为用户已支付过的报告,锁定状态报告为用户未支付过的报告,用户可以在登陆状态后从报告系统中查看开放状态报告的内容、未支付的关联的锁定状态报告名称和图标和锁定状态;所述锁定状态报告可以通过在报告系统中支付费用后解锁查看,大大降低了整体检测成本和时间,可用于基因检测报告服务的推广。
  • 一种转录组和代谢组数据关联分析方法及系统-201910176587.4
  • 夏昊强;周煌凯;高川;张羽;陶勇;罗玥;邢燕;张秋雪 - 广州基迪奥生物科技有限公司
  • 2019-03-08 - 2019-07-05 - G16B20/00
  • 本发明公开了一种转录组和代谢组数据关联分析方法及系统,所述方法包括如下步骤:步骤S1,对样本进行转录组测序,并对转录组数据进行生物信息分析,获得差异表达基因;步骤S2,对样本进行代谢组测序,并对代谢组数据进行生物信息分析,获得差异代谢物;步骤S3,基于获得的差异表达基因和差异代谢物进行生物信息分析关联特征,通过本发明,解决现有技术中单个组学测序的数据存在片面性和部分数据不可靠性的问题,同时,于本发明中生物分子之间通过信息传递,配合协调,最终呈现出特定的功能,从而本发明的多组学整合分析更为系统,更有利于揭示复杂的功能机制。
  • 用于数据智能化的活化文件格式及数据活化方法-201910141167.2
  • 朱小军;肖列 - 杭州来布科技有限公司
  • 2019-02-26 - 2019-06-28 - G16B20/00
  • 本发明涉及一种用于数据智能化的活化文件格式及数据活化方法。活化文件格式包括头部区域、染色体蛋白质区域、细胞体区域,其中,头部区域用于表述活化文件的文件属性信息;染色体蛋白质区域包括DNA数据和蛋白质数据,DNA数据用于表述数据的静态特征,蛋白质数据用于表述数据的动态状态;细胞体区域为数据正文内容。本发明的文件格式使数据具有活性,活化文件本身即具有自己的属性信息,根据这些文件属性信息可实现数据的传播宽度控制、传播广度控制、撤回控制、读取权限控制等,从而实现数据的智能化控制,提高数据管理水平。
  • 一种预测蛋白质-RNA相互作用位点的方法-201910166376.2
  • 魏彦华 - 中南大学
  • 2019-03-06 - 2019-06-28 - G16B20/00
  • 本发明公开了一种研究蛋白质‑RNA相互作用位点预测的方法,根据蛋白质‑RNA复合物的多种特征数据组合成一个复杂的、多维的特征集,然后通过特征选择算法选出权重大的有效特征,最后通过机器学习算法来预测蛋白质‑RNA相互作用位点。本发明与现有的技术相比,融合了更多、更有效的特征,使用了更先进的算法,选出了更有效的特征,除了考虑实验证实的蛋白质‑RNA相互作用位点的预测外,还可以集成更多的数据例如蛋白质‑DNA相互作用位点等。本发明通过融合更有效的算法、更多的特征数据可以比以前的技术更准确的预测出蛋白质‑RNA相互作用位点,并且可以大规模的一次预测出多对蛋白质‑RNA相互作用位点,有效的解决了生物实验方法的盲目性、成本高的问题。
  • 一种将生物基因以特定的性状进行分类与自我识别的方法-201610399253.X
  • 闫磊;谢清禄;余孟春 - 广州麦仑信息科技有限公司
  • 2016-06-07 - 2019-06-25 - G16B20/00
  • 本发明涉及生物信息技术领域,具体涉及一种将生物基因以特定的性状进行分类与自我识别的方法,它采用如下的方法步骤;步骤一:Caffe深度学习框架运行环境的搭建;步骤二:生物基因信息数据的准备;步骤三:生物基因性状识别模型的建立;步骤四:生物基因性状识别模型的训练;步骤五:对未知性状基因信息进行识别;它采用深度学习算法,构建一个对生物基因信息识别并找出与对应性状之间联系的模型,然后使用这个模型对未知性状的基因信息进行识别,它具有能够更方便及智能的进行基因的对应性状分类,对未知性状的基因进行自我识别的优点。
  • 用于遗传病基因诊断检测的审核方法及装置-201710371620.X
  • 王家健;陶然;胡朝晖;王永松 - 海南金域医学检验中心有限公司
  • 2017-05-24 - 2019-06-25 - G16B20/00
  • 本发明公开的用于遗传病基因诊断检测的审核方法根据接收到的对待审核项目的审核指令,开始判断所述项目的检测系统和患者信息是否符合预设的审核条件;若符合,则确定所述匹配项目的查找范围;若所述匹配项目的查找范围仅限于同一条码,则在第一数据库内查找所述匹配项目的病理结果,若匹配项目的查找范围扩大至不同条码下时,先查找第一数据库内同一条码下的匹配项目,当第一数据库内查找不到同一条码下的匹配项目时,开始查找第二数据库内不同条码下的匹配项目,根据预设的待审核项目和匹配项目的矛盾条件,获得所述待审核项目的病理结果的审核结果,在很大程度上减少人工分析和比对的投入,减少出错率,提高审核的效率。
  • 基于混沌博弈算法的miRNA-疾病相关性预测方法-201910091125.2
  • 郑凯;尤著宏;周勇;李政伟;詹朝惠 - 中国矿业大学
  • 2019-01-30 - 2019-06-21 - G16B20/00
  • 本发明公开了一种基于混沌博弈算法的miRNA‑疾病相关性预测方法,包括数据集的选择与建立,疾病语义相似矩阵、疾病高斯相似矩阵、miRNA高斯相似矩阵的生成,相似矩阵的融合,混沌博弈算法提取特征值,训练集和测试集的构建,分类器模型构建步骤完成,该方法是利用混沌博弈算法处理序列样本集的特征并得到特征值,使数据集的信息量大为增加;本发明能够利用宽度学习的方法构建模型,大大提高了预测精度,能够得到比较好的预测效果;本发明方法计算代价低,功耗小。
  • 一种提取蛋白质-小分子相互作用模块的方法-201510493825.6
  • 梁治;牛立文;滕脉坤;何巍 - 中国科学技术大学
  • 2015-08-12 - 2019-06-21 - G16B20/00
  • 本发明涉及一种提取蛋白质‑小分子相互作用模块的方法,具体是将蛋白质上构成小分子结合口袋的原子(或氨基酸)根据其性质进行定量化描述,然后对两两口袋原子(或氨基酸)之间的距离进行评估,建立距离矩阵,再利用聚类算法抽提出性质相似的口袋原子(或氨基酸)类别,最后通过后处理,获得蛋白质‑小分子相互作用模块。可应用于生物信息学研究、蛋白质设计、药物筛选、小分子化学合成等多个方面。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top