[发明专利]基于云平台的生物信息分析系统在审

专利信息
申请号: 201710598332.8 申请日: 2017-07-21
公开(公告)号: CN107239675A 公开(公告)日: 2017-10-10
发明(设计)人: 郭权;余果;任一;张磊;周勇;张祥林;黄华生 申请(专利权)人: 上海桑格信息技术有限公司
主分类号: G06F19/10 分类号: G06F19/10;H04L29/08
代理公司: 上海恒锐佳知识产权代理事务所(普通合伙)31286 代理人: 黄海霞
地址: 201321 上海市浦*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于云平台的生物信息分析系统,包括云平台客户端、云平台web服务器和云平台计算系统,云平台客户端和云平台web服务器之间通过网络收发信息,云平台web服务器和云平台计算系统通过Nginx网页服务器交换数据;云平台web服务器包括生物信息分析请求接口,云平台计算系统包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库和Mongo数据库;生物信息分析请求接口通过Nginx网页服务器连接至生物信息分析应用接口,生物信息分析应用接口的输出端通过工作流进程管理单元连接至生物信息分析组件。本发明的分析程序模块化,可组合复用,分析效率大为提高,部署方便。
搜索关键词: 基于 平台 生物 信息 分析 系统
【主权项】:
基于云平台的生物信息分析系统,其特征在于,包括云平台客户端、云平台web服务器和云平台计算系统;所述云平台客户端和所述云平台web服务器之间通过网络收发信息,所述云平台web服务器和所述云平台计算系统之间通过Nginx网页服务器交换数据;所述云平台web服务器包括生物信息分析请求接口;所述云平台计算系统包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库和Mongo数据库;所述云平台计算系统还包括若干计算节点,用于对生物信息进行分析计算;所述生物信息分析请求接口通过所述Nginx网页服务器连接至所述生物信息分析应用接口,所述生物信息分析应用接口的输出端通过工作流进程管理单元连接至所述生物信息分析组件的输入端,所述生物信息分析组件的输出端分别连接至所述存储服务器、Mysql数据库和Mongo数据库;所述生物信息分析请求接口向所述生物信息分析应用接口发出生物信息分析请求并发送参数;所述存储服务器用于存储分析结果数据,所述Mysql数据库用于存储分析记录、状态和日志信息,所述Mongo数据库用于存储供所述云平台客户端展示的图表数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海桑格信息技术有限公司,未经上海桑格信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710598332.8/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于口腔微生物群落获得儿童个体生物年龄的方法-201510213461.1
  • 滕飞;杨芳;黄适;徐健 - 中国科学院青岛生物能源与过程研究所
  • 2015-04-30 - 2018-12-21 - G06F19/10
  • 本发明提供一种基于口腔微生物群落获得儿童个体生物年龄的方法,所述方法包括获得含有所述儿童个体口腔微生物的样品;提取口腔微生物的DNA;将所述DNA信息转化为微生物群落信息,利用随机森林算法,对口腔微生物群落信息与年龄进行回归分析,构建回归模型,获得所述中国人群儿童个体年龄。本发明提供的方案能准确地获得中国人群儿童个体的生物年龄,可以无侵害性、简单、快捷的获得口腔唾液或牙菌斑样品,对儿童个体年龄进行长期检测,这将有利于快速判断宿主此时生理健康状态,为健康监测提供线索,同时提高疾病早期诊断速度。
  • 多物种特征选择及鉴定未知基因的方法-201610806928.8
  • 鲁志;胡龙 - 清华大学
  • 2016-09-06 - 2018-11-23 - G06F19/10
  • 本发明公开一种多物种特征选择及鉴定未知基因的方法,属于生命科学领域。所述多物种特征选择的方法,包括对覆盖全基因组的小片段区域进行特征赋值和贴注标签处理及物种内、物种间特征选择部分。本发明依靠整合不同物种间的基因共性来构建高效、准确的计算方法,用于准确鉴定和描述未知基因。
  • 对样本免疫组库测序数据进行处理的方法和系统-201510178224.6
  • 张伟;刘晓;杜元平;王长希 - 深圳华大基因科技有限公司
  • 2015-04-15 - 2018-11-13 - G06F19/10
  • 本发明公开了对样本免疫组库测序数据进行处理的方法和系统,其中该方法包括:(1)对样本的免疫组库测序数据进行数据过滤处理;(2)将经过数据过滤处理的测序数据进行序列拼接处理;(3)将经过序列拼接处理的测序数据进行局部比对;(4)将局部比对结果进行重比对;(5)从重比对结果中筛选出得分最高的结果并进行过滤;(6)将所述最终比对结果进行纠错处理;(7)基于经过纠错处理的最终比对结果,进行序列结构确定和翻译。利用该方法能够有效实现大数据量的免疫组库测序数据分析,能够同时满足TCR和BCR数据的分析,且能够有效处理PCR和测序错误,准确性高,可重复性好,从而能够真实有效地反映免疫组库整体情况。
  • 基于集成的相似性度量和双向随机游走的药物重定位方法-201510991455.9
  • 罗慧敏;夏红;王建新;罗军伟 - 中南大学
  • 2015-12-25 - 2018-08-31 - G06F19/10
  • 本发明公开了一种基于集成的相似性度量和双向随机游走的药物重定位方法,集成相似性度量方法在计算药物相似性、疾病相似性时,除了分别利用药物特性信息与疾病特性信息,还充分考虑了当前数据集中已知药物‑疾病关联信息对相似性度量的作用,使得所计算的相似性值能够更好的反映药物间的相似度和疾病间的相似度。在此基础上,构建了药物‑疾病异构网络,基于该异构网络,采用双向随机游走算法为所有的药物预测候选疾病。本发明简单有效,通过与其他方法比较,及在多个数据集上测试表明,该发明在药物重定位方面具有较好的预测性能。
  • 获取纤维化的特征量化参数的值的方法及装置-201510505151.7
  • 戴其尚;滕霄;卢艳强 - 杭州筹图科技有限公司
  • 2015-08-17 - 2018-08-28 - G06F19/10
  • 本发明实施例提供了获取纤维化的特征量化参数的值的方法与装置,通过将特征数据库作为统一客观的标准,对生物切片的检测样本的检测样本图像进行分析,输出能够描述该生物切片的纤维化的病因的特征量化参数的值,经过大量数据验证得到的特征量化参数是受纤维化的病因影响显著的参数,特征量化参数的值不同,可以反应导致纤维化的不同病因,因此,病理医生可以根据特征量化参数的值来评估纤维化的病因,这样不仅避免了由于病理医生的个体差异所导致的对纤维化病因的评估差异,也避免了常规方法通过染料给生物切片带来的不利影响。
  • 用于管理基因序列的方法和装置-201410599394.7
  • 丁建栋;朱俊;黄胜;张亚楠;严骏驰 - 国际商业机器公司
  • 2014-10-30 - 2018-08-17 - G06F19/10
  • 本发明提供了用于管理基因序列的方法和装置。在一个实施方式中,提供了一种用于确定第一基因序列与第二基因序列之间的相似性的方法,包括:分别在第一基因序列和第二基因序列上移动预定长度的滑动窗口;在滑动窗口的第i次移动期间,提取所述第一基因序列在所述滑动窗口内的第一部分、和所述第二基因序列在所述滑动窗口内的第二部分;以及基于第一部分和第二部分确定第一基因序列与第二基因序列之间的相似性。在其他实施方式中,还用于压缩基因序列的方法、以及用于对经压缩的基因序列进行解压缩的方法。采用本发明,可以以更加适合于基因序列的自身特点的方式来度量两个基因序列之间的相似性,还可以基于该相似性来找到参考数据库中的最为匹配参考基因序列,并压缩基因序列。
  • 林果树固有特性的测试方法-201511009244.7
  • 许林云;林欢;宣言;周维飞;周宏平 - 南京林业大学
  • 2015-12-29 - 2018-08-17 - G06F19/10
  • 本发明提供一种能够准确地测定出林果树存在扭转振动情况下固有特性的测试方法。该方法是对林果树树干施加一个瞬时外力,使得林果树做衰减振动,对林果树树干的位移数据进行采集,得到位移‑时间响应曲线;当位移‑时间响应曲线的外包络线呈周期性的起伏变化时,林果树的阻尼比固有频率A1表示位移‑时间响应曲线中的某个峰值;Anm+1表示位移‑时间响应曲线中的从A1峰值开始计数的第nm+1个峰值,n为自然数,m为外包络线的一个周期所包含的位移‑时间响应曲线的波峰或波谷的个数;A1、Anm+1均为正峰值或者均为负峰值,且|A1|>|Anm+1|;t1、t2表示位移‑时间响应曲线达到任意两个相邻的波峰或波谷的时间。
  • 一种基于云平台的大数据分析装置-201510626221.4
  • 李国庆;陈刚;芦长欣 - 深圳华大基因科技服务有限公司
  • 2015-09-28 - 2018-07-24 - G06F19/10
  • 本发明公开了一种基于云平台的大数据分析装置,包括云服务模块,获取生物数据,并存储获取的生物数据;数据匹配模块,动态设定关键词,从云服务模块中采集与设定的关键词相匹配的生物数据;数据分类模块,对采集的生物数据进行分类,并存储到相应的数据库中;数据分析模块,将数据库中存储的生物数据依次进行信息分析、领域分析、关系挖掘分析,得到分析结果和分析流程框架,并依据分析结果建立数据索引表;显示模块,调用得到的分析结果和分析流程框架,显示分析结果和分析流程框架,并将分析结果和分析流程框架上传至云服务模块。采用本发明实施例,分析效率高,分析结果清晰,易读性好,且便于用户分享。
  • 基于生物云平台的微生物多样性分析系统-201511017526.1
  • 郑洪坤;孔关义;杨男 - 北京百迈客生物科技有限公司
  • 2015-12-29 - 2018-06-19 - G06F19/10
  • 本发明公开一种基于生物云平台的微生物多样性分析方法及系统,能够提高微生物多样性分析的效率。方法包括:从云端数据库中获取用户指定的路径对应的测序数据;利用所述路径和预设的参数生成配置文件和任务执行命令;基于所述任务执行命令,利用所述配置文件对所述测序数据进行基本分析,并在基本分析结束后,将基本分析的结果以报告和/或图表的形式进行展示。 1
  • 生物学数据分析方法和系统-201410432465.4
  • 王莹莹;蔡云鹏 - 深圳先进技术研究院
  • 2014-08-28 - 2018-06-15 - G06F19/10
  • 本发明涉及计算机分析高维度生物学数据的技术领域,特别是涉及一种生物学数据分析方法和系统。本发明的方法包括:接收原始数据,并将原始数据转换为矩阵形式,行代表特征,列代表样本;根据原始数据的技术领域查找背景知识数据;依据所述背景知识数据的数据特点进行分类,构建不同类型的本体论知识库和/或数据集;判断所述本体论知识库和/或数据集的所属类型,根据所述类型选择对应的特征筛选步骤;执行选择的特征筛选步骤,获得预筛选的结果。本发明为高维度生物学数据的分析提供一种新的兼顾统计、生物学意义的特征预筛选方案。 1
  • 一种二代测序数据的压缩方法-201410776713.7
  • 严志祥;杨洁;操利超;游丽金;张勇;周欣 - 深圳华大基因研究院
  • 2014-12-15 - 2018-05-29 - G06F19/10
  • 本发明公开了一种二代测序数据的压缩方法。方法包括:对每个样本的二代测序数据,根据第一预设长度进行分割,生成BSSL初始文件;根据第二预设长度构建切割标签文件;根据切割标签文件对BSSL初始文件进行处理,获得BSSL中间文件;将BSSL中间文件合并得到BSSL最终文件;统计BSSL最终文件中种子序列的频次分布结果,根据结果得到种子文件;结合测序数据的格式特征,确定压缩规则,基于种子文件,对每个样本的二代测序数据进行压缩。本发明通过将二代测序数据进行分割以并行处理,提高处理速度,同时结合种子序列选择并得到种子文件,根据二代测序数据的格式特征和种子文件对二代测序数据进行压缩,从而可将二代测序数据的存储空间大大缩小。
  • 一种心肌病基因数据处理方法及装置-201410827322.3
  • 周丰丰;孙国权;麦国琴 - 深圳先进技术研究院
  • 2014-12-25 - 2018-05-04 - G06F19/10
  • 本发明实施例公开了一种心肌病基因数据处理方法及装置,其中所述心肌病基因数据处理方法包括获取样本基因表达谱;对样本基因表达谱进行分析,以获取对应的基因数据,各个基因数据包括若干基因的基因表达量;获取预先设定的筛选算法;通过筛选算法,在基因数据中筛选出共表达基因对数据;确定共表达基因对数据为心肌病生物标志物。采用本发明实施例,将共表达基因对数据确定为心肌病生物标志物,可以提高心肌病患者的识别精准度。
  • 基于Memetic算法的微生物发酵控制优化方法-201510469590.7
  • 彭建升 - 莆田学院
  • 2015-08-04 - 2018-05-01 - G06F19/10
  • 本发明公开了一种基于Memetic算法的微生物发酵控制优化方法,包括以下步骤建立微生物发酵数据集、构建BP神经网络、使用所述训练数据集对BP神经网络进行训练、对微生物发酵控制参数进行二进制编码、执行交叉算子、采用爬山算法执行局部搜索算子、执行变异算子、再次执行局部搜索算子,将选出的较优个体作为当前解、以步骤四中训练合格的BP神经网络作为适应度函数,计算群体中每个个体的适应度值,然后通过选择算子,对群体进行更新、从新的种群中寻找最优的个体并记录最优的控制参数组合。本发明可根据现有的发酵数据获取取最优的控制参数组合,不需要重新设计实验。
  • 通过模块化选择实现的生物信息项目自动分析方法及系统-201410742403.3
  • 苏海桥;蔡雄颖;唐启覃;李卡麟;郑媛;周良风;梁绍光;陈勇;刘娜;李国庆 - 深圳华大基因科技服务有限公司
  • 2014-12-08 - 2018-04-24 - G06F19/10
  • 公开了一种通过模块化选择实现的生物信息项目自动分析方法,包括步骤创建项目并存于业务管理系统中,每个项目包括多个子项目;由用户根据子项目和任务信息直接选择所述创建项目中需要的分析模块;当子项目的类型为标准化子项目,则子项目对应的样品在经测序仪测序的同时,供用户选择对该样品创建一种或多种的模块化的标准流程分析,且由用户根据当前子项目的样品情况、测序类型、分析目的选择匹配的过滤模块及输入对应的比对参数;经测序仪测序完成后,根据所述过滤模块及比对参数对每一样品数据进行过滤,从而去掉不符合比对参数的样品数据;然后再运用所创建的标准流程分析模块对符合比对参数的每一样品数据进行分析,生成分析结果。
  • 生物信息项目的自动化分析方法及系统-201410742375.5
  • 苏海桥;董博;徐伟玲;石俊杰;黄泽辉;梁绍光;刘娜;李国庆 - 深圳华大基因科技服务有限公司
  • 2014-12-08 - 2018-04-24 - G06F19/10
  • 公开了一种生物信息项目的自动化分析方法,包括步骤创建项目并存于业务管理系统中,每个项目包括多个子项目;当子项目的类型为只过滤子项目,即根据预设的参数配置运用统一的过滤标准对经测序仪测序完成后的样品下机数据进行过滤与分析,生成分析结果;当子项目的类型为标准化子项目,则该子项目对应的样品在经测序仪测序的同时,对该样品创建标准流程分析,且在创建每个标准流程分析过程中由用户根据当前子项目的样品情况输入对应的过滤参数;经测序仪测序完成后,先根据输入的过滤参数过滤掉部分样品数据,然后运用所创建的标准流程分析对剩下的每一样品数据进行过滤与分析,生成分析结果。
  • 基于生物云平台的项目结题报告分析系统和方法-201410555641.3
  • 郑洪坤;刘戈;刘敏 - 北京百迈客生物科技有限公司
  • 2014-10-17 - 2018-04-17 - G06F19/10
  • 本发明公开了基于生物云平台的项目结题报告分析系统和方法,系统包括结题报告解析,对各个项目的结题报告进行解析,并将解析结果以及原始数据整合封装成相应的项目文件;结题报告呈现模块,查询所有的项目文件并以列表形式展示,将某个项目按照预设样式显示;综合分析模块,接收用户界面模块发送的用户请求并生成分析任务,按照分析任务的指示进行分析,并将分析结果发送给结题报告呈现模块;结题报告呈现模块,还从项目文件列表中查询并读取项目文件对应的分析结果,并对项目文件以及相应的分析结果进行展示。通过将结题报告的内容、原始数据和分析软件集成到一个页面中,使用户在查看结题报告的同时查看原始数据并进行分析,提高工作效率。
  • 药物代谢酶代谢型评估方法-201711204791.X
  • 马超 - 慧算医疗科技(上海)有限公司
  • 2017-11-27 - 2018-04-06 - G06F19/10
  • 本发明提供一种药物代谢酶代谢型评估方法,包括步骤S1自预设基因数据库获取基因的单倍型变异型等位基因命名并形成基因信息表;S2根据基因信息表获双倍型变异型等位基因命名序列;S3形成代谢型获得代谢型信息表;S4根据基因检测结果获得位点双倍型命名表;S5获得第一单倍型变异型等位基因命名序列;S6根据各单倍型变异型等位基因酶活性获得第二单倍型变异型等位基因命名序列;S7自第二单倍型变异型等位基因命名序列获得双倍型变异型等位基因命名结果;S8自代谢型信息表检索获得代谢型检测结果。本发明的一种药物代谢酶代谢型评估方法,可准确判断基因代谢型,在药物代谢酶基因检测与个性化用药方面具重要意义。
  • 一种利用计算机鉴定免疫固定电泳M蛋白成份的方法-201510022062.7
  • 谢松业;谢婧;刘庆中;栾超琦;黄盛;葛永新;陆元善;俞华;丁星;陈频 - 上海市第一人民医院
  • 2015-01-16 - 2018-03-30 - G06F19/10
  • 本发明属于临床鉴別诊断领域,具体涉及一种利用计算机鉴定免疫固定电泳M蛋白成份的方法和系统。本发明通过采集免疫固定电泳后的样本图片经电脑扫描后转换形成六幅峰状电泳图谱,采用不同的颜色把六幅电泳图合并为一张电泳图,先找到M蛋白带,再根据其它5个不同组分的图像信息进行综合匹配处理。本发明采用计算机编程可对免疫固定电泳图谱中血清蛋白电泳及各组分实现自动识别、分类、综合分析给出正确鉴别结果。利用计算机鉴定免疫固定电泳M蛋白成份的方法经临床应用准确度96%,统计学上和传统方法比较无显著性差异,大大避免了目前传统方法还在用肉眼判断免疫固定电泳M蛋白分型的主观误差,为临床实验室带来了极大方便。
  • 一种生物信息学高性能信息化管理系统及数据处理方法-201610520386.8
  • 魏霖静 - 魏霖静
  • 2016-07-05 - 2018-01-12 - G06F19/10
  • 本发明涉及一种生物信息学高性能信息化管理系统及数据处理方法,包括服务器模块,所述服务器模块通过Internet网络分别电性连接信息采集模块与云计算模块,且所述服务器模块连接预算模块,所述信息采集模块内设有样品分配单元、样品检测单元、器材管理单元与标记单元,所述标记单元连接样品分配单元,所述样品分配单元连接样品检测单元,所述服务器模块内设有操作软件,所述操作软件包括人机交互界面,人机交互界面内设有数据更新单元,所述数据更新单元一侧设有用户管理单元,所述用户管理单元一侧设有同步区单元,所述同步区单元一侧设有归纳分类单元,所述归纳分类单元下方设有预览单元,实现了生物信息学大数据的分类管理与计算,提高工作效率。
  • 疾病易感风险预测装置-201510442836.1
  • 曹鑫恺;王立山;臧卫东;宋伟 - 上海尔云信息科技有限公司
  • 2015-07-24 - 2018-01-12 - G06F19/10
  • 本发明涉及生物信息学,提供了一种疾病易感风险预测方法及装置。本发明的疾病易感风险预测方法包括提供包含疾病的发病率数据、SNP位点基因型频率数据、针对每个疾病相关SNP位点的风险等位纯合基因型及杂合基因型的OR值数据的数据库;接收待测个体的信息;计算获得待测个体所感兴趣疾病的疾病综合易感风险数组;生成指定年龄范围的个体疾病综合易感风险动态变化曲线。本发明同时考虑个体遗传和环境两个方面的因素计算个体疾病易感性风险,计算结果更符合客观现实,获得的针对个体的疾病易感性风险年龄变化曲线,使得个体不仅能够获悉更为精确的即时疾病易感风险,同时也能够继续了解伴随年龄增长后各类疾病易感性变化的趋势。
  • 基于计算云平台的微生物多样性交互分析系统及其方法-201710598335.1
  • 余果;任一;郭权;王兆月;董亚晨;刘林梦;赵建华;杨慧;宣红东 - 上海桑格信息技术有限公司
  • 2017-07-21 - 2017-11-21 - G06F19/10
  • 本发明公开了一种基于计算云平台的微生物多样性交互分析系统及其方法,该系统包括项目管理模块、基础分析任务提交模块和交互式结果分析模块;首先,向本地集群服务器上传测序数据,在项目管理模块中建立项目,同时在本地集群服务器上传客户的数据库或者选择使用线上的数据库,并且在该项目管理模块中可以进行项目锁定或者共享给他人操作;然后,在基础分析任务提交模块中,用户可以通过可视化界面对测序数据进行参数分析,分析之后产生项目文件;分析之前,先进行判定数据质控是否合格,若合格则进行参数分析;若不合格则直接返回报错;产生的项目文件传送至交互式结果分析模块中进行交互式分析,得到直观呈现的报告。
  • 基于Spark和SIMD的弹性分布式序列比对系统及方法-201710637194.X
  • 徐波;王超;周学海;李曦;陈香兰;李昌龙;庄航;王茄力;王庆凤 - 中国科学技术大学
  • 2017-07-31 - 2017-11-17 - G06F19/10
  • 本发明公开了一种基于Spark和SIMD的弹性分布式序列比对系统,包括一个主节点和与主节点连接的多个工作节点,所述主节点用于管理元数据和集群,包括基于分布式计算框架Spark的主节点、基于分布式内存文件系统的主节点和Hadoop分布式文件系统的主节点;所述工作节点用于数据的存储和计算,包括存储层和计算层,所述存储层包括Alluxio和HDFS,所述计算层包括Spark和SIMD指令集,基于分布式计算框架Spark通过中介模块调用基于SIMD的序列比对算法进行序列比对。采用Alluxio和HDFS来分布式存储数据,采用Spark进行分布式计算,在每个节点采用SIMD技术进行序列比对,提高了性能。
  • 基于云平台的生物信息分析系统-201710598332.8
  • 郭权;余果;任一;张磊;周勇;张祥林;黄华生 - 上海桑格信息技术有限公司
  • 2017-07-21 - 2017-10-10 - G06F19/10
  • 本发明公开了一种基于云平台的生物信息分析系统,包括云平台客户端、云平台web服务器和云平台计算系统,云平台客户端和云平台web服务器之间通过网络收发信息,云平台web服务器和云平台计算系统通过Nginx网页服务器交换数据;云平台web服务器包括生物信息分析请求接口,云平台计算系统包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库和Mongo数据库;生物信息分析请求接口通过Nginx网页服务器连接至生物信息分析应用接口,生物信息分析应用接口的输出端通过工作流进程管理单元连接至生物信息分析组件。本发明的分析程序模块化,可组合复用,分析效率大为提高,部署方便。
  • 染色体三倍体检验方法-201410335037.X
  • 张鸣;王俊;郑伟谋 - 天津华大基因科技有限公司;深圳华大基因医学有限公司
  • 2014-07-14 - 2017-07-18 - G06F19/10
  • 本发明公开了一种染色体三倍体检测方法,包括将测试样本的测序结果比对到参考序列上,得到比对结果;将比对结果按GC含量进行分组;根据分组结果采用相关分析法得到与待检测染色体最相关的染色体以及相关统计量;对最相关的染色体以及相关统计量进行回归分析以计算待检测染色体对应的Z值,根据Z值与预设阈值的比较结果判断出待检测染色体为三倍体的概率。本发明的有益效果是通过不同染色体的GC含量的相关性,采用典型相关分析法来确定待检测染色体与其它染色体的相关性,进而确定出待检测染色体对应的Z值,由此确定待检测染色体为三倍体的概率,而不是计算GC修正系数,避免了GC修正系数计算中引入的误差,从而去掉GC bias在测序中的影响。
  • 基于药物相互作用相似性识别药物靶标的系统及方法-201210584373.9
  • 萧凤鸣 - 深圳先进技术研究院
  • 2012-12-28 - 2017-07-18 - G06F19/10
  • 本发明提供了一种基于药物相互作用相似性识别药物靶标的系统及方法,所述方法包括S1、采集若干小分子化合物的药物相互作用的数据;S2、根据数据建立包含各个小分子化合物的药物相互作用信息的靶标数据库;S3、选取待测药物,建立待测药物与靶标数据库中各小分子化合物的药物相互作用标记;S4、计算待测药物的药物相互作用标记与靶标数据库中各小分子化合物的药物相互作用标记的欧氏距离;S5、计算欧氏距离的预测概率值;S6、将预测概率值按大小进行药物相互作用标记相似度的排序,并列出相似小分子化合物之靶标,得到待测药物的靶标。基于以上系统和方法,不仅能降低靶标预测的成本,也能方便实现中药标准化。
  • 一种面向大数据的代谢组特征数据分析方法及其系统-201410265541.7
  • 周家锐;华韵之;纪震;朱泽轩;曾启明 - 周家锐;华韵之;纪震;朱泽轩;曾启明
  • 2014-06-13 - 2017-07-18 - G06F19/10
  • 本发明公开一种面向大数据的代谢组特征数据分析方法及其系统,所述方法为A、接收输入的代谢组特征数据,将其分割为多个数据块,并将该多个数据块映射送入映射规约框架中的各个运算节点中;B、利用计算智能方法同时对多个数据块上的加权权值进行优化;C、将优化后的多个数据块加权权值合并为整体代谢组特征数据的加权权值并输出。本发明系统的数据分块处理机制降低了加权分析难度,有效提升了预测准确性。且并行化结构使系统可部署至多个计算节点,显著减少运算时间的同时能够保证系统的效率与稳定性。本系统应用的计算智能算法可有效地解决复杂的大规模优化问题。其预测准确性优于现有算法,从而实现可对目标生理状态进行更为有效的预估。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top