[发明专利]Docker技术在高通量测序数据分析中的应用在审

申请号：	201710722110.2	申请日：	2017-08-22
公开（公告）号：	CN107590365A	公开（公告）日：	2018-01-16
发明（设计）人：	袁晓辉	申请（专利权）人：	武汉古奥基因科技有限公司
主分类号：	G06F19/28	分类号：	G06F19/28
代理公司：	武汉蓝宝石专利代理事务所(特殊普通合伙)42242	代理人：	常海涛
地址：	430000 湖北省武汉市***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了Docker技术在高通量测序数据分析中的应用，属于生物计算学及分子生物学领域。使用Docker先构建基础镜像，再将分析所需软件、语言在交互模式下保存到镜像中；搭建分析流程后，再生成生物云计算平台镜像；将其保存为tar压缩包上传并导入到需要进行分析的服务器目录，再将需要分析的数据信息及数据注释文件挂载到镜像中，调用配置好的分析流程即可对数据进行分析。本发明将Docker技术应用于高通量测序数据分析，可以解决现有生物大数据分析中存在的软件安装、配置、迁移及所依赖的计算机资源差异等局限性问题，使得研究人员能够高效的对生物测序大数据进行挖掘分析，减少了对分析手段本身处理的时间。
搜索关键词：	docker 技术通量序数分析中的应用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

Docker技术在高通量测序数据分析中的应用。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉古奥基因科技有限公司，未经武汉古奥基因科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710722110.2/，转载请声明来源钻瓜专利网。

同类专利

一种基于区块链技术的基因组数据管理方法及系统-201810809959.8
发明人：李厦戎;王志波;孙兴强;郭登峰 -专利权人：北京聚道科技有限公司
申请日： 2018-07-23 - 公布日： 2018-12-11 - 主分类号： G06F19/28
摘要：本发明公开了一种基于区块链技术的基因组数据管理系统及方法。所述管理系统包括：实体以及区块链；实体包括数据使用者以及数据提供者；实体，用于在区块链注册、身份核验以及向区块链发送初始化注册信息以及基因组数据；还用于发布或获取所述基因组数据所对应的访问许可证书以及共享证书；区块链内的区块链存储体系用于存储初始化注册信息、基因组数据以及基因组数据所对应的访问许可证书以及共享证书；区块链服务平台用于根据访问许可证书以及共享证书确定访问协议，并存储实体访问基因组数据时的访问权限以及访问历史记录，生成日志信息并提供存在性证明。采用本发明所提供的管理系统及方法能够提高基因组数据管理系统安全性，实现资源共享。

一种绿色无污染的信息存储设备-201810533628.6
发明人：梁梦迪 -专利权人：永康市翌阳科技有限公司
申请日： 2018-05-29 - 公布日： 2018-11-30 - 主分类号： G06F19/28
摘要：本发明的一种绿色无污染的信息存储设备，包括装置主体、设置于所述装置主体内的识别存储装置、设置于所述装置主体内的清理装置、设置于所述装置主体内的运输装置以及设置于所述装置主体左右两侧的固定装置，所述清理装置包括设置于所述装置主体右端开口向右的工作槽，所述工作槽下侧内壁的左侧设置有开口向上的第一凹槽，所述第一凹槽的下侧内壁内固定设置有第一电机，所述第一电机的上端动力配合连接有延伸入所述第一凹槽内的第一转轴，所述第一凹槽内设置有可上下滑动的第一滑块；本装置能够自动化进行DNA识别与人员信息对应存储，能够个人的信息更加完善，也减少了人力的运营时间，促进某些需要用到识别人员信息地方的工作效率。

基于DFT的RNA二级结构距离计算构建系统发育树的方法-201810551872.5
发明人：昌攀;张文影;黄毅然;钟诚 -专利权人：广西大学
申请日： 2018-05-31 - 公布日： 2018-11-20 - 主分类号： G06F19/28
摘要：本发明公开了基于DFT的RNA二级结构距离计算构建系统发育树的方法。通过将RNA的二级结构中的自由基和配对碱基映射成可视化的坐标系，然后利用DFT在不丢失信息的情况下挖掘RNA二级结构x、y和z轴坐标系隐藏的信息，从而获得RNA二级结构在x、y和z轴序列功率谱，通过分析DFT的功率谱特征，选取合适的提取公式计算RNA二级结构x、y和z轴上的特征值，作为RNA二级结构的特征向量，通过计算不同RNA二级结构特征向量间的距离构建物种系统发育树，研究物种的进化关系。本发明的方法，简化了通过RNA序列比对计算距离构建相似度的复杂度，避免了RNA序列比对算法忽略RNA二级结构的弊端，能够快速准确地根据物种RNA的二级结构计算距离，生成准确的系统发育树。

一种耐药结核分枝杆菌库构建方法-201810357589.9
发明人：蒲新明;王泉;许苗;阿尔泰;常胜宾;丁程锋 -专利权人：新疆维吾尔自治区胸科医院;乌鲁木齐新诚通达信息科技有限公司
申请日： 2018-04-20 - 公布日： 2018-11-09 - 主分类号： G06F19/28
摘要：本发明公开了一种耐药结核分枝杆菌库构建方法，该耐药结核分枝杆菌库的构建方法包括如下步骤：S1：筛选结核病病历，收集耐药结核分枝杆菌及其详细资料；S2：确定耐药结核分枝杆菌库的需求；S3：确定耐药结核分枝杆菌库的功能模块；S4：确定耐药结核分枝杆菌库的表概念、表结构及表字段设计；S5：确定耐药结核分枝杆菌库的开发框架；S6：耐药结核分枝杆菌库的实现；S7：耐药结核分枝杆菌库的应用。本发明在收集全疆结核病患者资料的基础之上，筛选出不同民族、不同年龄、不同地域的耐药病例，以信息化手段为支撑，设计耐药菌株库存储筛选的耐药患者分枝杆菌及资料，对建立一个高质量水平、规范大型的结核分枝杆菌菌株库意义重大。

一种基于环境分析的生物分布确定装置-201610716645.4
发明人：唐亦凡 -专利权人：成都旅美科技有限公司
申请日： 2016-08-24 - 公布日： 2018-11-02 - 主分类号： G06F19/28
摘要：本发明提供一种基于环境分析的生物分布确定装置，包括：第一模块，用于收集利用不同地区的生物品种资源，形成生物品种资源数据库；第二模块，用于收集来源地的环境因素信息；第三模块，用于收集目的地的环境因素信息；第四模块，用于对来源地和目的地的环境因素信息进行匹配处理；第五模块，用于根据匹配结果确定该生物品种是否为优选生物品种。该装置能全面、准确、科学地解决现有技术中存在的技术问题，可以加快确定种植合适的生物品种的进程，提高确定种植合适的生物品种工作的效率和成功率。

一种基因转录变异几率及变异方向的算法-201810469702.2
发明人：邵莉;佟艳辉;李鹏 -专利权人：中科政兴（上海）医疗科技有限公司
申请日： 2018-05-16 - 公布日： 2018-10-26 - 主分类号： G06F19/28
摘要：本发明公开了一种基因转录变异几率及变异方向的算法，海量的高通量数据以及对检测结果的准确性要求使得InDel检测面临着大的挑战，若直接将短序列比对到参考序列上会出现两个问题，一个是映射过程中计算复杂需要很长时间，另一个是当read在参考序列上存在匹配时，read将会映射到其在参考序列的第一个匹配，这通常不是最佳匹配，为了解决以上两个问题，本发明先对滑窗方法产生的参考序列的seed集合进行构建哈希表，然后在比对时利用哈希表对read进行定位先对滑窗方法产生的参考序列的seed集合进行构建哈希表，由于参考序列信息量大，而哈希表耗内存，因此在创建哈希表的同时对序列进行了二进制压缩，使得内存占用大大减少。

一种预制混凝土构件的钢筋原材料信息自动集成装置和方法-201510504725.9
发明人：余芳强;干华铭;郑晏华;李城;周乐;陈实;翁亮 -专利权人：上海建工四建集团有限公司
申请日： 2015-08-17 - 公布日： 2018-10-12 - 主分类号： G06F19/28
摘要：本发明提供一种预制混凝土构件的钢筋原材料信息自动集成装置和方法，用于将钢筋原材料信息自动集成到预制构件中，为预制构件的原材料信息追踪查询、成本分析等提供数据。该装置至少包括：数据库、钢筋原材料信息输入器、钢筋原材料编码器、钢筋原材料上料监控系统、预制构件信息输入器、钢筋编码器、钢筋加工监控系统、钢筋原材料信息自动集成器等组成部分。通过编码、二维码图形、身份牌等在加工监控过程中的作用，将钢筋原材料信息自动集成到预制构件中，实现高效率高质量的协同工作。进而，能提供预制构件的钢筋原材料信息追踪查询，支持构件厂进行原材料消耗和成本分析，解决了监控复杂的加工系统、提高加工质量和效率的问题，进而有助于加工管理水平的提升。

基因分析导引系统及其方法-201810114284.5
发明人：潘峰;曹春笋;张雄 -专利权人：上海海云生物科技有限公司
申请日： 2018-02-05 - 公布日： 2018-08-10 - 主分类号： G06F19/28
摘要：本发明提供了一种基因分析导引系统，包括如下模块：信息检索模块：采集用户操作信息，其中，所述用户操作信息指示检索相应的基因标识信息、疾病标识信息、表型标识信息中的任一种或任多种被检索信息。本发明提供的系统整合了国内外多个权威数据库，内含基因、疾病和表型的全聚合搜索，同时支持基因、疾病和表型的混合搜索，也可分别搜索基因、疾病和表型，获取与输入的词条相关的所有信息。为医生或从医人员为提供更加全面的搜索，从而得到与输入词条更多的相关内容。

一种将基因信息进行二进制表示的存储方法-201610390134.8
发明人：谢清禄;徐宏锴;朱军;余孟春 -专利权人：广州麦仑信息科技有限公司
申请日： 2016-06-02 - 公布日： 2018-08-10 - 主分类号： G06F19/28
摘要：本发明公开了一种将基因信息进行二进制表示的存储方法，所述的方法包括：根据DNA双链结构及碱基配对，由字符代表匹配的碱基对；将四种碱基对进行数值定义并用两位二进制数来表示；三个碱基对组成的碱基组以6位二进制数值和2位固定赋值组成一个8位一字节的二进制数值表示；以线性映射的方式，将64种碱基组0～63根据Y＝4X、或Y＝4X+1、或Y＝4X+2、或Y＝4X+3的公式均匀映射到0～255中，并将0～255所有数值转换为8位二进制数，以二进制字节流形式的数据信息进行存储。

一种加样指示和信息记录方法、装置、介质及移动终端-201810027891.8
发明人：宋小飞;陈婷玉;马嘉欣;高权;韦志森 -专利权人：华南理工大学
申请日： 2018-01-11 - 公布日： 2018-07-31 - 主分类号： G06F19/28
摘要：本发明公开了一种加样指示和信息记录方法、装置、介质及移动终端，所述加样指示和信息记录方法包括步骤：显示与加样孔板规格相一致的模拟孔板；按所选的加样顺序依次对加样孔板的各个孔进行加样时，通过接收用户的确认指令依次改变所述模拟孔板中对应孔的颜色和亮度进行标识，直到加样完成。本发明尽量减少硬件按钮，采用程序控制模式准确加样，通过编辑和保存信息以便于辅助数据分析，提高了加样的精确程度。

一种GPU加速的DNA序列压缩方法及系统-201810068072.8
发明人：朱泽轩;彭聪;孙怡雯 -专利权人：深圳大学
申请日： 2018-01-24 - 公布日： 2018-07-17 - 主分类号： G06F19/28
摘要：本发明适用于基因技术领域，提供了一种GPU加速的DNA序列压缩方法，包括：中央处理器采用模板链算法对元数据进行简化，将简化后的元数据发送给图形处理器；图形处理器利用稀疏索引算法将DNA碱基序列与参考基因组进行匹配，得到匹配结果；所述图形处理器采用Burrows–Wheeler变换算法、Move‑to‑front变换算法和区间编码器对所述匹配结果、所述简化后的元数据和质量分数进行压缩，得到压缩后的DNA序列。本发明实施例将中央处理器CPU和图形处理器GPU结合异步运行，实现了在图形处理器GPU在进行DNA序列的压缩，同时利用图形处理器GPU中的计算单元可以加快DNA序列的压缩速度。

一种疾病基因组数据库的构建方法和疾病基因组数据库-201810114362.1
发明人：钱夔;袁彦婷 -专利权人：南京组慧生物科技有限公司
申请日： 2018-02-05 - 公布日： 2018-06-29 - 主分类号： G06F19/28
摘要：本发明公开了一种疾病基因组数据库的构建方法和疾病基因组数据库，所述方法包括：构建内部数据库和公共数据库，所述内部数据库用于输入和储存病人疾病和基因相关数据，所述公共数据库用于输入和储存公开的疾病和基因相关数据；构建公共数据库查询模块，所述公共数据库查询模块用于从所述内部数据库查询公共数据库的数据。采用本发明的构建方法能够建立疾病与基因信息的关系数据库，并方便查询。

一种MHC补全数据库、其构建方法和应用-201410490501.2
发明人：刘小敏;曹红志;刘晓;张涛 -专利权人：深圳华大基因股份有限公司
申请日： 2014-09-23 - 公布日： 2018-05-01 - 主分类号： G06F19/28
摘要：本申请公开了一种MHC补全数据库及其构建方法和应用。本申请的MHC补全数据库包括合成在一起的genotype数据集、HLA分型的型别数据集、氨基酸改变信息数据集和HLA单体型数据集；该数据库的构建过程中首次采用LD和HWE进行变异结果的过滤，提高了数据准确性；采用简单易操作的方法获得一个数量最少的SNP区分数据集，然后在phasing分析得到MHC单体型信息，相比于用整个SNP数据集进行phasing，本申请的构建方法更节约时间、减少CPU和内存使用，并且得到的单体型信息更准确。本申请的MHC补全数据库，包含了MHC区域的多种数据集，能够有效的补全位点，为MHC区域的深入研究奠定了基础。

一种识别测序过程中汽泡效应的方法和装置-201510552954.8
发明人：陈实富;许明炎;刘鹏;蒋传贵 -专利权人：深圳市海普洛斯生物科技有限公司
申请日： 2015-09-01 - 公布日： 2018-04-27 - 主分类号： G06F19/28
摘要：本发明公开了一种识别测序过程中汽泡效应的方法和装置，所述方法包括将测序过程中产生的多条PolyX记录以点的形式可视化地显示在图像上，以所述图像上的所述点所在的区域表征汽泡区域；其中所述PolyX表示序列中一段连续的相同碱基，所述PolyX记录包含所述PolyX在测序芯片上的位置信息以用于将所述PolyX记录显示在所述图像上的适当位置。本发明能够将测序过程中的汽泡效应可视化的识别出来，解决了本领域存在的汽泡效应难以识别的问题。

基于表型性状的花生特异性测试中的近似品种筛选方法-201610061376.2
发明人：张晗;李汝玉;段丽丽;孙加梅;王雪梅;郑永胜;王玮;仙丽娜;李华;王秀娟;王穆穆;王东建 -专利权人：山东省农业科学院作物研究所
申请日： 2016-01-29 - 公布日： 2018-04-24 - 主分类号： G06F19/28
摘要：本发明公开了基于表型性状的花生特异性测试中的近似品种筛选方法。该方法首先建立花生品种表型性状数据库，然后将申请人提供的申请品种编号、名称和性状表达状态观测值或测试机构采集的性状数据导入数据库；对应每一个申请品种各个性状的表达状态，根据预先设定的已知品种性状表达状态的安全取值范围，在数据库中输入相应表达状态范围；数据库将符合条件的近似品种筛选出来。本发明根据环境条件和人员对不同性状和性状表达状态观测值的影响程度不同这一特点，针对不同类型性状和不同的性状表达状态观测值，灵活设置了已知品种相应的表达状态选择范围，防止了近似品种的遗漏又防止了选入过多近似品种的问题。

基于表型性状的大豆特异性测试中的近似品种筛选方法-201610061379.6
发明人：张晗;李汝玉;段丽丽;孙加梅;郑永胜;王玮;王雪梅;仙丽娜;李华;王秀娟;王穆穆;王东建 -专利权人：山东省农业科学院作物研究所
申请日： 2016-01-29 - 公布日： 2018-04-24 - 主分类号： G06F19/28
摘要：本发明公开了基于表型性状的大豆特异性测试中的近似品种筛选方法。该方法首先建立大豆品种表型性状数据库，然后将申请人提供的申请品种编号、名称和性状表达状态观测值或测试机构采集的性状数据导入数据库；对应每一个申请品种各个性状的表达状态，根据预先设定的已知品种性状表达状态的安全取值范围，在数据库中输入相应表达状态范围；数据库将符合条件的近似品种筛选出来。本发明根据环境条件和人员对不同性状和性状表达状态观测值的影响程度不同这一特点，针对不同类型性状和不同的性状表达状态观测值，灵活设置了已知品种相应的表达状态选择范围，防止了近似品种的遗漏又防止了选入过多近似品种的问题。

适用于药物基因组学的生物样本库管理系统-201711008826.2
发明人：滕祥云;李琦;张璇;黄少亚;张戈;杨雪佳 -专利权人：长沙三济生物科技有限公司
申请日： 2017-10-25 - 公布日： 2018-04-03 - 主分类号： G06F19/28
摘要：本发明公开一种适用于药物基因组学的生物样本库管理系统，其包括数据库、样本信息采集模块、知识库模块、样本入库管理模块、样本出库管理模块以及样本应用服务模块，所述知识库模块分别与所述数据库、所述样本信息采集模块以及所述样本入库管理模块通信连接，所述样本入库管理模块分别与所述数据库和所述样本信息采集模块通信连接，所述样本出库管理模块和所述样本应用服务模块分别与所述数据库通信连接。本发明提供的适用于药物基因组学的生物样本库管理系统不仅能实现以药物分类或基因分类为中心的样本管理，而且在样本应用服务时能更好地满足临床药物基因组学的需求以及可结合疾病信息精准出库某一用药患者样本以提高科研效率。

生物样本库管理系统-201711015210.8
发明人：滕祥云;李琦;张璇;黄少亚;张戈;杨雪佳 -专利权人：长沙三济生物科技有限公司
申请日： 2017-10-25 - 公布日： 2018-03-27 - 主分类号： G06F19/28
摘要：本发明公开一种生物样本库管理系统。所述生物样本库管理系统包括数据库、样本信息采集模块、知识库模块、样本入库管理模块、样本出库管理模块以及样本应用服务模块、临床样本信息采集模块、临床样本信息管理模块以及样本应用服务模块。本发明提供的生物样本库管理系统不仅能实现以药物分类或基因分类为中心的样本管理，而且在样本应用服务时能更好地满足临床药物基因组学临床试验的需求以及可结合疾病信息精准出库某一用药患者样本以提高科研效率；同时，通过所述知识库模块对临床试验信息进行标准化，不仅方便信息共享与传输利用，而且可以为临床试验的顺利推进及信息挖掘利用奠定了重要的基础，从而可以显著提升临床试验效率。

蛋白质组数据库及其应用-201510448466.2
发明人：谢振华 -专利权人：清华大学深圳研究生院
申请日： 2015-07-27 - 公布日： 2018-03-02 - 主分类号： G06F19/28
摘要：本发明公开了一种构建蛋白质组数据库的方法，该方法包括步骤接收多个蛋白序列；消除每个蛋白序列的起始氨基酸，获得相应的截断序列；建立数据表，以获得蛋白质组数据库，数据表包含多个记录，一个所述记录与一个所述截断序列对应，数据表包含多个字段，字段包括以下序列参数中的至少两种氨基酸丰度、序列长度、序列分子量、序列疏水性和序列等电点。本发明还公开一种蛋白质组数据库、蛋白质组数据库在蛋白质分组、检索和/或定位中的用途、一种定位蛋白的方法和系统。本发明的方法和/或蛋白质组数据库建立了蛋白的坐标系统，利于简单高效利用蛋白质大数据。

一种基于病毒蛋白质本体的知识导航的方法、装置-201310391096.4
发明人：陈恒;张珅;赵衍;张永娟;陈成材 -专利权人：中国科学院上海生命科学研究院
申请日： 2013-08-30 - 公布日： 2018-02-23 - 主分类号： G06F19/28
摘要：本发明公开了基于病毒蛋白质本体的知识导航的方法、装置和系统，在实现知识挖掘的基础上，创立了一种基于病毒蛋白质本体的知识导航的方法，并较好地完成了知识挖掘与知识导航功能的整合。其技术方案为本发明将知识挖掘型乙肝专题文献数据库的文本挖掘字典同乙肝病毒蛋白本体进行关联整合，并通过该关联整合，构建出一个应用于乙肝蛋白质挖掘模块的知识组织与分类导航系统，并完成基于乙肝病毒蛋白本体的知识导航功能。

数据质量管理系统和方法-201680032589.0
发明人：本·利斯菲尔德;罗兰·埃瓦尔德 -专利权人：利姆博思医学科技有限责任公司
申请日： 2016-06-01 - 公布日： 2018-02-09 - 主分类号： G06F19/28
摘要：当前要求保护的主题涉及一种数据质量管理系统和方法，从第一数据储存库(101)接收包括第一获得数据和第一分配值的第一数据点，并确定和/或存储第一数据点的第一质量分数以及第一可存储数据。从第二数据储存库(102)接收第二数据点，该第二数据点包括第二获得数据和第二分配值，根据预定义相似性度量，该第二获得数据与第一获得数据相似，并根据第二数据点确定第二质量分数以及第二可存储数据，和/或存储第二质量分数以及第二可存储数据，向第一数据储存库(101)发送第二可发送数据，所述第二可发送数据根据第二数据点和/或第二质量分数确定，使得第一数据储存库(101)重新评估第一分配值。

一种可视化生物信息分析工具生成方法和装置-201710801927.9
发明人：孙怀立;陈东杰;吴延安;王向东;李明壮;薛凯 -专利权人：北京荣之联科技股份有限公司
申请日： 2017-09-07 - 公布日： 2018-02-02 - 主分类号： G06F19/28
摘要：本发明公开了一种可视化生物信息分析工具生成方法和装置，所述方法包括显示第一可视化编辑界面；所述第一可视化编辑界面包括至少一个配置栏；获取用户通过所述配置栏输入的输入信息；根据预设的生成规则，获取所述输入信息对应的代码段，并基于所述代码段生成生物信息分析工具。本发明通过在可视化界面上的简单操作即可快速高效的生成生物信息分析工具；此外，基于多个生成的生物信息分析工具，还能够方便的生成生物信息分析流程。

一种用于基因检测实验室的数据管控方法与系统-201710780427.1
发明人：糜庆丰;黄铨飞;李建文;陈样宜;陈雨;肖雯娟 -专利权人：东莞博奥木华基因科技有限公司
申请日： 2017-09-01 - 公布日： 2018-01-30 - 主分类号： G06F19/28
摘要：本发明公开了一种用于基因检测实验室数据管控方法与系统，包括获取模块、处理模块和存储展示模块；本发明的方法通过获取模块获取基因检测过程中的信息，通过处理模块进行样本信息记录、实验数据记录、数据审核、检测报告管理、数据管理、数据统计、数据备份以及用户登录操作，通过存储展示模块存储并展示基因检测过程中的信息以及数据处理的结果。本发明将基因检测工作迁移至处理模块，操作简单、成本较低、效率较高且易于升级和维护；另外，本发明能够根据实验基本信息进行按类分析和实时审核，并将结果进行实时反馈，保证了用户之间的实时交互，提高了工作效率。本发明可广泛应用于医学信息工程领域。

Docker技术在高通量测序数据分析中的应用-201710722110.2
发明人：袁晓辉 -专利权人：武汉古奥基因科技有限公司
申请日： 2017-08-22 - 公布日： 2018-01-16 - 主分类号： G06F19/28
摘要：本发明公开了Docker技术在高通量测序数据分析中的应用，属于生物计算学及分子生物学领域。使用Docker先构建基础镜像，再将分析所需软件、语言在交互模式下保存到镜像中；搭建分析流程后，再生成生物云计算平台镜像；将其保存为tar压缩包上传并导入到需要进行分析的服务器目录，再将需要分析的数据信息及数据注释文件挂载到镜像中，调用配置好的分析流程即可对数据进行分析。本发明将Docker技术应用于高通量测序数据分析，可以解决现有生物大数据分析中存在的软件安装、配置、迁移及所依赖的计算机资源差异等局限性问题，使得研究人员能够高效的对生物测序大数据进行挖掘分析，减少了对分析手段本身处理的时间。

一种原核蛋白质乙酰化位点的预测方法-201710654001.1
发明人：施绍萍;陈国东;曹曼 -专利权人：南昌大学
申请日： 2017-08-02 - 公布日： 2017-12-12 - 主分类号： G06F19/28
摘要：本发明公开了一种原核蛋白质乙酰化位点的预测方法，包括步骤收集数据；数据处理；特征编码特征训练；构建预测模型。本发明还公开了一种原核蛋白质乙酰化位点的预测方法的应用。本发明方法基于蛋白一级结构信息、物理化学信息和进化信息的多维特征编码，提取原核生物蛋白质乙酰化序列的特征，运用弹性网络Elastic Net优化和筛选最优特征向量，结合支持向量机SVM构建原核乙酰化位点的预测模型，显著提高预测模型对原核乙酰化位点的预测性能；开发的预测软件平台ProAcePred实现了对原核蛋白质乙酰化位点的高通量预测，为蛋白质乙酰化研究提供准确、简便和快速的研究工具，并为进一步的实验研究提供有价值的参考信息。

一种一键化分析RNA数据的系统-201710607777.8
发明人：刘旭;成睿;张涌 -专利权人：西北农林科技大学
申请日： 2017-07-24 - 公布日： 2017-12-08 - 主分类号： G06F19/28
摘要：本发明公开了一种一键化分析RNA数据的系统。本发明通过综合各种分析软件写成一个脚本，一键化得出最终结果并得出需要的图片。本发明能够接受单端和双端序列的输入文件，并能够分别分析两组数据的mRNA和lncRNA的基因差异，并对结果作图，直观的查看分析的结果。本发明能够方便、快速、准确的完成对于RNA数据分析。

一种以组织蛋白酶D为靶点的小分子抑制剂的筛选方法-201610299070.0
发明人：张伟;李英霞;高顶顶;包可婷 -专利权人：复旦大学
申请日： 2016-05-07 - 公布日： 2017-11-14 - 主分类号： G06F19/28
摘要：本发明属医药化学技术领域，涉及药物筛选方法，具体涉及以组织蛋白酶D为靶点的小分子抑制剂的虚拟筛选模型及体外测试模型的建立方法，本发明包括步骤(1)组织蛋白酶D蛋白三维结构的获取、分析及处理；(2)小分子数据库的构建及处理；(3)计算机虚拟筛选系统的建立；(4)运用步骤(3)的计算机虚拟筛选系统对步骤(2)中的小分子配体库进行筛选；(5)ADME‑T的预测。本发明的组织蛋白酶D抑制剂的筛选方法最终筛出6个具有组织蛋白酶D抑制活性的苗头化合物，具有快速、经济、高效的优势，大大提高了效率，为寻找组织蛋白酶D小分子抑制剂提供了基础。应用该方法获得的具有组织蛋白酶D抑制活性的化合物，可进一步用于开发新型抗癌药物。

一种用于临床诊断和预测的基因数据系统-201710527540.9
发明人：张巍;陆国辉 -专利权人：张巍
申请日： 2017-06-30 - 公布日： 2017-10-13 - 主分类号： G06F19/28
摘要：本发明公开了一种用于临床诊断和预测的基因数据系统，包括源数据处理模块，用于接收原始测序数据，并根据预设规则对所述原始测序数据进行分类处理，生成单核苷酸变异基因组数据和拷贝数变异基因组数据；数据仓库，用于存储所述单核苷酸变异基因组数据和拷贝数变异基因组数据；数据应用模块，用于接收控制指令，根据所述控制指令从所述数据仓库中获取相关数据，并对所述相关数据进行整理输出；该系统建立了人类基因正常变异和基因致病变异的数据架构，并且能够对数据进行分析和管理，为临床诊断和预测提供了可靠的数据支持。

一种利用DNA进行信息存储的方法-201710086096.1
发明人：杨平;蔡晓辉;钟云鹏;盛付旭;李彦敏;祁姗姗;齐金才;田净净;朱沛煌 -专利权人：苏州泓迅生物科技股份有限公司
申请日： 2017-02-17 - 公布日： 2017-06-13 - 主分类号： G06F19/28
摘要：本发明涉及一种利用DNA进行信息存储的方法，其包括（1）将计算机原始文件二进制信息转化为四进制并进而编码转换成DNA全序列，其中二进制代码00、01、10、11分别对应转换为A、T、C、G四种脱氧核糖核苷酸；（2）将DNA全序列分成多个DNA片段，并组织构建长度为90‑110nt且包括由DNA片段构成的插入核苷酸编码序列、位于两端的侧翼引物序列以及位于各侧翼引物序列内侧的索引编码序列的输出DNA序列；（3）根据输出DNA序列合成人工DNA序列并保存。本发明方法具有通用性好，能够简化运算、提高DNA信息存储的连续性、存储效率和密度，以及可降低错误率和降低序列合成和检测成本等显著优势。

高通量Miseq测序数据自动化过滤方法-201611005004.4
发明人：刘书云;叶伟星;姜丽荣;孙子奎 -专利权人：上海派森诺生物科技股份有限公司
申请日： 2016-11-15 - 公布日： 2017-05-10 - 主分类号： G06F19/28
摘要：本发明公开的高通量Miseq测序数据自动化过滤方法，具体包括如下步骤1)输入要进行分析的项目信息步骤；2)高通量测序数据与项目信息的匹配步骤；3)对相应项目的数据进行预处理步骤；4)对数据进行初步统计步骤。本发明的有益效果在于基于Linux shell的Illumina Miseq数据自动化过滤流程，可进行批量数据过滤，提高数据处理效率和服务器使用效率，同时降低人为错误，便于判断样品数据量是否满足分析要求。

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学，即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真，例如：概率模型或动态模型，遗传基因管理网络，蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的，例如：进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的，例如：结构排序，结构或功能关系，蛋白质折叠，结构域拓扑，用结构数据的药靶，涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的，例如：基因型–表型关联，不均衡连接，种群遗传学，结合位置鉴定，变异发生，基因型或染色体组的注释，蛋白质相互作用或蛋白质核酸的相互作用

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]Docker技术在高通量测序数据分析中的应用在审

专利文献下载