[发明专利]一种基因组测序数据序列组装方法有效
申请号: | 201410177319.1 | 申请日: | 2014-04-29 |
公开(公告)号: | CN104751015B | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | 孙际宾;李澎鹏;郑平;马延和 | 申请(专利权)人: | 中国科学院天津工业生物技术研究所 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 天津滨海科纬知识产权代理有限公司12211 | 代理人: | 韩敏 |
地址: | 300308 天津*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种基因组测序数据序列组装方法,可以简便而准确地实现基因组测序数据序列的组装。该方法包括根据序列片段之间的重叠关系,构建重叠关系图G以及反向互补图G’;任取重叠关系图G中的未被检查过的节点nx,以任意方向D遍历G和G’;判断任意方向D中是否存在一节点ny与节点nx有连接关系;如果存在,则继续判断在方向D中的节点ny与节点nx是否为双向唯一关系;当所述节点ny与节点nx为双向唯一关系时,将所述节点ny与nx的关系判定为可信连接关系;否则,将所述节点ny与nx的所有关系判定为不确认连接关系。 | ||
搜索关键词: | 一种 基因组 序数 序列 组装 方法 | ||
【主权项】:
一种基因组测序数据序列组装方法,其特征在于,包括:根据序列片段之间的重叠关系,构建重叠关系图G以及反向互补图G’;任取重叠关系图G中的未被检查过的节点nx,以任意方向D遍历G和G’;判断任意方向D中是否存在一节点ny与节点nx有连接关系;如果存在,则继续判断在方向D中的节点ny与节点nx是否为双向唯一关系;当所述节点ny与节点nx为双向唯一关系时,将所述节点ny与nx的关系判定为可信连接关系;否则,将所述节点ny与nx的所有关系判定为不确认连接关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院天津工业生物技术研究所,未经中国科学院天津工业生物技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410177319.1/,转载请声明来源钻瓜专利网。
- 同类专利
- 基于布尔网络吸引域模拟干预肿瘤细胞状态的方法-201610781378.9
- 刘文斌;沈良忠;昝乡镇 - 广州大学
- 2016-08-30 - 2018-12-28 - G06F19/18
- 本发明实施例公开了一种基于布尔网络吸引域模拟干预肿瘤细胞状态的方法,该方法包括:利用基因芯片采集技术获取生物样本基因的连续表达谱数据,并根据所述获取到的连续表达谱数据,构建布尔网络模型的基因调控网络;确定基因调控网络干预前所有状态下的暂态数BOS及其包含的所有期望吸引子和不期望吸引子,并进一步筛选出满足预定条件的干预位及其干预后基因调控网络的暂态数BOS;根据所筛选干预位干预后基因调控网络的暂态数BOS,调整基因调控网络结构,并根据调整后的基因调控网络,模拟肿瘤细胞状态。实施本发明,能够模拟干预肿瘤细胞状态,为肿瘤治疗研究提供一个有力的理论框架。
- 基于云计算平台的有参考基因组的转录组项目的交互式分析系统及方法-201810802816.4
- 任一;余果;郭权;韩畅;史彩萍;仝颜丽;刘彬旭;石今;曾静;周玄;董亚晨 - 上海桑格信息技术有限公司
- 2018-07-20 - 2018-12-25 - G06F19/18
- 本发明公开了一种基于云计算平台的有参考基因组的转录组项目的交互式分析系统及方法,该系统包括用于对项目的详细信息进行查看、编辑和管理的项目管理模块;用于对任务进行参数设置,提交后进行运算分析,并将输出的分析结果以及原始数据按照预设格式整合生成项目文件的基础分析任务提交模块;以及用于根据用户个性化需求进行分析结果的进一步优化,并将结果可视化呈现的交互式结果分析模块。本发明的系统及方法借助云计算技术,提供了高集成化的数据分析平台,为有参考基因组的转录组项目的基础分析和高级分析,个性化分析打下了良好的基础。
- 一种消除三维基因组学技术噪音的方法及应用-201810589919.7
- 张玉波;孔思远;张高林;范磊;黄其通;李清;黄雷;彭艳玲 - 中国农业科学院农业基因组研究所
- 2018-06-08 - 2018-12-18 - G06F19/18
- 本发明公开一种消除三维基因组学技术噪音的方法及应用,该方法为在三维基因组学技术的关键步骤邻近连接时加入外切酶组合消除邻近连接后线性DNA,提高环状有效互作比例,所述外切酶组合包括外切酶Lambda与Exonuclease I组合或者外切酶Exonuclease I与Exonuclease III组合。本发明利用外切酶组合酶切反应消除三维基因组学技术噪音的方法具有方便、快捷、高效的优点,能够降低产生假阳性产物或者信号的可能性,增加有效互作环状DNA占比,大大提高终端有效互作数据产出比例,节约测序空间,降低测序成本,简化了后期利用复杂的生物信息手段消除大数据中无效信息所耗费的资源。
- 一种基于多组学的miRNA功能识别方法-201810926074.6
- 王颖;汝吉东 - 齐齐哈尔大学
- 2018-08-14 - 2018-12-18 - G06F19/18
- 一种基于多组学的miRNA功能识别方法,本发明涉及基于多组学的miRNA功能识别方法。本发明为了解决现有方法对miRNA功能识别准确率低的问题。本发明通过基因表达谱分析差异表达基因;构建疾病或药物相关蛋白质网络;对构建的疾病或药物相关的蛋白质网络,进行功能模块的选取;对选取的功能模块进行富集分析,确定功能模块内的关键基因;通过miRNA表达谱分析差异表达miRNA,对差异表达miRNA进行靶基因预测;构建miRNA调控的疾病或药物相关蛋白质网络;对构建的miRNA调控的疾病或药物相关蛋白质网络的结点基因进行功能富集分析,识别miRNA的功能。本发明用于生物信息学领域。
- 消除常染色体内和染色体间GC偏好的方法及检测系统-201510009648.X
- 牟晓威;陈帼婧;屠勇军;陈贤丰 - 杭州天译基因科技有限公司
- 2015-01-08 - 2018-12-14 - G06F19/18
- 本发明公开了一种消除常染色体内和染色体间GC偏好的方法及检测系统,该检测系统包括:(1)用于通过高通量测序获得样本全基因组序列的高通量测序仪;(2)用于执行以下步骤的多条指令的计算机可读介质,包括:a、用于构建一种消除GC偏差的系统,b、用于构建另一种消除GC偏差的系统,c、用于构建检测样本中非整倍体与正常样本的检测系统。最终根据两种不同矫正获得的Z值判断是否为非整倍体。采用本发明的检测系统,去除GC偏差,在避免数据的失真的同时还获得更高敏感性的胎儿遗传异常检测。本发明的检测系统根据GC含量定义用于统计检验的参数。另外,通过Z值统计的方法根据大批量的数据得出统计意义上的参数,从而得到更高的精确度。
- 基于染色体空间相互作用预测长非编码RNA生物学功能的方法-201810082985.5
- 范珍;陈小伟;陈润生 - 中国科学院生物物理研究所
- 2018-01-29 - 2018-12-14 - G06F19/18
- 本发明公开了基于染色体空间相互作用预测长非编码RNA生物学功能的方法。本发明的方法包括如下步骤:1)选择候选长非编码RNA;2)确定长非编码RNA在全基因组范围内的结合位点;3)确定组织细胞中染色体精细的空间相互作用数据;4)预测长非编码RNA的靶基因;5)GO功能富集分析,预测长非编码RNA的生物学功能。本发明的方法能够结合最新的染色体空间相互作用数据,提高长非编码RNA生物学功能预测的准确性。
- 基于基因变异与疾病表型自动关联匹配的遗传病预测系统-201810539136.8
- 李伟忠 - 广州普世医学科技有限公司
- 2018-05-30 - 2018-12-07 - G06F19/18
- 本发明涉及一种基于基因变异与疾病表型自动关联匹配的遗传病预测系统,包括数据模块、工具模块、分析工作流模块、编码基因变异解读模块、非编码基因解读模块和网络门户模块;数据模块用于生命组学源数据的加密传输、智能识别和整合配置;工具模块用于软件工具的模块整合;分析工作流模块积木化搭建流程和并行运行流程;编码基因变异解读模块用于过滤非关键编码基因变异和关联匹配疾病表型信息,并生成临床解读报告;非编码基因解读模块用于检索、关联和匹配非编码基因变异和其疾病表型信息,并生成临床解读报告;网络门户模块利用虚拟化封装和云平台部署,建立网络终端可视化门户应用。
- 一种基于计算生物学筛选提高沉香倍半萜合酶活性的关键氨基酸位点的方法-201810604291.3
- 刘镛;黄遵楠;陈镜安;吕思敏 - 广东医科大学
- 2018-06-13 - 2018-12-07 - G06F19/18
- 本发明公开了一种基于计算生物学筛选提高沉香倍半萜合酶活性的关键氨基酸位点的方法,包括如下步骤:1)获得沉香等68条倍半萜合酶相关序列;2)通过Modeltest、PAUP*和MrBayes等软件构建倍半萜合酶系统发育树;3)采用PAML软件的位点模型、枝模型和枝位点模型检测倍半萜合酶的正选择位点;4)对沉香倍半萜合酶进行同源建模,通过PyMOL软件显示正选择位点;5)运用Discovery Studio软件进行沉香倍半萜合酶突变体的计算分析。结果表明,247Q、403D、412P、426Y、470G和538S等6个正选择位点与沉香倍半萜合酶功能位点或功能保守区密切相关;D403R、G470Q和S538K突变后有利于提高沉香倍半萜合酶活性与稳定性。本发明方法基于计算生物学,操作简单,能够实现经济快捷筛选提高沉香倍半萜合酶活性的关键氨基酸位点。
- 一种甲型流感病毒快速分型与分析流程-201610048637.7
- 王楷宬;王通;陈继明;庄青叶;王素春;彭程 - 中国动物卫生与流行病学中心
- 2016-01-26 - 2018-12-04 - G06F19/18
- 本发明属于生物技术领域,它确立了一种甲型流感病毒快速分型与分析流程,可以快速、准确对甲型流感病毒进行分型、分析和遗传进化研究,其包含3个技术要点:(1)筛选了适合进行甲型流感病毒分型的参考序列;(2)构建了甲型流感病毒分型与序列分析方法;(3)实现了序列分析的并行化与自动化。该发明能够满足各类疫病预防控制机构和研究院所开展流感病毒的流行病学调查和遗传变异研究。
- 一种骨肿瘤基因变异及药物解读多数据库交互系统-201810699316.2
- 杨丽;杨达梅;周琴;陈雷 - 迈凯基因科技有限公司
- 2018-06-29 - 2018-11-30 - G06F19/18
- 本发明实施例公开了一种骨肿瘤基因变异及药物解读多数据库交互系统,包括:骨肿瘤基因变异信息数据库、骨肿瘤药物治疗数据库以及骨肿瘤文献信息数据库;各数据库用于存储对应的数据;其中,骨肿瘤药物治疗数据库包括骨肿瘤基因变异与药物治疗批准信息数据库、骨肿瘤基因变异与药物治疗专家共识信息数据库以及骨肿瘤基因变异与药物治疗临床试验信息数据库。通过建立多数据库交互系统,能够存储骨肿瘤基因变异及药物相关数据,该交互系统数据量完善且易于使用。
- 一种交联二肽快速鉴定方法-201510112890.X
- 孟佳明;樊盛博;迟浩;卢珊;孙瑞祥;董梦秋;贺思敏 - 中国科学院计算技术研究所
- 2015-03-16 - 2018-11-30 - G06F19/18
- 本发明提供一种交联二肽快速鉴定方法,包括:1)提取待鉴定串联谱图中的有效谱峰,根据各个有效谱峰对应的质量,查找碎片索引得到相应的肽段序列作为候选α肽序列,其中所述碎片索引记录了各个碎片质量及其对应的肽段序列;2)对于每个候选α肽序列,根据所述待鉴定串联谱图的母离子质量计算相应的β肽质量,进而得到相应的候选β肽序列,将候选α肽序列和相应的候选β肽序列组合得到候选交联二肽;3)将步骤2)所得的候选交联二肽与串联谱图进行精细匹配,得出鉴定结果。本发明不需使用特殊交联剂;搜索速度快,鉴定效率高;搜索灵敏度高。
- 基于CT影像组学特征与肺癌基因表达间相关性分析方法-201810425932.9
- 王婷;龚敬;聂生东 - 上海理工大学
- 2018-05-07 - 2018-11-27 - G06F19/18
- 本发明涉及一种基于CT影像组学特征与肺癌基因表达间相关性分析方法,首先,采用半自动分割方法,对分割得到的肿瘤提取其CT影像组学特征,然后,在预处理基因数据的基础上进行聚类分析,并取其第一主成分作为具有相似表达谱基因聚类结果的代表,最后,运用基因芯片显著性分析算法寻找两者之间的相关性,并对结果进行验证分析。本发明为探寻影像特征和基因数据间的关系提供了一种新的方案,试图找到基因的成像替代物,从基因层面解释影像特征,更好地辅助肿瘤的个性化治疗。
- 用于临床决策支持的系统-201380071649.6
- 亚历山大·子恩;大卫·B.·杰克逊;马丁·斯坦;纪尧姆·泰格朗;斯蒂芬·布洛克;亚历山大·皮克;塞奥佐罗斯·斯奥戴特斯;伯恩哈德·苏奥泽 - 分子健康股份有限公司
- 2013-10-01 - 2018-11-27 - G06F19/18
- 本公开内容涉及用于生物信息学和数据处理的系统和方法。尤其是,在第一方面,本公开内容涉及用于生成针对患者的个性化治疗准则以及用于为患者选择治疗的方法和系统。在另一方面,本公开内容涉及用于为治疗的临床试验选择患者的方法和系统。通过将患者特异性分子信息和治疗特异性分子信息进一步与临床‑分子疾病模型、特别是代表其参与疾病的若干方面的基因和/或蛋白质的评分相组合,本发明解决了其中患者具有多于一种“可作用的”畸变的情况。这样,可以分别对最可能影响疾病机理或受疾病机理影响的治疗和患者进行优先化。
- 利用外切酶组合消除三维基因组学技术噪音的方法及应用-201810589904.0
- 张玉波;孔思远;张高林;黄其通;范磊;李清;黄雷;彭艳玲 - 中国农业科学院农业基因组研究所
- 2018-06-08 - 2018-11-13 - G06F19/18
- 本发明公开了一种利用外切酶组合消除三维基因组学技术噪音的方法及应用,该方法是通过在三维基因组学技术的关键步骤邻近连接时加入外切酶组合消除邻近连接后线性DNA,提高环状有效互作比例。本发明通过外切酶组合在消除线性DNA中的优越表现为在C‑技术连接后通过外切酶组合酶切消除“噪音”提供了一种有效手段,本发明利用外切酶组合酶切反应消除三维基因组学技术噪音的方法具有方便、快捷、高效的优点,能够降低产生假阳性产物或者信号的可能性,增加有效互作环状DNA占比,大大提高终端有效互作数据产出比例,节约测序空间,降低测序成本,简化了后期利用复杂的生物信息手段消除大数据中无效信息所耗费的资源。
- 无创检测母体和胚胎遗传异常的装置-201810696892.1
- 王海龙;唐元华 - 首度生物科技(苏州)有限公司
- 2018-06-29 - 2018-11-13 - G06F19/18
- 本发明提供了无创检测母体和胚胎遗传异常的装置。本发明实现了胚胎遗传异常的无创检测,可以同时无创检测胚胎染色体非整倍性;可同时无创检测母体的基因遗传异常。本发明相对于目前普遍使用的无创产前胚胎染色体非整倍体检测增加了新的检测功能,但是不增加检测费用,大量节约成本。
- 一种基因检测系统及其检测方法-201810467045.8
- 杨京忠;王欢;陈明林;陶红;李珊;马欣 - 成都奇恩生物科技有限公司
- 2018-05-16 - 2018-11-09 - G06F19/18
- 本发明公开了一种基因检测系统,包括分布式行为跟踪组件、数据库单元、文件服务器、搜索引擎、数据分析单元、报告创建单元、报告编写单元、样本跟踪管理单元、项目跟踪管理单元、权限管理单元和信息检索单元;一种基于基因检测系统的检测方法,包括如下步骤:S1、输入基因检测样本;S2、进行检测实验;S3、进行分析;S4、更新样本状态;S5、编写检测报告;S6、生成PDF检测报告;S7、对PDF检测报告进行审核;S8、输出合格的PDF检测报告并发送给检测请求者。本发明整合了基因检测、样本跟踪管理和数据分析的功能,解决了现有技术信息传递步骤繁琐、效率低、人力投入大、实用性低以及检测效果差的问题。
- 蛋白质间相互作用的预测方法、装置、终端及介质-201810336808.5
- 李坚强;史晓峰;明仲;李赛玲 - 深圳大学
- 2018-04-16 - 2018-11-06 - G06F19/18
- 本发明适用生物技术领域,提供了一种蛋白质间相互作用的预测方法、装置、终端及存储介质,该方法包括:当接收到对两个蛋白质之间的相互作用的进行预测的请求时,获取两个待预测蛋白质的序列,然后通过SIFT算法从两个待预测蛋白质的序列中获取两个待预测蛋白质的序列特征子,最后通过预先训练好的WELM分类器对两个待预测蛋白质的序列特征子进行相互作用预测,以确定两个蛋白质之间是否存在相互作用,从而通过评价指标较高的预先训练好的WELM分类器对待预测蛋白质的序列特征子进行预测,提高了预测结果的准确性。
- ACE抑制肽的定量构效关系模型及其应用-201810538033.X
- 高丹丹;李明生;张福梅;田晓静;丁功涛;陈士恩;马忠仁 - 西北民族大学
- 2018-05-30 - 2018-11-06 - G06F19/18
- 本发明提供了一种ACE抑制肽定量构效关系模型及应用,具体提供了ACE抑制二、三、四、五、六肽的定量构效关系模型及应用。定量构效关系模型的预测包括具有高活性ACE抑制肽源的发现以及对已知肽序列活性的预测。本发明式①‑⑤所述模型的匹配度和预测能力都较好。可以利用其寻找具有较高ACE抑制活性的肽序列或预测ACE抑制活性。
- 真核生物保守转录因子结合位点聚集区TFCR的识别方法与应用-201810554100.7
- 陈河兵;李昊;李宛莹;江帅;李睿江;张卓;伯晓晨 - 中国人民解放军军事科学院军事医学研究院
- 2018-05-31 - 2018-11-02 - G06F19/18
- 本发明提供了真核生物保守转录因子结合位点聚集区TFCR的识别方法与应用,属于生物信息技术领域。本发明提供的真核生物保守转录因子结合位点聚集区TFCR的识别方法,通过将测序得到基因组数据和转录因子数据,通过高斯分布计算,得到目标物种的转录因子结合位点碱基序列,通过多个物种的序列比对,得到物种保守的转录因子结合位点聚集区;因此可以将该方法应用到物种基因功能或者进化的研究中。
- 一种生物计算机的四进制编码方法-201810562667.9
- 班书昊;李晓艳;蒋学东 - 常州大学
- 2018-06-04 - 2018-11-02 - G06F19/18
- 本发明公开了一种生物计算机的四进制编码方法,属于生物计算机领域。它包括制作蛋白质基底芯片;将四种碱基与四进制数建立一一映射关系;单链DNA片段通过碱基配对原则实施逻辑运算;依次读取单链DNA片段上的碱基,并翻译成四进制数。本发明是一种利用蛋白质作为芯片基底、采用含四种基因碱基的脱氧核苷酸编码四进制数、适用于生物计算机的四进制编码方法。
- 一种检测基因组拷贝数变异的方法-201510744574.4
- 陆思嘉;薄世平;马淑杰 - 上海序康医疗科技有限公司
- 2015-11-05 - 2018-11-02 - G06F19/18
- 本发明涉及一种检测基因组拷贝数变异的方法,具体包括以下步骤:对样本基因组进行测序,以获得基因组序列;将序列比对到参考基因组,得到序列在基因组上的位置;将参考基因组分成一定长度的窗口,统计落在每个窗口的序列及碱基;根据每个窗口的序列及碱基GC含量,对每个窗口做校正;确定拷贝数正常的阈值,扫描每个窗口,确定窗口拷贝数是否变异;精确扫描异常的窗口,以确定精确的断点,来确定拷贝数变异的具体位置。本发明利用三均值,通过窗口校正、确定拷贝数正常的阈值、精确扫描异常窗口、确定精确的断点和拷贝数变异的具体位置,能够提高基因组拷贝数变异检测的灵敏性,其操作简便可行、效率高、成本低,有利于推广和应用。
- 一种基于结点关系对的复合功能模块识别方法及系统-201810502270.0
- 杨亦 - 湖南女子学院
- 2018-05-23 - 2018-10-26 - G06F19/18
- 本发明公开了一种基于结点关系对的复合功能模块识别方法,包括以下步骤:利用Elastic Net预测调控关系,构建出复合生物网络;根据提出的结点关系对R‑pair概念,将含有R‑pair结构的初始功能子模块作为核,用于在复合网络中识别出复合功能模块CMFM。本发明实现简单,与现有方法比,具有较高的识别效率,同时能找到具有更强生物意义的模块,对于复杂疾病的诊断和预后分析具有重要的理论意义和实用价值。
- 一种基于基因组组装的变异检测方法和装置-201510043893.2
- 黄树嘉;刘斯洋;叶伟健;饶俊华 - 深圳华大智造科技有限公司
- 2015-01-28 - 2018-10-26 - G06F19/18
- 本发明公开了一种基于基因组组装的变异检测方法和装置,所述方法包括:获取来源于梯度测序文库的测序读段序列;对测序读段序列进行过滤;将已经过滤的读段序列拼接成平均长度达到第四预设值的长序列;将拼接得到的长序列比对到参考基因组上;和对序列比对结果进行变异检测,获取序列变异。本发明的方法有效解决了变异检测“暗区”、长序列插入和复杂结构性变异的检测难题。
- 一种参数最优的肺癌癌细胞检测仪-201810458000.4
- 刘兴高;高信腾;孙元萌 - 浙江大学
- 2018-05-14 - 2018-10-16 - G06F19/18
- 本发明公开了一种参数最优的肺癌癌细胞检测仪,该系统由基因微阵列读入模块、数据预处理及特征排序模块、参数寻优模块、模型输出模块组成。系统首先将输入的基因微阵列数据预处理,然后对剩余的各个基因进行重要性排序,通过统计分数计算相关性,再利用分类器准则函数计算贡献度,将所有基因重要性进行排序。改进的优化方法在原始的智能寻优算法下加入了适应度检测与种群扰动,能够防止种群多样性散失以及优化过程陷入局部最优。然后将搜寻到的最优参数作为分类器参数完成模型构建并输出结果。系统速度快,适合在线检测。
- 一种智能白血病癌细胞检测仪-201810458515.4
- 刘兴高;高信腾 - 浙江大学
- 2018-05-14 - 2018-10-12 - G06F19/18
- 本发明公开了一种智能白血病癌细胞检测仪,该系统由基因微阵列读入模块、数据预处理及特征排序模块、参数寻优模块、模型输出模块组成。系统首先将输入的基因微阵列数据预处理,然后对剩余的各个基因进行重要性排序,通过统计分数计算相关性,再利用分类器准则函数计算贡献度,将所有基因重要性进行排序。改进的优化方法在原始的智能寻优算法下加入了适应度检测与种群扰动,能够防止种群多样性散失以及优化过程陷入局部最优。然后将搜寻到的最优参数作为分类器参数完成模型构建并输出结果。系统具有很好的去相关性,精度高。
- 基于表型分析的眼部生理信息的基因组分析方法和装置-201710153482.8
- 蓝章彰;杨传春;许详阳;陈川;张文勇 - 深圳市乐土精准医疗科技有限公司
- 2017-03-15 - 2018-10-09 - G06F19/18
- 本发明公开了一种基于表型分析的眼部生理信息的基因组分析方法和装置。本发明的方法包括:获取给定表型信息以及与眼部生理信息相关的注释基因组信息,获取等位基因频率数据库、突变预测数据库、人类遗传变异数据库和人类表型数据库中的数据;计算变异位点分值;计算与给定表型信息相关的眼部生理信息的相关系数;计算变异位点分值和相关系数的加权数值,并依据加权数值获得最相关的眼部生理信息。本发明的方法能够自动化筛选出与给定表型符合的候选基因以及变异位点,并根据相关性评分,获得最可能与给定表型相关的眼部生理信息。
- 基于多种群协助的量子遗传算法的RNA二级结构预测方法-201810220951.8
- 王云江;许青山;石莎;刘阳;王增斌 - 西安电子科技大学
- 2018-03-16 - 2018-10-09 - G06F19/18
- 本发明属于生物信息学技术领域,公开了一种基于多种群协助的量子遗传算法的RNA二级结构预测方法,根据RNA序列建立序列的茎区池和茎区相容矩阵;用量子比特向量来初始化多个染色体种群;对各种群量子测量;根据测量结果获取最优个体;取得全部种群中的最优个体b,并用它替换其他种群中最优个体和b非同源的最差个体,然后各种群用不同的旋转角更新,而其他不参与替换的种群用固定旋转角更新;迭代上述过程,直到满足停止条件。本发明有效的提升了量子遗传算法的全局搜索能力和搜索效率,降低了遗传算法的进化代数。同时各种群间抑制竞争相互合作有效的提升了算法的全局性,预测准确性大幅度增加。
- 检测染色体非整倍性的方法、装置及系统-201810425695.6
- 曾立董;吴增丁;金欢;徐伟彬;李林森;赵陆洋;张萌;颜钦 - 深圳市瀚海基因生物科技有限公司
- 2018-05-07 - 2018-10-09 - G06F19/18
- 本发明公开了一种检测染色体非整倍性的方法、装置及系统。方法包括:对待测样本中的至少一部分核酸进行测序,获得包括读段的测序结果;将读段比对到第一参考序列,获得比对结果,比对结果包括读段定位于具体染色体的信息;对于第一染色体,基于比对结果,确定定位到该第一染色体的读段的量;比较定位到该第一染色体的读段的量与阴性样本中的定位到相应第一染色体的读段的量,以判定该第一染色体的数目。利用该方法进行染色体非整倍性检测,获得的检测结果具有较高灵敏度和准确性。
- 一种基于多元格兰杰检验的信号传导网络构建方法-201610137995.5
- 李敏;郑瑞清;王建新 - 中南大学
- 2016-03-14 - 2018-10-09 - G06F19/18
- 本发明公开了一种基于多元格兰杰检验的信号传导网络构建方法,对输入的时序基因表达数据进行二范数规范化;对二范数规范化后的t个时间片的基因表达数据,分别构建1~t‑1和2~t时序基因表达矩阵,并建立基于阶马尔卡夫的线性方程,通过奇异值分解计算获得系数矩阵和表达值矩阵,并根据所得的系数矩阵计算残差值Rss*;对每一个基因都将其时序基因表达打乱,并计算打乱后的残差值,获得残差分布Rss,对Rss*在Rss中进行排序,获得系数的显著性α。本发明的方法适用于真实的时序基因表达数据时间片过少的情况,并有效提高了有向推断的准确性。
- 一种用于蛋白质功能预测的层级多标签分类方法-201610452113.4
- 冯收;付平;石金龙;郑文斌;徐明珠;鲁健捷;贾现召;周颖 - 哈尔滨工业大学
- 2016-06-21 - 2018-10-02 - G06F19/18
- 一种用于蛋白质功能预测的层级多标签分类方法,涉及生物信息学及数据挖掘领域,尤其涉及一种用于蛋白质功能预测的层级多标签分类方法。本发明要为解决现有分类方法用于预测蛋白质功能时,存在数据集不平衡问题、多标签问题和层级约束问题。本发明所述方法按以下步骤进行:一、训练阶段:在训练阶段针对类标签层级结构中的每个节点的数据集采用一个SVM分类器进行训练,得到一组基础分类器;二、预测阶段:在预测阶段首先使用训练阶段获得的这组基础分类器得出未知样本的初步结果,而后采用带权重的TPR算法对结果进行处理,得到满足层级约束条件的最终结果,实现对蛋白质功能的预测。本发明应用于生物信息学及数据挖掘领域。
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用