[发明专利]微生物的多关联网络计算方法、装置、设备及存储介质有效
申请号: | 202010149870.0 | 申请日: | 2020-03-06 |
公开(公告)号: | CN111477267B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 陈挺;王欣;杨煜清;朱丛敏 | 申请(专利权)人: | 清华大学 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B30/10;G16B30/20;G16B40/00 |
代理公司: | 北京华专卓海知识产权代理事务所(普通合伙) 11664 | 代理人: | 彭锐 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微生物 关联 网络 计算方法 装置 设备 存储 介质 | ||
本申请公开一种微生物的多关联网络计算方法、装置、设备及存储介质,本申请提出了一种新型贝叶斯模型,在考虑环境因素变化的情况下推断多个关联网络,进而能够自动推断数据集中环境条件的数目和每种环境条件下的微生物‑微生物和微生物‑环境因子关联。与此同时,本申请实施例提出了基于分治策略的优化算法。基于分治策略的算法同时结合聚类与最大后验估计,能够有效求解隐变量和关联网络对应参数。
技术领域
本申请涉及微生物环境分析领域,尤其涉及一种微生物的多关联网络计算方法、装置、设备及存储介质。
背景技术
微生物之间及微生物与环境之间的交互会随着时间或环境因素的改变而发生动态变化,在丰度变化上呈现出非线性关联。微生物群落中关联的变化依赖于当前所处的环境条件,即环境因素的值处于某一特定范围时所描述的环境。在相似的环境条件下,微生物群落中的交互是稳定的,并且会随着环境条件的改变而发生变化。为了确定数据集中可能的环境条件和单个环境条件下的微生物关联网络,需要新的计算工具。传统的关联推断算法均假设微生物群落中只有一个关联网络,忽视了微生物交互动态变化的本质,这无疑会误导我们对微生物交互的研究。
发明内容
本申请目的在于公开一种微生物的多关联网络计算方法、装置、设备及存储介质,用于在每个环境条件下,能够结合组成成分偏差和过度散布,推断条件依赖的微生物-微生物关联和直接的微生物-环境关联。
本申请第一方面公开一种微生物的多关联网络计算方法,所述方法包括:
获取测序样本数据集及环境因素集
初始化所述测序样本数据集和所述环境因素集的根节点node0,其中,|node0|=N
根据所述测序样本数据集和所述环境因素集的根节点node0、二成分高斯混合模型递归划分所述测序样本数据集和所述环境因素集,并得到所述测序样本数据集和所述环境因素集的至少两个子节点,其中,一个节点nodek+1={Xk+1,Mk+1},另一个子节点nodek+2={Xk+2,Mk+2},且|nodek+1|=Nk+1,|nodek+2|=Nk+2,所述nodek+1和nodek+2构成一个样本簇;
确定节点nodek+1和节点nodek+2的B′、Θ′,所述B′表征第k+1个环境条件下的环境因素与微生物之间的关联网络,Θ′表征微生物之间的关联网络。
在一些可选的实施方式中,在所述获取测序样本数集之后,根据所述测序样本数据集和所述环境因素集的根节点node0、二成分高斯混合模型递归划分所述测序样本数据集和所述环境因素集,并得到所述测序样本数据集和所述环境因素集的至少两个子节点之后,所述方法还包括:
获取所述测序样本数据集和所述环境因素集的样本簇最小值Nmin。
在一些可选的实施方式中,所述根据所述测序样本数据集和所述环境因素集的根节点node0、二成分高斯混合模型递归划分所述测序样本数据集和所述环境因素集,并得到所述测序样本数据集和所述环境因素集的至少两个子节点,包括:
根据所述测序样本数据集和所述环境因素集的根节点node0、二成分高斯混合模型递归划分所述测序样本数据集和所述环境因素集,直至节点nodek+1的Nk+1和nodek+2的Nk+2大于所述样本簇最小值Nmin。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010149870.0/2.html,转载请声明来源钻瓜专利网。