[发明专利]一种归一化并比较水平基因转移网络的方法在审
申请号: | 202211727781.5 | 申请日: | 2022-12-30 |
公开(公告)号: | CN115966250A | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 陈银;赵梓丞;李静 | 申请(专利权)人: | 深圳百人科技有限公司 |
主分类号: | G16B5/20 | 分类号: | G16B5/20;G16B30/00;G16B40/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518118 广东省深圳市坪山区坑梓街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 归一化 比较 水平 基因 转移 网络 方法 | ||
本发明公开了一种归一化并比较水平基因转移网络的方法,包括以下步骤:S1:采用贝叶斯概率模型将HGT根据测序量进行归一化;S2:在HGT网络中,将每个基因组被表示为一个顶点,其中,如果HGT发生在两个基因组之间,则在两个顶点之间有一条边;S3:采用不同的分类级别对基因组序列进行注释,得到了不同分类等级的HGT网络;S4:通过图的密度、传递性、同配性和代数连通性几种拓扑性质对HGT网络进行分析。使用图密度、传递性、同配性和代数连通性来描述网络,并在不同组别间的样本中比较HGT网络,以对宏基因组和人体表型关联提供新的分析方向,通过计算多种拓扑属性来分析HGT网络,也能更加系统性地建模并分析宏基因组。
技术领域
本发明涉及基因转移网络技术领域,尤其涉及一种归一化并比较水平基因转移网络的方法。
背景技术
人体微生物和人类有着复杂的相互作用。研究发现,人体微生物和多种疾病都相关。人体微生物是个复杂的生态系统,以肠道微生物组为例,Ferretti等人利用菌株水平的宏基因组图谱来跟踪母婴间的细菌传播;他们发现母婴对中共有的菌株;在最近关于肠道微生物组的研究中,不少研究者建立了宏基因组和人类表型之间的联系,但这些工作未能从系统的角度对肠道微生物组进行建模。近年,研究人员应用HGT网络分析宏基因组,提取微生物组的特征,并探寻微生物组和表型的关联。
存在的缺点或不足:
虽然目前研究者建立了宏基因组和人类表型之间的联系,但是这些工作无法从系统的角度对肠道微生物区系进行建模。HGT网络是一种系统性分析宏基因组的工具,然而由于HGT网络会受到测序数据量的影响,可能会导致一些假阳性的宏基因组和表型的关联,因此需要归一化并比较水平基因转移网络。本发明涉及一种归一化HGT网络,并计算HGT网络拓扑属性的方法。可以标准化的比较试验组和对照组的宏基因组,从而系统性地建模并分析宏基因组。
发明内容
本发明的目的是为了解决现有技术中存在的缺陷,而提出的归一化并比较水平基因转移网络的方法。
为了实现上述目的,本发明采用了如下技术方案:
一种归一化并比较水平基因转移网络的方法,包括以下步骤:
S1:采用贝叶斯概率模型将HGT根据测序量进行归一化;
S2:在HGT网络中,将每个基因组被表示为一个顶点,其中,如果HGT发生在两个基因组之间,则在两个顶点之间有一条边;
S3:采用不同的分类级别对基因组序列进行注释,得到了不同分类等级的HGT网络;
S4:通过图的密度、传递性、同配性和代数连通性几种拓扑性质对HGT网络进行分析。
进一步地,在步骤S1中:使用LocalHGT来检测每个样本中的HGT,并且得到支持每个HGT断点对的reads数量,其中,当所有样本中的平均reads数目为Q时,根据模型推断;
当总reads数目为Q时,则支持每个HGT断点对的reads数目的概率分布,根据这个概率分布,过滤HGT断点;
过滤标准为:在总reads数目为Q的情况下,预期的reads数目大于x(默认为2)的概率高于90%。
进一步地,在步骤S4中:图密度表示图中存在的边的数目除以图可能具有的最大边数;
传递性为通过观察到的三角形数与图中可能的最大三角形数之比计算获得,传递性度量顶点的相邻顶点相互连接的总体概率;
同配性为图中的节点与具有相似度的节点相连接的趋势,通过关联度与关联度的皮尔逊相关系数来量化关联度;
代数连通度是图的拉普拉斯矩阵的第二小特征值;
拓扑属性是使用Python模块NetworkX计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳百人科技有限公司,未经深圳百人科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211727781.5/2.html,转载请声明来源钻瓜专利网。