[发明专利]水平转移基因的预测有效
申请号: | 201210170762.7 | 申请日: | 2012-05-29 |
公开(公告)号: | CN103294934B | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 沙米拉·谢克哈·马休;瓦伦·梅拉;塔里尼·山卡·果时 | 申请(专利权)人: | 塔塔咨询服务有限公司 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 倪小敏 |
地址: | 印度*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 水平 转移 基因 预测 | ||
技术领域
本发明大体涉及基因组学领域,特别是涉及水平转移基因的预测。
背景技术
基因组学在当今是非常活跃的研究领域。从生物体获得的遗传材料通常被测序以分成多个序列,这些序列被称为基因组序列。基因组序列可被进一步分析以研究相应基因组的特性,例如用以识别基因和研究构成基因组序列的基因之间的相互作用。为获得给定的生物体在其所处环境中运作和生存策略的整体观察,不仅需要独立研究每个单独的基因组,而且需要了解基因组信息在其环境中的各种生物体基因组之间的交换的程度和模式。
在相同环境样品中的各种生物体基因组的比较分析显示,存在这样的基因或基因簇,即这些基因或基因簇显示出与已建立的生命系统发育树不同的遗传模式。与其系统发育近亲相比,这些基因或基因簇显示出与来自属于不同分类进化枝的生物体的基因更高的序列同源性。
已观察到,这些基因或基因簇在栖息于相同微环境(即个体邻近)的生物体之间共享而不是在这些生物体的系统发育近亲之间共享。这种相同微环境内的不同生物体的个体邻近增加了遗传材料在各种物种之间交换的机会。
交换基因组材料的过程被称为水平基因转移或侧向基因转移,其结果导致一个生物体包含了来自另一生物体的部分遗传材料。这种基因转移事件可使来自“供体”基因组的大面积外源DNA(脱氧核糖核酸)插入到天然“受体”基因组中,并且通常观察到不同于天然受体基因组的寡核苷酸利用模式。这些交换的基因或基因簇被称为水平转移基因或HGT区。
水平转移基因赋予了生物体在给定环境中生长和生存的选择性优势。例如,这些基因或基因簇可赋予各种不同的特性,例如对很多抗生素的耐药性(例如多药耐药基因操纵子)、包含分泌系统(例如III型、IV型、VI型分泌系统)的毒性相关功能,以及提供对病原生物体的宿主免疫系统防卫机制的专门系统。这些也包括促进受体细胞向宿主细胞膜的趋化性和粘附的基因,甚至包括编码增加受体生物体在营养缺陷型环境中生存机会的专门代谢酶的基因。
因此,在不同生物体的基因组中有效检测出这些HGT区,对理解这些基因的可能的转移机制和发现增强受体生物体在各种微环境中的生存的特定功能非常有用。
发明内容
本部分用来介绍与水平转移基因的预测相关的理念,这些理念将在下文进一步详细描述。本部分并非用来确定要求保护的发明主题的必要特征,也并非用来确定或限定所要求保护的主题的范围。
本发明描述了预测水平转移基因的方法和系统。多个基因组片段(通过分离多个完全测序的微生物体的基因组获得)被转换成三维空间内的片段点(fragment point)。在该三维空间内定义出一个立方体,使得该立方体包括对应于所有基因组片段的片段点。该立方体被进一步分成多个较小的等尺寸的立方体(被称为网格(grid))。落入一个网格内的片段点被组合在一起并且计算出每个网格的质心。选择出具有对应于一个特定基因组的片段点的一个或多个网格,并将每个选择出的网格分类为相对该特定基因组是多数网格、少数网格和混合网格中的一个。而且,基于距离比评价,一个或多个基因组片段从少数网格和混合网格中被识别为水平转移基因。
附图说明
本发明将参考附图详细说明。在附图中,附图标记最左边的数字代表该附图标记首次出现时所在的图号。在附图中,相同附图标记用来表示相似的特征和组成。
图1(a)图示出根据本发明的一个实施方式的用于水平转移基因预测的示例性系统。
图1(b)图示出根据本发明的一个实施方式的网格构架,其显示对应基因组片段的片段点的定位模式。
图1(c)图示出根据本发明的一个实施方式的图表,其展示基于片段的阈值和数目将网格分类为多数网格、少数网格和混合网格。
图1(d)图示出根据本发明的一个实施方式的方法的图示,该方法用于基于片段点的位置而关联置信度。
图2图示出根据本发明的一个实施方式的用于预测水平转移基因的示例性方法。
图3图示出根据本发明的一个实施方式的将基因组片段转换成三维空间内的片段点的示例性方法。
图4图示出根据本发明的一个实施方式的在三维空间内定义具有网格和包括对应基因组片段的片段点的立方体的示例性方法。
图5图示出根据本发明的一个实施方式的用于将选择出的网格分类为多数网格、少数网格和混合网格中的一种的示例性方法。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于塔塔咨询服务有限公司,未经塔塔咨询服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210170762.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用