[发明专利]一种整合图像空间信息的基于体素点全基因组关联分析方法在审
申请号: | 201810200077.1 | 申请日: | 2018-03-12 |
公开(公告)号: | CN108345769A | 公开(公告)日: | 2018-07-31 |
发明(设计)人: | 黄美燕;冯前进;邓春燕;阳维 | 申请(专利权)人: | 南方医科大学 |
主分类号: | G06F19/22 | 分类号: | G06F19/22;G06F19/18;G06T7/00 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 赵蕊红 |
地址: | 510515 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像数据 整合 图像空间 关联分析 全基因组 空间结构 体素 基因数据 空间信息 目标对象 生物结构 信息整合 重要信息 性能力 检测 分析 | ||
一种整合图像空间信息的基于体素点全基因组关联分析方法,包括以下步骤:(1)收集图像数据和基因数据;(2)整合图像数据的空间信息,对目标对象的图像数据进行处理获得整合了图像空间信息的图像数据:(3)对基因数据和图像数据进行FVGWAS分析。该整合图像空间信息的基于体素点全基因组关联分析方法,由于个体本身固有的生物结构和功能,图像数据具有空间结构相关性,这些空间结构包含了大量的重要信息,把这些信息整合到VGWAS方法。具有检测性能力强,精度高,计算简单的特点。
技术领域
本发明涉及基因组关联分析技术领域,特别是涉及一种整合图像空间信息的基于体素点全基因组关联分析方法。
背景技术
基于体素点全基因组关联分析(The Voxel-Wise Genome-Wide AssociationAnalysis,VGWAS)的基本思想是联合基因数据和图像数据进行分析,来检测遗传性神经精神疾病和神经退行性疾病的重要生物标记物,这对于遗传性神经精神疾病和神经退行性疾病的预测、诊断、治疗和监控是至关重要的。特别地,图像数据中固有的空间结构信息的利用,可提高检测重要生物标记物的准确性和可靠性。
传统的VGWAS分析是基于体素点的分析方法,即假设体素点间是互相独立的,然后将每个体素点和预测看作是独立的单元来计算基因-体素点对的显著关联性。这种VGWAS分析方法不需要疾病的病理学先验知识来选择感兴趣的候选表型和/或候选基因型,同时由于是对整个基因组及全脑图像进行研究,VGWAS可以降低丢失重要基因及病变脑区的概率。然而,在VGWAS研究中存在着一些问题。一方面,由于测试的全基因组、相关信号所在的脑部位置、以及研究个体数目的庞大,VGWAS面临着数据量庞大以及计算速度慢的问题,不能满足我们在实际应用中需求。另一方面,VGWAS是对每个体素点独立分析,因而忽略了图像数据固有的空间特征信息,由于个体本身固有的生物结构和功能,图像数据包含着大量的体素点,而且具有复杂空间模式,因此,图像数据具有空间结构相关性。这些空间结构包含了大量的重要信息,对准确估计和预测AD潜在生物标记物是十分重要的。此外,疾病造成脑的结构改变可能会发生在一个相对较大的脑区。故而,这种未考虑图像空间特征信息的VGWAS研究可能检测到错误的结果或可能会遗漏一些重要的生物标记物,因此VGWAS分析方法具有较大的局限性。
因此,针对现有技术不足,提供一种整合图像空间信息的基于体素点全基因组关联分析方法以解决现有技术不足甚为必要。
发明内容
本发明的目的在于避免现有技术的不足之处而提供一种整合图像空间信息的基于体素点全基因组关联分析方法,该整合图像空间信息的基于体素点全基因组关联分析方法具有检测性能力强,精度高,计算简单的特点。
本发明的上述目的通过如下技术手段实现。
提供一种整合图像空间信息的基于体素点全基因组关联分析方法,包括以下步骤:
(1)收集图像数据和基因数据;
(2)整合图像数据的空间信息,对目标对象的图像数据进行处理获得整合了图像空间信息的图像数据:
(3)对基因数据和图像数据进行FVGWAS分析,具体包括,
(3.1)对图像数据和基因数据构建一个回归模型,对一个给定的显型使用检验统计的方法来检验每个位点上无关联的空假设;
(3.2)对所有基因数据,计算全局Wald型检验,然后对全局Wald型检验的p值进行排序,选出前N0个位点作为候选显著关联位点,以筛掉大部分含“噪声”的位点,N0为自然数;
(3.3)执行基于bootstrap的检测过程,分别用来检测显著的基因-体素点对和显著的基因-团对。
优选的,上述步骤(1)收集图像数据和基因数据,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方医科大学,未经南方医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810200077.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用