[发明专利]一种诊断引导群稀疏多任务学习方法在审
申请号: | 202011624927.4 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112786114A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 林安石;孔薇 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G16B50/00 | 分类号: | G16B50/00;G16B40/00;G16B20/20;G06F17/18;G06F17/16 |
代理公司: | 上海互顺专利代理事务所(普通合伙) 31332 | 代理人: | 成秋丽 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 诊断 引导 稀疏 任务 学习方法 | ||
本发明提供诊断引导群稀疏多任务学习方法,包括:建立基于影像表型连续响应的回归分析计算公式;基于被试样本与诊断标签之间的关系信息,建立正则化项来利用类级别的诊断信息,当被试样本在原始诊断特征空间中相似时,其各自的响应值也相似;使用正则化的形式来处理SNP之间的群体关联,建立基于多特征和多响应的诊断引导信息多任务学习模型。诊断引导群稀疏多任务学习方法弥补了传统方法在共享回归框架和数据空间中忽视基因分型数据和成像表型数据内部结构的不足,将原来分散的成像表型限制在一个更近的空间区域内,学习模型可以充分利用先验的生物学和诊断信息来提高模型的预测性能,提高遗传性状标记(SNP)的选择能力。
技术领域
本发明涉及影响遗传学技术领域,特别涉及一种诊断引导群稀疏多任务学习方法。
背景技术
影像遗传学是一个前沿的多学科研究领域,其目的是从大脑解剖或功能图像中确定基因变异与测量值之间的关系。在传统的关联研究中,常用成对单变量分析方法快速检测单核苷酸多态性(SNPs)与数量性状(QTs)之间的关联信息。然而,它把SNP和QT作为孤立的单元,忽略了SNP之间的潜在相互作用,也没有考虑到大脑表型之间的相互关系。因此,这些单元之间的潜在交互作用可能会丢失,从而导致对关联的弱检测。为了解决这些问题,人们提出了多变量或多站点方法(例如,在模型中添加多个SNP相关性)来检测单变量方法遗漏的SNP。此外,通过全基因组关联研究(GWAS)的结果,基于SNP连锁不平衡(LD)、次要等位基因频率(MAF)、因果SNP效应的跨群体相关性和遗传力进行先验多变量关联分析,在进行生物信息学预测的同时,也获得了许多有价值的研究成果。
然而,一般的多变量遗传关联研究和最近的影像遗传学研究中提出的模型仍然没有考虑其他有价值的先验信息(如诊断引导信息等)来提高联合模型的预测精度。首先,同一基因的多个SNP通常一起执行相同的遗传功能。其次,人脑中某些功能的实现通常是通过多个大脑区域来实现的。因此,单独研究某个脑区的成像表型,必然会失去它们之间的相互作用。虽然我们在关联分析中考虑了SNP结构信息和代谢过程中多个脑区的相互作用,这将大大提高模型的预测精度和发现潜在隐藏信息的能力,在以前的研究中,一个测试用例通常同时包含患病和健康的感兴趣区域(ROI)。换言之,具有不同类型病理特征的大脑区域只能随机分散在测试用例中。当对模型进行回归分析时,这些成像维度空间中的不同距离将限制模型参数的进一步优化,导致回归参数停滞在某个局部极大值,使其无法达到全局最优,不可避免地限制了模型的回归预测能力模型。
发明内容
本发明的目的在于提供一种诊断引导群稀疏多任务学习方法,以解决对模型进行回归分析时,成像维度空间中的不同距离将限制模型参数的进一步优化的问题。
为了解决上述技术问题,本发明的技术方案是提供一种诊断引导群稀疏多任务学习方法,包括:步骤一、建立基于影像表型连续响应的回归分析计算公式;步骤二、基于被试样本与诊断标签之间的关系信息,建立正则化项来利用类级别的诊断信息,当被试样本在原始诊断特征空间中相似时,其各自的响应值也相似;步骤三、使用正则化的形式来处理SNP之间的群体关联,将每个SNP作为一个特征,将每个QT作为一个响应变量,建立基于多特征和多响应的诊断引导信息多任务学习模型。
进一步地,步骤一中的回归分析计算公式:受试参与者的SNP数据X=[x1,...,xN]T∈RN×d和成像表型数据Y=[y1,...,yN]T∈RN×c,其中N是参与者的数量,d是SNP的数量,c是显型的成像数量,线性回归模型:Y=XW+ε,其中,W是分配给各个特征的系数矩阵,ε是误差项,施加L2范数正则化,如下所示:
其中,权重矩阵W是测量第i个SNP在预测第j个成像表型反应中的相对重要性,γ0是一个权衡参数。
进一步地,步骤二中建立正则化项来利用类级别的诊断信息:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011624927.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种长碳链聚酰胺弹性体的制备方法
- 下一篇:图像特征值数据的同步方法及系统