[发明专利]一种诊断引导群稀疏多任务学习方法在审
申请号: | 202011624927.4 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112786114A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 林安石;孔薇 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G16B50/00 | 分类号: | G16B50/00;G16B40/00;G16B20/20;G06F17/18;G06F17/16 |
代理公司: | 上海互顺专利代理事务所(普通合伙) 31332 | 代理人: | 成秋丽 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 诊断 引导 稀疏 任务 学习方法 | ||
1.一种诊断引导群稀疏多任务学习方法,其特征在于,包括:
步骤一、建立基于影像表型连续响应的回归分析计算公式;
步骤二、基于被试样本与诊断标签之间的关系信息,建立正则化项来利用类级别的诊断信息,当被试样本在原始诊断特征空间中相似时,其各自的响应值也相似;
步骤三、使用正则化的形式来处理SNP之间的群体关联,将每个SNP作为一个特征,将每个QT作为一个响应变量,建立基于多特征和多响应的诊断引导信息多任务学习模型。
2.如权利要求1所述的诊断引导群稀疏多任务学习方法,其特征在于,步骤一中的回归分析计算公式:受试参与者的SNP数据X=[x1,...,xN]T∈RN×d和成像表型数据Y=[y1,...,yN]T∈RN×c,其中N是参与者的数量,d是SNP的数量,c是显型的成像数量,线性回归模型:Y=XW+ε,其中,W是分配给各个特征的系数矩阵,ε是误差项,施加L2范数正则化,如下所示:
其中,权重矩阵W是测量第i个SNP在预测第j个成像表型反应中的相对重要性,γ0是一个权衡参数。
3.如权利要求2所述的诊断引导群稀疏多任务学习方法,其特征在于,步骤二中建立正则化项来利用类级别的诊断信息:
其中,S=[Sij]∈RN×N表示每对样本之间相似性的相似性矩阵,L表示拉普拉斯矩阵:
L=D-S
其中,D是元素定义为的对角矩阵,相似矩阵定义如下:
4.如权利要求3所述的诊断引导群稀疏多任务学习方法,其特征在于,使用正则化方法对SNP进行分组来挖掘基因型中的相关结构:其中,SNP被划分为K个组SNP通过对LD相关系数r2进行阈值化分组,r2≥0.2的相邻SNP形成一个群;
是有序的且连接后的W可表示为式中则上述等式重写如下:G2,1范数是关于划分的矩阵,其定义如下:
等式改写如下:通过正则化l2,1范数来联合选择多个任务的特征:其中,第一项是回归损失,第二项综合了所有任务的一组特征的回归系数,并结合了遗传连锁产生的特征分组信息,第三项惩罚每个个体特征的所有回归系数,以在多个学习任务中选择特征。
5.如权利要求4所述的诊断引导群稀疏多任务学习方法,其特征在于,诊断引导的群体稀疏多任务学习模型,如下所示:
其中,γ1,γ2和γ3表示正则化项的控制参数,它们的值通过训练数据的内部交叉验证来确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011624927.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种长碳链聚酰胺弹性体的制备方法
- 下一篇:图像特征值数据的同步方法及系统