[发明专利]药物敏感预测模型的训练方法、预测方法及相关装置在审
申请号: | 202011492075.8 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112599218A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 王爱兰;倪海洪;翟晓庆 | 申请(专利权)人: | 北京深度制耀科技有限公司 |
主分类号: | G16H20/10 | 分类号: | G16H20/10;G16H50/70 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张静 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 药物 敏感 预测 模型 训练 方法 相关 装置 | ||
1.一种药物敏感预测模型的训练方法,其特征在于,包括:
获取多个细胞系中每个所述细胞系的代谢物特征及每个所述细胞系的药物反应参数IC50;
对每个所述细胞系,基于所述药物反应参数IC50,确定药物应答类别;
对构建的每个癌症细胞系药物敏感预测模型,从多个所述细胞系中抽样出第一设定个数的细胞系,作为训练细胞系,对每个所述训练细胞系,执行多次重要特征筛选过程;
每次所述重要特征筛选过程,包括:将所述训练细胞系的代谢物特征输入到所述癌症细胞系药物敏感预测模型,得到所述癌症细胞系药物敏感预测模型输出的重要特征集;
对每个所述训练细胞系的每个代谢物特征,统计所述代谢物特征在每个所述癌症细胞系药物敏感预测模型多次输出的重要特征集中出现的次数,作为被选中次数;
对每个所述训练细胞系的每个所述代谢物特征,将所述代谢物特征的多个所述被选中次数中的最大值作为目标次数;
对多个所述目标次数进行从大到小排序,得到目标排序结果,将所述目标排序结果中第一个至第m个目标次数对应的代谢物特征,作为待使用代谢物特征;
利用所述待使用代谢物特征,及所述待使用代谢物特征所属细胞系的药物应答类别对待训练癌症细胞系药物敏感预测模型进行训练。
2.根据权利要求1所述的方法,其特征在于,所述将所述训练细胞系的代谢物特征输入到所述癌症细胞系药物敏感预测模型,得到所述癌症细胞系药物敏感预测模型输出的重要特征集,包括:
利用归一化关系式(x-min_x)/(max_x-min_x),将所述训练细胞系的每个代谢物特征进行归一化,得到归一化后的代谢物特征;
所述x表示所述代谢物特征在所述细胞系中的含量,min_x为所述代谢物特征在多个所述细胞系中的含量的最小值,max_x为所述代谢物特征在多个所述细胞系中的含量的最大值;
将所述训练细胞系的归一化后的代谢物特征输入到所述癌症细胞系药物敏感预测模型,得到所述癌症细胞系药物敏感预测模型输出的重要特征集。
3.根据权利要求1所述的方法,其特征在于,所述利用所述待使用代谢物特征,及所述待使用代谢物特征的药物应答类别对待训练癌症细胞系药物敏感预测模型进行训练,之后:
从多个所述细胞系中抽样出第二设定个数的细胞系,作为测试细胞系,分别利用所述待训练癌症细胞系药物敏感预测模型对各个所述测试细胞系的每个代谢物特征进行多次预测,得到预测结果;
对各个所述预测结果进行评估,得到评估结果;
基于多个所述评估结果,判断所述待训练癌症细胞系药物敏感预测模型是否满足设定要求;
若满足,结束训练;
若不满足,则返回执行所述获取多个细胞系中每个所述细胞系的代谢物特征及每个所述细胞系的药物反应参数IC50的步骤。
4.根据权利要求3所述的方法,其特征在于,所述对各个所述预测结果进行评估,得到评估结果之前,还包括:
基于每个所述测试细胞系中每个所述代谢物特征的多个所述预测结果,判断多个所述训练细胞系中是否存在异常细胞系;
若存在,则剔除多个所述训练细胞系中的异常细胞系,将剔除所述异常细胞系后的细胞系作为训练细胞系,并返回执行所述对每个所述训练细胞系,执行多次重要特征筛选过程的步骤;
若不存在,则对各个所述预测结果进行评估,得到评估结果;
基于所述评估结果,判断所述待训练癌症细胞系药物敏感预测模型是否满足设定要求;
若满足,结束训练;
若不满足,则返回执行所述获取多个细胞系中每个所述细胞系的代谢物特征及每个所述细胞系的药物反应参数IC50的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京深度制耀科技有限公司,未经北京深度制耀科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011492075.8/1.html,转载请声明来源钻瓜专利网。