[发明专利]一种基于深度学习的协同抗肿瘤多药组合效果预测方法在审
申请号: | 202010053045.0 | 申请日: | 2020-01-17 |
公开(公告)号: | CN111223577A | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 冯春来;陈恒巍;季薇;芮蒙杰 | 申请(专利权)人: | 江苏大学 |
主分类号: | G16H70/40 | 分类号: | G16H70/40;G16H20/10;G16B20/00;G16B25/00;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 协同 肿瘤 组合 效果 预测 方法 | ||
1.一种基于深度学习的协同抗肿瘤多药组合效果预测方法,其特征在于,包括如下步骤:
步骤一:通过公共生物医学数据库挖掘大规模药物基因组学数据,其中包括不同肿瘤细胞的特征基因表达数据、抗肿瘤化合物及其作用靶点信息和药物敏感性数据;
步骤二:将收集得到的不同肿瘤细胞的特征基因表达数据、抗肿瘤化合物及其作用靶点信息和药物敏感性数据分别进行数据清洗及其标准化,将不同特征的大规模数据进行有效整合,构建建模样本;
步骤三:基于构建样本的大规模数据,利用深度学习算法分别构建分类、回归预测模型;
步骤四:基于网格搜索算法与交叉验证对模型的关键参数进行优化,提高模型的预测性能。
2.如权利要求1所述的一种基于深度学习的协同抗肿瘤多药组合效果预测方法,其特征在于,所述步骤一包括如下步骤:
1.1从ArrayExpress数据库中收集肿瘤细胞的特征基因表达数据;
1.2从包括Genomics of Drug Sensitibity in Cancer(GDSC)、PubChem、DrugBank、Naturally occuring Plant based Anticancerous Compound-Activity-TargetDataBase(NPACT)在内的数据库及文献中收集抗肿瘤化合物及其作用靶点信息;
1.3从GDSC、NPACT数据库及文献中收集抗肿瘤化合物对不同肿瘤细胞的药物敏感性数据。
3.如权利要求1所述的一种基于深度学习的协同抗肿瘤多药组合效果预测方法,其特征在于,所述步骤二包括如下步骤:
2.1基于R语言及Bioconductor R包,对收集得到的不同肿瘤细胞的基因表达数据进行预处理;其中,通过Impute包对基因表达的缺失值及无效值进行填充,通过Limma包对基因表达数据进行标准化;进行缺失值及无效值填充,以及数据标准化;
2.2按照基因芯片的注释文件,将标准化的基因表达数据的探针ID与相应的genesymbol进行逐一匹配;
2.3对处理后的基因表达数据进行特征基因挑选,通过选取cBioPortal中涉及肿瘤信号通路上的基因集作为肿瘤细胞最终的特征基因;
2.4将收集得到的化合物及其靶点信息进行去重、匹配,构建化合物-靶点信息样本特征;
2.5将处理后的不同肿瘤细胞特征基因表达数据、化合物及其靶点信息和药物敏感性数据按照肿瘤细胞-化合物-敏感性数据样本特征进行数据整合,进一步通过Scikit-learn机器学习库中的StandardScaler函数对样本数据进行无量纲化处理,构建最终建模样本数据;
2.6将药物敏感性数据进行对数转化,作为回归预测模型的样本标签;
2.7对药物敏感性数据进行阈值划分,其中化合物对肿瘤细胞的IC50小于或等于10μM作为阳性样本,化合物对肿瘤细胞的IC50大于10μM作为阴性样本,将其作为分类预测模型的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010053045.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:光通信装置和光通信方法
- 下一篇:送料装置、贴胶装置和送料方法