[发明专利]基于迁移学习的生物大分子体系数据库构建方法及系统在审
申请号: | 202210880897.6 | 申请日: | 2022-07-26 |
公开(公告)号: | CN115171794A | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 李金金;汪志龙;韩彦强 | 申请(专利权)人: | 上海茵肽信息科技有限公司 |
主分类号: | G16B50/30 | 分类号: | G16B50/30 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 韩雪梅 |
地址: | 201400 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 迁移 学习 生物 大分子 体系 数据库 构建 方法 系统 | ||
1.一种基于迁移学习的生物大分子体系数据库构建方法,其特征在于,包括:
获取生物大分子数据建模的原任务和目标任务;所述原任务包括原输入数据以及原输出数据;所述目标任务包括目标输入数据以及目标输出数据;所述原输入数据以及所述目标输入数据均为独立的生物大分子结构,生物大分子和小分子/离子的复合结构,或,生物大分子和生物大分子的复合结构;所述原输出数据为所述原输入数据对应的生物大分子性质,所述目标输出数据为所述目标输入数据的对应的生物大分子性质;两个所述生物大分子性质均为稳定性、活性、结合能、能量、原子受力或空间结构;
根据所述原输入数据、所述目标输入数据、所述原输出数据的保真度以及所述目标输出数据的保真度,确定迁移类型;所述迁移类型包括纵向迁移、横向迁移以及交叉迁移;
基于所述迁移类型,根据所述原输入数据以及所述原输出数据建立原任务模型;
基于所述迁移类型,根据所述目标输入数据以及所述目标输出数据对所述原任务模型进行调整,建立目标任务模型;
根据所述原任务模型以及所述目标任务模型建立生物大分子体系数据库;所述生物大分子体系数据库为独立生物大分子体系的结构-属性数据库,生物大分子和小分子/离子体系的复合结构-属性数据库,或,生物大分子与生物大分子的复合结构-属性数据库;所述生物大分子体系数据库用于研究独立的生物大分子体系,研究生物大分子和小分子/离子体系的相互作用,或,研究生物大分子之间的相互作用。
2.根据权利要求1所述的基于迁移学习的生物大分子体系数据库构建方法,其特征在于,所述纵向迁移为所述原输入数据与所述目标输入数据相同,所述原输出数据的保真度与所述目标输出数据的保真度不同;
所述横向迁移为所述原输入数据与所述目标输入数据不同,所述原输出数据的保真度与所述目标输出数据的保真度相同;
所述交叉迁移为所述原输入数据与所述目标输入数据不同,所述原输出数据的保真度与所述目标输出数据的保真度不同。
3.根据权利要求1所述的基于迁移学习的生物大分子体系数据库构建方法,其特征在于,所述基于所述迁移类型,根据所述原输入数据以及所述原输出数据建立原任务模型,具体包括:
基于所述迁移类型,以所述原输入数据的特征为输入,以所述原输出数据为输出,利用机器学习算法,随机初始化所述机器学习算法所建立的机器学习模型的参数,建立原任务模型;所述特征包括组成特征以及结构特征;所述组分特征包括电负性、电离能、原子序数、价电子数、共价半径以及极化率;所述结构特征包括径向分布函数、晶体衍射、化学局部环境、内坐标以及晶体卷积图;所述机器学习模型根据所述原输出数据的格式建立。
4.根据权利要求3所述的基于迁移学习的生物大分子体系数据库构建方法,其特征在于,所述基于所述迁移类型,根据所述目标输入数据以及所述目标输出数据对所述原任务模型进行调整,建立目标任务模型,具体包括:
基于所述迁移类型,以所述目标输入数据的特征为输入,以所述目标输出数据为输出,将所述机器学习模型的参数为所述目标任务中机器学习模型的初始点,对所述目标任务中机器学习模型进行调整,构建目标任务模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海茵肽信息科技有限公司,未经上海茵肽信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210880897.6/1.html,转载请声明来源钻瓜专利网。