[发明专利]一种基于三维原子密度图优化分子结构的处理方法和装置在审
申请号: | 202211385661.1 | 申请日: | 2022-11-07 |
公开(公告)号: | CN115691658A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 陈伟杰;王宇航;王新颜;张林峰;孙伟杰 | 申请(专利权)人: | 北京深势科技有限公司 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B5/00;G06T17/00 |
代理公司: | 北京慧诚智道知识产权代理事务所(特殊普通合伙) 11539 | 代理人: | 高廖楠 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 三维 原子 密度 优化 分子结构 处理 方法 装置 | ||
1.一种基于三维原子密度图优化分子结构的处理方法,其特征在于,所述方法包括:
获取第一3D原子密度图和对应的第一蛋白质序列、第一3D初始结构;
基于预设的3D图像识别模型对所述第一3D原子密度图进行目标识别处理生成对应的第一Cα原子密度图和第一主干原子密度图;
根据所述第一Cα原子密度图和所述第一蛋白质序列进行残基标注片段识别处理生成多个第一标注片段;
根据所有所述第一标注片段和所述第一主干原子密度图对所述第一3D初始结构进行三维分子结构优化处理生成对应的第一优化结构。
2.根据权利要求1所述的基于三维原子密度图优化分子结构的处理方法,其特征在于,
所述第一3D原子密度图为电镜三维原子密度图;所述第一3D原子密度图的形状为H0×W0×D0,H0、W0和D0分别为所述第一3D原子密度图的高度、宽度和通道数量;
所述第一蛋白质序列为与所述第一3D原子密度图对应的蛋白质分子的残基类型序列;
所述第一3D初始结构为与所述第一蛋白质序列对应的三维蛋白质分子标准结构;
所述第一Cα原子密度图包括多个第一Cα原子;所述第一Cα原子包括第一Cα原子坐标、一个或多个第一肽键方向和多个第一残基类型概率;各个所述第一Cα原子的所述第一残基类型概率的数量相同;
所述第一主干原子密度图包括多个第一主干原子密度区域,所述主干原子包括C原子、Cα原子和N原子;
所述第一标注片段包括第一片段特征数据;所述第一片段特征数据包括第一片段序号、第一片段类型序列和第一片段起始坐标。
3.根据权利要求2所述的基于三维原子密度图优化分子结构的处理方法,其特征在于,
所述3D图像识别模型基于3D Unet模型实现。
4.根据权利要求2所述的基于三维原子密度图优化分子结构的处理方法,其特征在于,所述基于预设的3D图像识别模型对所述第一3D原子密度图进行目标识别处理生成对应的第一Cα原子密度图和第一主干原子密度图,具体包括:
基于所述3D图像识别模型对所述第一3D原子密度图进行残基特征识别得到对应的第一特征图;并对所述第一3D原子密度图进行Cα原子特征识别得到对应的第二特征图;并对所述第一3D原子密度图进行N原子特征识别得到对应的第三特征图;并对所述第一3D原子密度图进行C原子特征识别得到对应的第四特征图;并对所述第一3D原子密度图、所述第一特征图和第二特征图进行Cα原子特征融合生成对应的所述第一Cα原子密度图;并对所述第一3D原子密度图、所述第二特征图、所述第三特征图和所述第四特征图进行主干原子密度区域融合生成对应的所述第一主干原子密度图;
其中,
所述第一特征图包括多个第一残基目标,所述第一残基目标包括一个或多个所述第一肽键方向和多个所述第一残基类型概率;所述第二特征图包括多个第一Cα原子目标,所述第一Cα原子目标包括所述第一Cα原子坐标;所述第三特征图包括多个第一N原子目标,所述第一N原子目标包括第一N原子坐标;所述第四特征图包括多个第一C原子目标,所述第一C原子目标包括第一C原子坐标;所述第一、第二、第三和第四特征图的形状分别为H1×W1×D1、H2×W2×D2、H3×W3×D3和H4×W4×D4,H1、H2、H3和H4分别为对应特征图的高度、H1=H2=H3=H4=H0,W1、W2、W3和W4分别为对应特征图的宽度、W1=W2=W3=W4=W0,D1、D2、D3和D4分别为对应特征图的通道数量;
所述第一Cα原子密度图包括多个所述第一Cα原子;各个所述第一Cα原子与所述第二特征图的所述第一Cα原子目标一一对应;各个所述第一Cα原子对应一组第一Cα原子特征数据,所述第一Cα原子特征数据包括所述第二特征图上对应的所述第一Cα原子目标的所述第一Cα原子坐标、所述第一3D原子密度图上与对应的所述第一Cα原子坐标匹配的第一密度图特征、所述第一特征图上与对应的所述第一Cα原子坐标匹配的所述第一残基目标的一个或多个所述第一肽键方向和多个所述第一残基类型概率;
所述第一主干原子密度图包括多个所述第一主干原子密度区域;各个所述第一主干原子密度区域包括一个或多个第二Cα原子、或一个或多个第一N原子、或一个或多个第一C原子;各个所述第二Cα原子与所述第二特征图的所述第一Cα原子目标一一对应,各个所述第一N原子与所述第三特征图的所述第一N原子目标一一对应,各个所述第一C原子与所述第四特征图的所述第一C原子目标一一对应;各个所述第二Cα原子、所述第一N原子和所述第一C原子都对应一组第一主干原子特征数据;所述第一主干原子特征数据包括第一主干原子类型、第一主干原子坐标和第一主干原子密度图特征;所述第一主干原子类型包括Cα原子类型、N原子类型和C原子类型;第一主干原子坐标为所述第二特征图上对应的所述第一Cα原子目标的所述第一Cα原子坐标、或所述第三特征图上对应的所述第一N原子目标的所述第一N原子坐标、或所述第四特征图上对应的所述第一C原子目标的所述第一C原子坐标;所述第一主干原子密度图特征为所述第一3D原子密度图上与所述第一主干原子坐标匹配的密度图特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京深势科技有限公司,未经北京深势科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211385661.1/1.html,转载请声明来源钻瓜专利网。