[发明专利]基于多序列比对的酶序列生成方法、装置、介质和设备在审
| 申请号: | 202211156880.2 | 申请日: | 2022-09-21 |
| 公开(公告)号: | CN115472224A | 公开(公告)日: | 2022-12-13 |
| 发明(设计)人: | 余函;张洋铭;罗小舟 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
| 主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市铭粤知识产权代理有限公司 44304 | 代理人: | 孙伟峰;刘燚圣 |
| 地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 序列 生成 方法 装置 介质 设备 | ||
1.一种基于多序列比对的酶序列生成方法,其特征在于,所述酶序列生成方法包括:
从序列数据库中筛选出与目标酶的完整氨基酸序列相似的若干条相似氨基酸序列;
将所述完整氨基酸序列和若干条所述相似氨基酸序列进行多序列比对处理,获得若干条对齐氨基酸序列,其中各条对齐氨基酸序列的长度相同;
将若干条对齐氨基酸序列作为训练样本对预先构建好的生成式对抗网络模型进行训练,获得氨基酸序列生成模型;
利用所述氨基酸序列生成模型生成所述目标酶的多条扩展氨基酸序列。
2.根据权利要求1所述的基于多序列比对的酶序列生成方法,其特征在于,从序列数据库中筛选出与目标酶的完整氨基酸序列相似的若干相似氨基酸序列的方法为:
采用局部对齐搜索工具从所述序列数据库中筛选出若干条相似氨基酸序列,其中每条所述相似氨基酸序列与所述完整氨基酸序列之间的覆盖度大于第一阈值且相似度大于第二阈值。
3.根据权利要求1所述的基于多序列比对的酶序列生成方法,其特征在于,将若干条对齐氨基酸序列作为训练样本对预先构建好的生成式对抗网络模型进行训练的方法包括:
采用不同的数字代表对齐氨基酸序列中不同种的氨基酸类型以及补齐字符,将每条对齐氨基酸序列转换为数字编码串;
将若干条对齐氨基酸序列对应的若干个数字编码串作为训练样本对预先构建好的生成式对抗网络模型进行训练。
4.根据权利要求3所述的基于多序列比对的酶序列生成方法,其特征在于,每个数字编码串中具有21种不同的数字。
5.根据权利要求2所述的基于多序列比对的酶序列生成方法,其特征在于,所述第一阈值为90%,所述第二阈值为70%。
6.一种基于多序列比对的酶序列生成装置,其特征在于,所述酶序列生成装置包括:
序列筛选单元,用于从序列数据库中筛选出与目标酶的完整氨基酸序列相似的若干条相似氨基酸序列;
多序列对比单元,用于将所述完整氨基酸序列和若干条所述相似氨基酸序列进行多序列比对处理,获得若干条对齐氨基酸序列,其中各条对齐氨基酸序列的长度相同;
模型训练单元,用于将若干条对齐氨基酸序列作为训练样本对预先构建好的生成式对抗网络模型进行训练,获得氨基酸序列生成模型;
序列生成单元,用于利用所述氨基酸序列生成模型生成所述目标酶的多条扩展氨基酸序列。
7.根据权利要求6所述的基于多序列比对的酶序列生成装置,其特征在于,所述序列筛选单元还用于:
采用局部对齐搜索工具从所述序列数据库中筛选出若干条相似氨基酸序列,其中每条所述相似氨基酸序列与所述完整氨基酸序列之间的覆盖度大于第一阈值且相似度大于第二阈值。
8.根据权利要求6所述的基于多序列比对的酶序列生成装置,其特征在于,所述模型训练单元包括:
编码子模块,用于采用不同的数字代表对齐氨基酸序列中不同种的氨基酸类型以及补齐字符,将每条对齐氨基酸序列转换为数字编码串;
训练子模块,用于将若干条对齐氨基酸序列对应的若干个数字编码串作为训练样本对预先构建好的生成式对抗网络模型进行训练。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有基于多序列比对的酶序列生成程序,所述基于多序列比对的酶序列生成程序被处理器执行时实现权利要求1至5任一项所述的基于多序列比对的酶序列生成方法。
10.一种计算机设备,其特征在于,所述计算机设备包括计算机可读存储介质、处理器和存储在所述计算机可读存储介质中的基于多序列比对的酶序列生成程序,所述基于多序列比对的酶序列生成程序被处理器执行时实现权利要求1至5任一项所述的基于多序列比对的酶序列生成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211156880.2/1.html,转载请声明来源钻瓜专利网。





