[发明专利]一种基于局部序列约束的启动子智能设计方法、装置及应用在审
申请号: | 202310100892.1 | 申请日: | 2023-01-18 |
公开(公告)号: | CN116052765A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 汪小我;王昊晨;许涵文;张鹏程;魏磊 | 申请(专利权)人: | 清华大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00;G16B30/20;G06N3/049;G06N3/0442;G06N3/045;G06N3/0475;G06N3/094 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 任凤华 |
地址: | 100084 北京市海淀区1*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 局部 序列 约束 启动子 智能 设计 方法 装置 应用 | ||
1.基因调控元件智能设计的方法,其特征在于:所述方法包括如下步骤:
A1)基于已知基因调控元件的共有序列和共有序列的位置信息,使用条件生成对抗网络生成基因调控元件生成模型;所述基因调控元件生成模型用于生成符合天然分布的初始基因调控元件序列;所述初始基因调控元件序列含有所述共有序列和所述共有序列的侧翼序列;
A2)基于所述已知基因调控元件及其对应的调控基因表达量数据作为训练集,使用神经网络DenseNet和长短期神经网络LSTM构建基因调控元件调控性能预测模型;所述基因调控元件调控性能预测模型用于预测所述初始基因调控元件的调控性能;
A3)使用基于种群交叉与变异的遗传算法对所述基因调控元件生成模型和基因调控元件调控性能预测模型进行循环优化,获得包含基因调控元件生成模型和基因调控元件调控性能预测模型的基因调控元件智能设计模型;使用所述基因调控元件智能设计模型设计获得基因调控元件。
2.根据权利要求1所述的方法,其特征在于:A2)还包括所构建的基因调控元件调控性能预测模型的调控性能预测优化的步骤:基于条件生成对抗网络模型和注意力机制来捕捉所述已知基因调控元件的长程调控功能以实现基因调控元件调控性能预测的优化。
3.根据权利要求1或2所述的方法,其特征在于:所述共有序列为已知诱导型基因调控元件的共有序列,所述基因调控元件为诱导型基因调控元件;
或,所述共有序列为已知组成型基因调控元件的共有序列,所述基因调控元件为组成型基因调控元件。
4.根据权利要求1-3中任一权利要求所述的方法,其特征在于:所述基因调控元件为启动子。
5.基因调控元件智能设计的装置,其特征在于:所述装置包括如下模块:
B1)基因调控元件生成模型构建模块:用于基于已知基因调控元件的共有序列和共有序列的位置信息,使用条件生成对抗网络生成基因调控元件的生成模型;所述基因调控元件生成模型用于生成初始基因调控元件序列;所述初始基因调控元件序列含有所述共有序列和所述共有序列的侧翼序列;
B2)基因调控元件功能预测模型构建模块:用于基于所述已知基因调控元件及其对应的调控基因表达量数据作为训练集,使用神经网络DenseNet和长短期神经网络LSTM构建基因调控元件调控性能预测模型;所述基因调控元件调控性能预测模型用于预测所述初始基因调控元件序列的调控性能;
B3)基因调控元件智能设计系统生成模块:用于基于种群交叉与变异的遗传算法对所述基因调控元件生成模型和基因调控元件调控性能预测模型进行循环优化,获得包含基因调控元件生成模型和基因调控元件调控性能预测模型的基因调控元件智能设计模型;使用所述基因调控元件智能设计模型设计获得基因调控元件。
6.根据权利要求5所述的装置,其特征在于:A2)还包括调控性能预测优化模块;所述调控性能预测优化模块用于基于条件生成对抗网络模型和注意力机制来捕捉所述已知基因调控元件的长程调控功能以实现基因调控元件调控性能预测的优化。
7.根据权利要求5或6所述的装置,其特征在于:所述共有序列为已知诱导型基因调控元件的共有序列,所述基因调控元件为诱导型基因调控元件;
或,所述共有序列为已知组成型基因调控元件的共有序列,所述基因调控元件为组成型基因调控元件。
8.根据权利要求5-7中任一权利要求所述的装置,其特征在于:所述基因调控元件为启动子。
9.基因调控元件智能设计的计算机可读存储介质,其特征在于:所述计算机可读存储介质使计算机运行权利要求1-4中任一权利要求所述方法的步骤。
10.权利要求1-4中任一权利要求所述的方法和/或5-8中任一权利要求所述的装置和/或权利要求9所述计算机可读存储介质的下述任一种应用:
C1)在开发或制备合成基因的产品中的应用;
C2)在开发或制备调控基因表达的产品中的应用;
C3)在开发或制备基因治疗产品中的应用;
C4)在开发或制备优化生物代谢通路的产品中的应用;
C5)在疫苗生产中的应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310100892.1/1.html,转载请声明来源钻瓜专利网。