[发明专利]一种基于局部序列约束的启动子智能设计方法、装置及应用在审
申请号: | 202310100892.1 | 申请日: | 2023-01-18 |
公开(公告)号: | CN116052765A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 汪小我;王昊晨;许涵文;张鹏程;魏磊 | 申请(专利权)人: | 清华大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00;G16B30/20;G06N3/049;G06N3/0442;G06N3/045;G06N3/0475;G06N3/094 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 任凤华 |
地址: | 100084 北京市海淀区1*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 局部 序列 约束 启动子 智能 设计 方法 装置 应用 | ||
本发明公开了一种基于局部序列约束的启动子智能设计方法、装置及应用。本发明中的方法利用“侧翼序列填充”的知识‑模型共驱动学习策略来实现,将已有天然启动子的复杂调控规律利用数据进行学习,使用条件生成对抗网络生成基因调控元件生成模型,并根据先验序列优化其侧翼区域。通过遗传算法和DenseNet结构的预测模型对生成器生成的序列进行迭代优化,最终得到基于先验知识约束的条件式基因调控元件。本发明可用于高效快速的基因元件的设计;用于组成型或诱导型启动子的设计。经检测使用本发明的方法设计的组成型启动子具有高调控表达性能,所设计的诱导型启动子具有高诱导率,其调控性能超过已知天然与合成元件。
技术领域
本发明涉及合成生物学与医疗领域,具体涉及一种基于局部序列约束的基因调控元件启动子智能设计方法、系统装置及应用。
背景技术
基因调控元件是指包含启动子、增强子在内的一段DNA序列,能够在时间与空间上调控基因的表达量,进一步的调控细胞的生长、分裂、分化等各项生命活动。基因调控元件能够以模块化的方式放入基因线路中,独立或协作式的行使调控基因表达量的功能,是合成生命系统的基础单元,在基因治疗、代谢通路优化、疫苗生产等领域具有广泛应用。
天然的基因调控元件是从天然基因组上截取的一段能够调控基因表达的DNA片段,已应用于合成基因线路的构建。然而天然元件在性能及数量上不足以满足基因线路构建的需求:一方面来看,天然元件是生命为满足自身生长发育进化而来,无法满足人们不断增长的性能需求;更为重要的是,使用天然元件会导致同源重组现象,从而导致基因组的不稳定,影响产物的产量与质量。若能设计多样且性能优良的合成基因元件,对合成基因线路的构建,满足应用端的需求具有重要意义。
传统的基因调控元件设计方法主要依赖于较强的生物学先验知识,如转录因子结合位点(TFBS)和核小体排布。这些序列通常被认为是顺式调控逻辑的核心,基因调控的关键部分。然而,最近的研究表明,基因调控元件的调控模式在很大程度上隐含的取决于TFBS和它们的侧翼区域的相互作用。这些普遍的弱调控模式包括TFBS与其侧翼区域之间的潜在依赖性,各区域之间的长距离调控,或物理化学性质的限制。这些弱调控模式由于在序列之中隐含表示,无法概括为简明的设计标准,但是忽略这些隐式调控模式将降低基因调控的设计成功率。
近年来,智能设计策略显示出捕捉复杂模式的强大能力,在自然语言建模以及图像的表示学习中均得到成功的应用。
发明内容
本发明所要解决的技术问题是如何设计合成基因调控元件和/或如何设计合成基因启动子和/或如何设计合成多样且调控性能优良的基因调控元件和/或如何设计合成调控基因表达量高的基因启动子。
为了解决上述技术问题,本发明首先提供了基因调控元件智能设计的方法,所述方法可包括如下步骤:
A1)基于已知基因调控元件的共有序列和共有序列的位置信息,使用条件生成对抗网络生成基因调控元件生成模型;所述基因调控元件生成模型用于生成符合天然分布的初始基因调控元件;所述初始基因调控元件含有所述共有序列和所述共有序列的侧翼序列;
A2)基于所述已知基因调控元件序列及其对应的调控基因表达量数据作为训练集,使用神经网络DenseNet和长短期神经网络LSTM(DenseNet-LSTM网络)构建基因调控元件调控性能预测模型;所述基因调控元件调控性能预测模型用于预测所述初始基因调控元件的调控性能;
A3)使用基于种群交叉与变异的遗传算法对所述基因调控元件生成模型和基因调控元件调控性能预测模型进行循环优化,获得包含基因调控元件生成模型和基因调控元件调控性能预测模型的基因调控元件智能设计模型;使用所述基因调控元件智能设计模型设计获得基因调控元件。
上述方法中,所述预测调控性能可包括预测调控基因表达量。所述基因调控元件的预测调控性能可高于所述已知基因调控元件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310100892.1/2.html,转载请声明来源钻瓜专利网。