[发明专利]一种基于BM匹配算法和PSO优化算法智能模拟酶切的方法及系统在审
| 申请号: | 201410728514.9 | 申请日: | 2014-12-05 |
| 公开(公告)号: | CN104598771A | 公开(公告)日: | 2015-05-06 |
| 发明(设计)人: | 梁海泳;毛凤彪 | 申请(专利权)人: | 博淼生物科技(北京)有限公司;毛凤彪 |
| 主分类号: | G06F19/22 | 分类号: | G06F19/22 |
| 代理公司: | 无 | 代理人: | 无 |
| 地址: | 100044 北京市昌平*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 bm 匹配 算法 pso 优化 智能 模拟 方法 系统 | ||
技术领域
本发明属于基因工程技术领域,尤其涉及一种基于BM匹配算法和PSO优化算法智能模拟酶切的方法及系统。
背景技术
细胞内部有可以摧毁外源DNA的限制性内切酶来抵御新病毒的入侵。
限制性内切酶可在特定位点切开DNA,产生可体外连接的基因片段。限制性内切酶通常伴随能够保护细胞自身的DNA不被限制性内切酶破坏的一到两种修饰酶(甲基化酶)出现。修饰酶识别的位点与相应的限制性内切酶相同,但只甲基化每条链中的一个碱基,而不是切开DNA链。限制性内切酶和甲基化酶一起就构成了限制-修饰(R-M)系统。II型酶在其识别位点之中或临近的确定位点特异地切开DNA链。II型限制性内切酶由一群性状和来源都不尽相同的蛋白组成,因而任意一种限制性内切酶的氨基酸序列可能与另一种限制性内切酶的氨基酸序列截然不同。限制性内切酶的切割后产生一个3'羟基端和一个5'磷酸基团。
目前我们一般选用II型有确定识别位点的酶,作为分子生物学研究使用的酶,本酶切软件也基于这个前提而开发,为嵌合酶切技术在第二代技术的充分和合理运用,开发出一个灵活的、全面的、高效的、友好的酶切模拟和评估软件是迫在眉睫。
高通量测序技术又称深度测序(deep sequencing),它不仅可以一次对几十万到几百万条DNA分子进行序列测定,同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能。高通量测序可以帮助研究者跨过文库构建这一实验步骤,避免了亚克隆过程中引入的偏差。 依靠后期强大的生物信息学分析能力,对照一个参比基因组(reference genome)高通量测序技术可以非常轻松完成基因组重测序(re-sequence)。但是也应该看到,由于高通量测序读取长度的限制,使其在对未知基因组进行从头测序(novo sequencing)的应用受到限制,这部分工作仍然需要传统测序(读取长度达到850 碱基)的协助。
RAD(Restriction-site Associated DNA)和SLAF-seq(specific-locus amplified fragment sequencing)都是与限制性核酸内切酶识别位点相关DNA,基于酶切的简化基因组测序,对酶切获得的tag进行高通量测序,大幅降低基因组的复杂度,操作简便,同时不受参考基因组的限制,可快速鉴定出高密度的SNP位点。他们是基于SNP位点的分子标记技术,性价比高、稳定性好,可用于群体进化研究、遗传图谱构建、QTL定位和辅助 scaffold组装到染色体等领域。
MRE-seq (Methylation-Sensitive Restriction Enzymes sequencing)利用甲基化高度敏感内切酶酶切基因组,然后将切碎的片段进行大规模测序,被测片段是无甲基化区域,而无序列覆盖的区域的CG就是甲基化位点。
RRBS(Reduced Representation Bisulfite Sequencing)利用限制性内切酶对基因组进行酶切,可以极大幅度的提高CpG区域的测序深度,与全基因组甲基化测序相比,测序量将大大减少,并在CpG岛、启动子区域和增强子元件区域达到更高精度的分辨率。同时,利用RRBS可以实现多个样本的比对基因组分析。
发明内容
现有软件不足之处在于:可以输入的序列有限,多个酶酶切时容易出现效率低,关键是不能保留粘端信息以及各个片段的序列,最需要改进的是没有合适的算法去帮助研究人员选择多大的片段范围比较适合自己领域的研究。综上所述,为嵌合酶切技术在第二代技术的充分和合理运用,开发出一个灵活的、全面的、高效的、友好的酶切模拟和评估软件是迫在眉睫。因此,我们有意开发一款名为“魔法酶切”(magic enzyme cutter)的软件,旨在完成和实现以下目的:
(1)大规模高效率的模拟酶切,得到每一个酶切片段的黏端信息和碱基序列,解决以往酶切工具的基因组大小限制问题;
(2)统计和显示酶切片段大小、GC含量和碱基平衡性,以评估特定长度大小片段的扩增效率;
(3)以电泳图的形式展示模拟酶切结果,形象生动的展示酶切效果;
(4)计算和统计特定长度范围上的特定序列的比例,为特定序列靶向测序特供依据和支持;
(5)使用最优解算法优化酶切的区域范围的选择,使所选择的区域范围对目标碱基或特征序列测序效能最高;
(6)最终将上面的结果以网页的形式汇总成评估报告,方便研究者和使用者一目了然地知道模拟酶切效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博淼生物科技(北京)有限公司;毛凤彪;,未经博淼生物科技(北京)有限公司;毛凤彪;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410728514.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





