[发明专利]一种基于BM匹配算法和PSO优化算法智能模拟酶切的方法及系统在审
| 申请号: | 201410728514.9 | 申请日: | 2014-12-05 |
| 公开(公告)号: | CN104598771A | 公开(公告)日: | 2015-05-06 |
| 发明(设计)人: | 梁海泳;毛凤彪 | 申请(专利权)人: | 博淼生物科技(北京)有限公司;毛凤彪 |
| 主分类号: | G06F19/22 | 分类号: | G06F19/22 |
| 代理公司: | 无 | 代理人: | 无 |
| 地址: | 100044 北京市昌平*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 bm 匹配 算法 pso 优化 智能 模拟 方法 系统 | ||
1.一种基于BM匹配算法和PSO优化算法智能模拟酶切的方法,主要包括以下六个步骤:
步骤一:大规模高效率的模拟酶切,得到每一个酶切片段的粘端信息和碱基序列,解决以往酶切工具的基因组大小限制问题;
步骤二:统计和显示酶切片段大小、GC含量和碱基平衡性,以评估特定长度大小片段的扩增效率;
步骤三:以电泳图的形式展示模拟酶切结果,形象生动的展示酶切效果;
步骤四:计算和统计特定长度范围上的特定序列的比例,为特定序列靶向测序特供依据和支持;
步骤五:使用最优解算法优化酶切的区域范围的选择,使所选择的区域范围对目标碱基或特征序列测序效能最高;
步骤六:最终将上面的结果以网页的形式汇总成评估报告,方便研究者和使用者一目了然地知道模拟酶切效果。
2.权利要求1所述的一种基于BM匹配算法和PSO优化算法智能模拟酶切的方法,其特征在于:所述的步骤一中,大规模高效率的模拟酶切,得到每一个酶切片段的粘端信息和碱基序列,解决以往酶切工具的基因组大小限制问题。
3.权利要求1所述的一种基于BM匹配算法和PSO优化算法智能模拟酶切的方法,其特征在于:所述的步骤一中,利用BM匹配算法进行序列识别,并且产生模拟酶切片段。
4.权利要求1所述的一种基于BM匹配算法和PSO优化算法智能模拟酶切的方法,其特征在于:利用PSO优化算法智能选取最优酶切片段大小,使所选区域范围对目标碱基或特征序列测序效率最高:
(1)初始化一群微粒(群体规模为m),包括随机的位置和速度;
(2)评价每个微粒的适应度;
(3)对每个微粒,将它的适应值和它经历过的最好位置pbest的作比较,如果较好,则将其作为当前的最好位置pbest;
(4)对每个微粒,将它的适应值和全局所经历最好位置gbest的作比较,如果较好,则重新设置gbest的索引号;
(5)根据方程(1)变化微粒的速度和位置;
(6)如未达到结束条件(通常为足够好的适应值或达到一个预设最大代数Gmax),回到2)。
5.权利要求1所述的一种基于BM匹配算法和PSO优化算法智能模拟酶切的方法,其特征在于:当选择了目标酶和基因组,并设定合适的参数之后,即可以开始运行模拟酶切,得到模拟电泳和统计分析结果,最终生成网页HTML版的评估报告。
6.一种基于BM匹配算法和PSO优化算法智能模拟酶切的系统,其特征在于:包括以下模块:
模拟酶切模块:对给定的基因组序列和给定的酶或酶切识别序列,采用BM匹配算法进行高效准确的模拟酶切,产生体外模拟酶切片段;
智能优化模块:根据提取模块中的模拟酶切片段,采用PSO优化算法智能选择最优酶切片段大小,使所选区域范围对目标碱基或特征序列测序效率最高;
酶切评估模块:统计和显示酶切片段大小、GC含量和碱基平衡性,以评估特定长度大小片段的扩增效率,并以电泳图的形式展示模拟酶切结果,形象生动的展示酶切效果,并计算和统计特定长度范围上的特定序列的比例,为特定碱基或序列靶向测序提供依据和支持。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博淼生物科技(北京)有限公司;毛凤彪;,未经博淼生物科技(北京)有限公司;毛凤彪;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410728514.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





