[发明专利]正则表达式分组方法及装置有效
申请号: | 201410099132.4 | 申请日: | 2014-03-17 |
公开(公告)号: | CN103854056B | 公开(公告)日: | 2016-11-16 |
发明(设计)人: | 付哲;王凯;李军 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N3/12 | 分类号: | G06N3/12 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李迪 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种正则表达式分组方法及装置,将多条待分组正则表达式随机分组,得到至少一组表达式分组序列,根据至少一组表达式序列分组确定相应的至少一条染色体,并根据至少一条染色体确定相应的至少一个个体;确定至少一个个体中每个个体的适应度,并根据每个个体的适应度与适应度阈值的比较结果获得较高适应度序列;从较高适应度序列中任意选取两个适应度,确定被选取适应度的对应染色体,并对对应染色体进行交叉操作;对经交叉操作后的染色体进行变异操作,获得变异染色体,并根据变异染色体确定对应的新一代个体;判断是否到达预置收敛次数。能够在保证匹配效率的同时,减少DFA的状态膨胀引起的空间消耗。 | ||
搜索关键词: | 正则 表达式 分组 方法 装置 | ||
【主权项】:
一种正则表达式分组方法,其特征在于,包括:101、将多条待分组正则表达式随机分组,得到至少一组表达式分组序列,根据所述至少一组表达式序列分组确定相应的至少一条染色体,并根据所述至少一条染色体确定相应的至少一个个体;102、确定所述至少一个个体中每个个体的适应度,并根据每个个体的适应度与适应度阈值的比较结果获得较高适应度序列;103、从所述较高适应度序列中任意选取两个适应度,确定被选取适应度的对应染色体,并对所述对应染色体进行交叉操作;104、对经交叉操作后的染色体进行变异操作,获得变异染色体,并根据所述变异染色体确定对应的新一代个体;105、判断是否到达预置收敛次数;若是,则将所述新一代个体中的最优值作为问题的最优解;若否,则对所述新一代个体重复执行步骤102‑105,直至到达预置收敛次数;所述步骤102中确定所述至少一个个体中每个个体的适应度包括:对于每一代个体,找出最大DFA状态数和最小DFA状态数,并以最大DFA状态数和最小DFA状态数的和与各个个体的DFA状态数之差作为此个体的适应度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410099132.4/,转载请声明来源钻瓜专利网。