[发明专利]具有局部-整体约束的一次性近似模式匹配方法有效
申请号: | 201910530672.6 | 申请日: | 2019-06-19 |
公开(公告)号: | CN110232140B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 武优西;菅博境;于磊;成淑慧;朱昌瑞;单劲松;刘靖宇 | 申请(专利权)人: | 河北工业大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903 |
代理公司: | 天津翰林知识产权代理事务所(普通合伙) 12210 | 代理人: | 胡安朋 |
地址: | 300130 天津市红桥区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 局部 整体 约束 一次性 近似 模式 匹配 方法 | ||
本发明具有局部‑整体约束的一次性近似模式匹配方法,涉及电数字数据处理技术领域,利用网树结构来解决(δ,γ)‑距离下的一次性近似模式匹配问题,首先读入序列S、模式P,局部阈值δ和整体阈值γ,根据输入条件创建一棵网树,然后从叶子层的最后一个结点开始,根据最右双亲策略和贪婪搜索双亲策略,选择剩余出现数较大的出现,迭代此过程,直到叶子层的第一个结点,求出最大结果集,最后输出模式P在序列S中的所有出现。本发明克服了现有技术针对具有局部‑整体约束的一次性近似模式匹配问题,存在很难兼顾求解的一般性、准确性和灵活性,以及解集要非冗余的缺陷。
技术领域
本发明的技术方案涉及电数字数据处理技术领域,具体地说是具有局部-整体约束的一次性近似模式匹配方法。
背景技术
随着互联网技术不断发展,数据的规模日益剧增,如何使用数据挖掘技术从大量数据中找到有价值的信息,已成为一个研究热点,频繁模式挖掘是指从大量数据中找出频繁出现的模式,其主要任务是模式匹配,因为频繁模式挖掘通常需要计算一个模式的支持度,而支持度计算的实质就是模式匹配问题,因此,模式匹配是频繁模式挖掘的基础与核心,随着科学技术的日新月异,模式匹配技术已在各个领域得到了广泛应用,不仅应用于简单的时间序列匹配,而且应用于简单的生物序列匹配。
模式匹配是指在序列S中查找与模式P相同或者相似的子序列的过程,其发展趋势主要有以下几种:①从传统的模式匹配到具有间隙约束的模式匹配;②从精确模式匹配到近似模式匹配;③从无特殊条件下的模式匹配到一次性条件下的模式匹配。
与传统模式匹配相比,将间隙约束引入到模式匹配问题中,虽然使得问题更加难于求解,但能够降低数据噪音的影响,提高了模式匹配的灵活性,下例A对具有间隙约束的模式匹配问题进行了详细说明。
例A.给定序列S=s1s2s3s4s5s6s7=cbcabbc,模式P=p1[0,1]p2[0,1]p3=c[0,1]b[0,1]c。
具有间隙约束的模式:P=p1[min1,max1]p2…[minj,maxj]pj+1…[minm-1,maxm-1]pm,其中,minj和maxj分别表示子模式pj和子模式pj+1之间能够匹配的通配符的最小个数和最大个数,区间[minj,maxj]称为间隙约束,m表示模式P的长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910530672.6/2.html,转载请声明来源钻瓜专利网。