[发明专利]一种基于FP-树的时空数据挖掘分析方法在审
申请号: | 201810877226.8 | 申请日: | 2018-08-03 |
公开(公告)号: | CN109344150A | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 宋耀莲;田榆杰;龙华;王慧东;徐文林;武双新 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于FP‑树的时空数据挖掘分析方法,属于时空数据挖掘技术领域。先建立一个时空数据信息记录的数据库,并对数据进行转换处理后生成新的事务表;对事务表进行第一次扫描,计算并保留频繁项;然后,对事务表进行第二次扫描,构建频繁模式树FP‑树,并提取出频繁3‑项集;其次,由各频繁3‑项集产生相应的强时空关联规则,并计算出各强时空关联规则的置信度大小;最后,将强时空关联规则按照其置信度的大小进行排序,生成时空关联规则表。本发明与现有技术相比,主要将单维度的FP‑树算法扩展到了三维时空数据的关联规则分析中,从而对数据间的关联关系起到了更加精准、深层次的分析作用。 | ||
搜索关键词: | 时空数据 关联规则 事务表 时空 次扫描 置信度 挖掘 关联规则分析 关联关系 频繁模式 转换处理 分析 树算法 构建 维度 排序 三维 数据库 保留 | ||
【主权项】:
1.一种基于FP‑树的时空数据挖掘分析方法,其特征在于:Step1、建立一个时空数据信息记录的数据库,并对数据进行转换处理后生成新的事务表,表中包括以下字段:事务编号ID、空间谓词、属性值、时间值;Step2、设置最小支持度阈值min_sup和最小置信度阈值min_conf,对事务表进行第一次扫描,去除掉事务表中所有支持度计数support_count_x小于最小支持度阈值的数据项,记录剩余数据项的支持度计数并按降序排序,生成频繁1‑项集的新事务表;Step3、对新事务表进行第二次扫描,初始化FP‑树,以字符null做为根节点,按照新事务表顺序依次插入每条事务的数据项作为节点,生成对应的分支路径同时建立项头表,项头表中,在加入数据项节点时需统计其出现的次数,形式为(Xi,N),Xi为第i个数据项,N为出现的次数;Step4、从FP‑树的每条路径的结尾节点依次向上提取出相应的3‑项集,3‑项集的支持度计数support_count_xj大于等于min_sup时,该3‑项集作为频繁3‑项集l保留,反之剔除;Step5、设每个频繁3‑项集l中的空间谓词为子集s,若属性值与时间值的集合(l‑s)与s的支持度计数之比大于等于最小置信度阈值min_conf,则输出强时空关联规则
该强规则的置信度大小为l与s的支持度计数之比的值
将所计算出来的所有强时空关联规则按照其置信度confidence的大小进行排序,生成时空关联规则表;Step6、将时空关联规则表结合实验数据的背景知识,对该结果进行相应的意义分析、比较。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810877226.8/,转载请声明来源钻瓜专利网。