[发明专利]一种应用于事务数据库的skyline模式挖掘方法在审
申请号: | 202310165458.1 | 申请日: | 2023-02-27 |
公开(公告)号: | CN115858631A | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 吴明泰;刘亚东;潘正祥;陈建铭;吴祖扬 | 申请(专利权)人: | 山东科技大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/23 |
代理公司: | 青岛智地领创专利代理有限公司 37252 | 代理人: | 王鸣鹤 |
地址: | 266590 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 事务 数据库 skyline 模式 挖掘 方法 | ||
1.一种应用于事务数据库的skyline模式挖掘方法,其特征在于,包括如下步骤:
步骤1、对于事务数据库,用户根据自己的需要预先设置最小频率阈值/和最小效用阈值/;
步骤2、采用SFUTPMiner算法获得PSFUTP,PSFUTP表示带有阈值的潜在skyline频率效用模式;SFUTPMiner算法为带有阈值的skyline频率效用模式挖掘算法,通过设置阈值并且利用数组进行快速过滤并实现对skyline频率效用模式的初步挖掘;
步骤3、采用判断算法对获得的PSFUTP进行判断,并将判断结果返回作为最终确认的真实SFUTP,SFUTP表示带有阈值的skyline频率效用模式。
2.根据权利要求1所述应用于事务数据库的skyline模式挖掘方法,其特征在于,所述步骤1中,设是一个有限的项目集合,/表示第/个项目,/表示项目总个数,若集合/,则/称之为项集,如果该项集包含有/个项目,则称该项集为/-项集,当/时,该项集为1-项集;
设是事务数据库,每个事务/,其中/是唯一标识符,每个事务都是/的子集,/表示事务总个数。
3.根据权利要求1所述应用于事务数据库的skyline模式挖掘方法,其特征在于,所述步骤2中,采用SFUTPMiner算法获得PSFUTP的内容及具体过程为:
步骤2.1、扫描事务数据库,并计算数据库/中每个项目的事务加权效用/,并利用阈值移除不满足条件的项目,完成对事务数据库/的重组;
步骤2.2、为重组后的事务数据库中每个1-项集构建其效用列表;
步骤2.3、构建数组阵列结构,并初始化/数组;
步骤2.4、采用深度优先搜索的方法,利用数组对搜索空间进行挖掘以获得所需的带有阈值的潜在skyline频率效用模式。
4.根据权利要求3所述应用于事务数据库的skyline模式挖掘方法,其特征在于,所述步骤2.1的具体过程如下:
步骤2.1.1、计算事务数据库中每一个1-项集的事务加权效用/;
设为事务数据库/中的项集/的事务加权效用,定义为:
;
其中,为事务数据库/中事务/的效用,定义为:
;
其中,为事务/中项目/的效用表示;
步骤2.1.2、将事务加权效用值小于最小效用阈值/的1-项集从数据库中移除,将剩余的1-项集按照/升序进行排序,完成对事务数据库/的重组。
5.根据权利要求4所述应用于事务数据库的skyline模式挖掘方法,其特征在于,所述步骤2.2中,项集的效用列表是一组元组,每个元组由三个字段组成,分别是事务序号索引/、项集/实际效用/、项集/剩余效用/。
6.根据权利要求5所述应用于事务数据库的skyline模式挖掘方法,其特征在于,所述步骤2.3中,数组定义为:/
;
其中,为数组标号;/为项集/在事务数据库/中的出现频率,定义如下:
;
为事务数据库/中项集/的效用,定义如下:
;
其中,为项集/在事务/中的效用,定义如下:
;
其中,为事务/中项目/的效用,定义如下:
;
其中,表示权重。
7.根据权利要求6所述应用于事务数据库的skyline模式挖掘方法,其特征在于,所述步骤2.3中,对数组结构进行初始化,在初始阶段设置/至的值为一个极大值,将/至/的初始值设置为/或用户定义的最小效用阈值/;
是频率最高的单个项目的最大效用,定义为:
;
其中,为项目/的效用,/为项目/在事务数据库/中的出现频率,/为事务数据库/中包含的1-项集的最大频率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310165458.1/1.html,转载请声明来源钻瓜专利网。