[发明专利]一种基于遗传算法的隐私保护关联规则挖掘方法无效

专利信息
申请号: 201110003699.3 申请日: 2011-01-10
公开(公告)号: CN102063507A 公开(公告)日: 2011-05-18
发明(设计)人: 朱玉全;陈耿;孙蕾;欧吉顺 申请(专利权)人: 江苏大学
主分类号: G06F17/30 分类号: G06F17/30;G06N3/12
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 楼高潮
地址: 212013 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种基于遗传算法的隐私保护关联规则挖掘方法,包括预处理、记录编码、生成初始种群、构造种群中记录所对应项目适应度函数、个体的选择、个体间的单点交叉运算、变异个体的基本位变异运算、满足两条件算法结束;可以有效地保护敏感关联规则,确保被挖掘的数据库中不再包含敏感关联规则,且不会产生幽灵规则;尽可能地保留原数据库中的非敏感关联规则,克服了现有算法是在定性规则而非定量指标的引导下进行且其实际效果只有等算法执行完后才能得以验证和确认且如果效果不够理想必须多次重复执行等不足。
搜索关键词: 一种 基于 遗传 算法 隐私 保护 关联 规则 挖掘 方法
【主权项】:
1.一种基于遗传算法的隐私保护关联规则挖掘方法,其特征是包括如下步骤;1)预处理:删除原始数据库D中不支持频繁项目集XY的记录,对原始数据库D中支持频繁项目集XY的记录t,首先删除集合tY中的一个项目,其次修改敏感关联规则X→Y的支持度sup(X→Y)=和置信度conf(X→Y)=,count是相应的支持数,最后删除记录t;若处理后的数据库D’的支持度或置信度小于用户给定的相应阈值,则整个隐私保护关联规则挖掘过程结束,反之则转入第2)步;2)记录编码:设置k位二进制数,数据库D’中第一条记录的编码为00……000、第二条记录的编码为00……001……、倒数第二条记录的编码为01……111、最后一条记录的编码为11……111;3)生成初始种群:每次选择长度最短的记录,直到满足初始种群个数的要求;4)构造种群中记录所对应项目适应度函数:适应度函数为M-FI=,FI、FI’分别为数据库D和D’中频繁项目集XY的集合,|FI|、|FI’|分别为集合FI、FI’中元素的总数;M-FI的值介于0与1之间,M-FI值越大,表示频繁项目集的丢失数越少,M-FI=1表示无频繁项目集的丢失;5)个体的选择:种群S为{s1, s2, …, sN},S中各个体的适应度分别为f(s1), f(s2), …, f(sN),个体i被选中的概率P(si)=,f(s1)根据适应度函数M-FI计算,i=1,2,…,N;6)个体间的单点交叉运算:产生一个1到k-1之间的随机数j,配对的两条记录相互对应的交换从j+1到k的位段;7)变异个体的基本位变异运算:对个体记录的编码随机指定的某一位或某几位基因作变异运算,若需要进行变异操作的某一基因座上的原有基因值为0,则变异操作将其变为1,若原有基因值为1,则变异操作将其变为0;8)满足下述条件之一时算法结束设置一个最大迭代次数MAM-D,一旦迭代次数大于MAM-D时;设置一个种群中不同个体的阈值BT-GT,一旦种群中不同个体数小于或等于BT-GT时。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201110003699.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top