[发明专利]一种基于遗传算法的隐私保护关联规则挖掘方法无效
申请号: | 201110003699.3 | 申请日: | 2011-01-10 |
公开(公告)号: | CN102063507A | 公开(公告)日: | 2011-05-18 |
发明(设计)人: | 朱玉全;陈耿;孙蕾;欧吉顺 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/12 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 楼高潮 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于遗传算法的隐私保护关联规则挖掘方法,包括预处理、记录编码、生成初始种群、构造种群中记录所对应项目适应度函数、个体的选择、个体间的单点交叉运算、变异个体的基本位变异运算、满足两条件算法结束;可以有效地保护敏感关联规则,确保被挖掘的数据库中不再包含敏感关联规则,且不会产生幽灵规则;尽可能地保留原数据库中的非敏感关联规则,克服了现有算法是在定性规则而非定量指标的引导下进行且其实际效果只有等算法执行完后才能得以验证和确认且如果效果不够理想必须多次重复执行等不足。 | ||
搜索关键词: | 一种 基于 遗传 算法 隐私 保护 关联 规则 挖掘 方法 | ||
【主权项】:
1.一种基于遗传算法的隐私保护关联规则挖掘方法,其特征是包括如下步骤;1)预处理:删除原始数据库D中不支持频繁项目集X
Y的记录,对原始数据库D中支持频繁项目集X
Y的记录t,首先删除集合t
Y中的一个项目,其次修改敏感关联规则X→Y的支持度sup(X→Y)=
和置信度conf(X→Y)=
,count是相应的支持数,最后删除记录t;若处理后的数据库D’的支持度或置信度小于用户给定的相应阈值,则整个隐私保护关联规则挖掘过程结束,反之则转入第2)步;2)记录编码:设置k位二进制数,数据库D’中第一条记录的编码为00……000、第二条记录的编码为00……001……、倒数第二条记录的编码为01……111、最后一条记录的编码为11……111;3)生成初始种群:每次选择长度最短的记录,直到满足初始种群个数的要求;4)构造种群中记录所对应项目适应度函数:适应度函数为M-FI=
,FI、FI’分别为数据库D和D’中频繁项目集X
Y的集合,|FI|、|FI’|分别为集合FI、FI’中元素的总数;M-FI的值介于0与1之间,M-FI值越大,表示频繁项目集的丢失数越少,M-FI=1表示无频繁项目集的丢失;5)个体的选择:种群S为{s1, s2, …, sN},S中各个体的适应度分别为f(s1), f(s2), …, f(sN),个体i被选中的概率P(si)=
,f(s1)根据适应度函数M-FI计算,i=1,2,…,N;6)个体间的单点交叉运算:产生一个1到k-1之间的随机数j,配对的两条记录相互对应的交换从j+1到k的位段;7)变异个体的基本位变异运算:对个体记录的编码随机指定的某一位或某几位基因作变异运算,若需要进行变异操作的某一基因座上的原有基因值为0,则变异操作将其变为1,若原有基因值为1,则变异操作将其变为0;8)满足下述条件之一时算法结束
设置一个最大迭代次数MAM-D,一旦迭代次数大于MAM-D时;
设置一个种群中不同个体的阈值BT-GT,一旦种群中不同个体数小于或等于BT-GT时。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110003699.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种数字卫星设备级联的控制方法及装置
- 下一篇:电位转换电路