[发明专利]发现数据规则的方法和系统有效

专利信息
申请号: 200710186779.0 申请日: 2007-11-16
公开(公告)号: CN101201844A 公开(公告)日: 2008-06-18
发明(设计)人: 扬妮克·赛利特;玛丽·A·罗思;布莱尼·钱德;哈拉尔德·C·史密斯 申请(专利权)人: 国际商业机器公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京市柳沈律师事务所 代理人: 黄小临
地址: 美国纽*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 发现 数据 规则 方法 系统
【权利要求书】:

1.一种方法,包括:

处理包括多个记录的数据组以生成用于该数据组的数据规则,其中每个记录具有包括多个字段的记录格式,其中每个规则基于至少一个其它字段中的至少一个预测值条件而提供一个字段的预测条件;

向用户界面提供所生成的数据规则,以使得用户能够编辑所生成的数据规则;以及

将数据规则存储在规则库中,以可用于验证具有所述记录格式的数据组。

2.如权利要求1所述的方法,还包括:

将所生成的数据规则应用于数据组,以识别不满足规则的记录;以及

向用户界面展示所识别出的记录,以供用户在编辑所生成的数据规则时进行检查。

3.如权利要求1所述的方法,还包括:

从所述用户界面接收对所生成的数据规则的用户修改;以及

生成包括对所生成的数据规则的用户修改的、用户认可的数据规则组,其中所述用户认可的数据规则组被存储在所述规则库中。

4.如权利要求1所述的方法,其中处理数据组包括:采用数据挖掘技术来生成数据规则,其中所述数据挖掘技术是包括关联规则和树分类的数据挖掘技术的集合中的一部分。

5.如权利要求1所述的方法,其中处理数据组以生成数据规则包括:

将第一数据挖掘算法应用于数据组以生成第一组数据规则;

将第二数据挖掘算法应用于数据组以生成第二组数据规则;

其中向用户界面提供所生成的数据规则包括:将第一组数据规则和第二组数据规则提供给用户界面,以供用户进行检查。

6.如权利要求5所述的方法,还包括:

识别出第一组数据规则和第二组数据规则中冗余的规则;以及

在用户界面中向用户展示表示冗余数据规则的信息,以使得用户能够修改规则以移除冗余数据规则。

7.如权利要求5所述的方法,其中所述第一数据挖掘算法使用关联规则来确定数据规则,以及其中所述第二数据挖掘算法使用树分类数据挖掘算法。

8.如权利要求5所述的方法,其中所述第一组数据规则和第二组数据规则提供不同规则语言格式的规则,该方法还包括:

将所述第一组数据规则和第二组数据规则转换为公用规则语言格式,以存储在库中。

9.如权利要求1所述的方法,其中被提供给用户界面并存储在库中的数据规则满足已定义的置信度级别,该已定义的置信度级别表示至少一个字段的至少一个预测值条件推断出一个字段的预测条件的最小可能性。

10.如权利要求9所述的方法,其中被提供给用户界面并存储在库中的数据规则满足以下中的至少一个:最小支持度级别、最小置信度级别、最小提升级别、以及最大规则长度,并且经由所述用户界面而输入。

11.如权利要求1所述的方法,其中处理数据组还包括:

离散化数值字段,以将该数值字段转换为值的范围,其中根据离散化的数值字段来生成数据规则。

12.如权利要求1所述的方法,其中所述数据组具有多个列,其中生成数据规则包括:

生成包括节点的每个列的树分类模型,其中每个节点提供产生该列中的预测条件的预测性条件;以及

为每个树分类模型确定推断出包括满足支持度和置信度级别的预测性和预测条件的数据规则的节点。

13.一种系统,包括:

用户界面;

规则库;以及

规则引擎,被使能为引起操作被执行,所述操作包括:

调用至少一个数据挖掘引擎来处理包括多个记录的数据组,以生成用于所述数据组的数据规则,其中每个记录具有包括多个字段的记录格式,其中每个规则基于至少一个其它字段中的至少一个预测值条件而提供一个字段的预测条件;

向所述用户界面提供所生成的数据规则,以使得用户能够编辑所生成的数据规则;以及

将数据规则存储在所述规则库中,以可用于验证具有所述记录格式的数据组。

14.如权利要求13所述的系统,其中由所述规则引擎引起的操作还包括:

将所生成的数据规则应用于数据组,以识别不满足规则的记录;以及

向用户界面展示所识别的记录,以供用户在编辑所生成的数据规则时进行检查。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710186779.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top