[发明专利]规则抽取方法和规则抽取设备在审
| 申请号: | 201610258496.1 | 申请日: | 2016-04-22 |
| 公开(公告)号: | CN107305638A | 公开(公告)日: | 2017-10-31 |
| 发明(设计)人: | 杨振华;钟朝亮;孙俊 | 申请(专利权)人: | 富士通株式会社 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 康建峰,吴琼 |
| 地址: | 日本神*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 规则 抽取 方法 设备 | ||
技术领域
本发明一般地涉及信息处理领域。具体而言,本发明涉及一种能够自动地从数据中抽取出可靠性高的规则的方法和设备。
背景技术
近年来,在数据挖掘领域,机器学习的方法得到了蓬勃的发展。但是,从海量的数据中识别潜在的有用的规则(模式)是高度复杂的过程,仍然主要需要人的深入参与。如何利用机器学习实现规则的自动可靠的抽取是面临的挑战。
本发明致力于解决上述问题,利用机器学习来处理大量数据、提高处理效率和覆盖数据的广度,同时能保证提取出的规则的可靠性。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
本发明的目的是提出一种自动抽取可靠规则的方法和设备。
为了实现上述目的,根据本发明的一个方面,提供了一种规则抽取方法,该规则抽取方法包括:获得数据集,所述数据集中包括多组数据,每组数据包括一个或更多个因素值以及对应的一个或更多个目标值;获取分类器模 型;以及将数据集中的预定数目的训练用数据集输入到分类器模型中,以得到规则;其中,所述数据集中的数据与时间相关联;并且获得数据集包括将与时间相关联的数据集转换为与时间无关联的数据集。
根据本发明的另一个方面,提供了一种规则抽取设备,该规则抽取设备包括:数据集获得装置,被配置为:获得数据集,所述数据集中包括多组数据,每组数据包括一个或更多个因素值以及对应的一个或更多个目标值;分类器模型构建装置,被配置为:获取分类器模型;以及规则获得装置,被配置为:将数据集中的预定数目的训练用数据集输入到分类器模型中,以得到规则;其中,所述数据集中的数据与时间相关联;并且所述数据集获得装置被进一步配置为:将与时间相关联的数据集转换为与时间无关联的数据集。
另外,根据本发明的另一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本发明的上述方法。
此外,根据本发明的再一方面,还提供了一种程序产品。所述程序产品包括机器可执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行根据本发明的上述方法。
附图说明
参照下面结合附图对本发明的实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。附图中:
图1示出了根据本发明的实施例的规则抽取方法的流程图。
图2示出了根据本发明的另一实施例的规则抽取方法的流程图。
图3示出了根据本发明的实施例的规则抽取设备的结构方框图。
图4示出了可用于实施根据本发明的实施例的方法和设备的计算机的示 意性框图。
具体实施方式
在下文中将结合附图对本发明的示范性实施例进行详细描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施方式的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明关系不大的其他细节。另外,还需要指出的是,在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。
本发明的基本思想是去除数据的时间相关性并提高距离当前较近的数据的重要性、减少规则涉及因素值的种类以控制规则的数量、多个分类器组合以提高可靠性、正交表表示以去除冗余和增强规则的完备性。
下面将参照图1描述根据本发明的实施例的规则抽取方法的流程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610258496.1/2.html,转载请声明来源钻瓜专利网。





