[发明专利]使用二元分类器处理的数据来生成规则的系统和方法在审
申请号: | 201780014200.4 | 申请日: | 2017-03-13 |
公开(公告)号: | CN108701259A | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | 鄢瑞;袁曙涛 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 二元分类 计算机计算 计算机实施 方法生成 机器学习 结合事件 生成规则 事件发生 | ||
1.一种结合事件的机器学习二元分类进行操作的计算机实施的方法,其特征在于,所述方法生成涉及是否会发生所述事件的规则,所述方法包括:
所述计算机从存储器获取一组数据,所述一组数据具有对应于所述事件不发生的实例的背景序列和对应于所述事件发生的实例的前景序列,每个所述背景序列和所述前景序列的每个序列位置具有相应的特征值;
针对多个所述前景序列中的每个前景序列,所述计算机通过以下操作针对每个差值来计算多个差值:
获取包括所选前景序列的相应一组位置中的特征值的相应子序列模式;以及
计算表示以下项的比较的值:(i)其它所述前景序列中所述相应子序列模式的出现概率以及(ii)所述背景序列中所述相应子序列模式的出现概率,以获取所述差值;以及
基于所述多个前景序列中的一个前景序列的最大差值来确定所述规则。
2.根据权利要求1所述的计算机实施的方法,其特征在于,计算表示所述比较的所述值包括:
计算所述相应子序列模式出现在其它所述前景序列中的第一概率;
计算所述相应子序列模式出现在所述背景序列中的第二概率;
确定表示使用所述第一概率和所述第二概率进行的所述比较的所述值。
3.根据权利要求2所述的计算机实施的方法,其特征在于,确定表示使用所述第一概率和所述第二概率进行的所述比较的所述值包括:
计算所述第一概率和所述第二概率的比率。
4.根据权利要求1至3中任一项所述的计算机实施的方法,其特征在于,获取所述规则包括:
基于以下项中的至少一项来计算得分:(i)对应于所述最大差值的所述相应子序列模式出现在所述前景序列中的频率,以及(ii)对应于所述最大差值的所述相应子序列模式出现在所述背景序列中的频率;
将所述得分与阈值进行比较;
当所述得分超过所述阈值时,将对应于所述最大差值的所述相应子序列模式映射到所述规则。
5.根据权利要求1至4中任一项所述的计算机实施的方法,其特征在于,所述多个所述前景序列为所有所述前景序列。
6.根据权利要求1至5中任一项所述的计算机实施的方法,其特征在于,使用不同长度的子序列模式来重复计算多个所述前景序列中的每个前景序列的多个差值并重复确定所述规则。
7.根据权利要求1至6中任一项所述的计算机实施的方法,其特征在于,还包括通过执行操作来生成所述一组数据,所述操作包括:
从存储器中检索原始数据,所述原始数据包括多个样本,每个样本对应于所述事件发生或不发生的实例,每个样本具有多个特征,所述多个特征中的每个特征取多个值中的一个值;
针对所述原始数据中的每个样本:将一个特征值映射到有限数量的分类特征值中的另一特征值;
将所述样本划分为所述前景序列和所述背景序列以产生所述一组数据,其中,对于每个样本:(i)如果所述样本对应于所述事件发生的实例,则被指定为前景序列,或(ii)如果所述样本对应于所述事件不发生的实例,则被指定为背景序列。
8.根据权利要求7所述的计算机实施的方法,其特征在于,包括以下项中的至少一项:(i)所述原始数据还通过所述机器学习二元分类进行处理,以及(ii)所述原始数据来自所述机器学习二元分类的输出。
9.根据权利要求1至8中任一项所述的计算机实施的方法,其特征在于,还包括将所述规则发送到用户界面以呈现给用户。
10.根据权利要求1至9中任一项所述的计算机实施的方法,其特征在于,所述事件是贷款违约,所述规则是规定涉及以下项中的至少一项的if-then条件的if-then规则:是否会发生贷款违约以及是否不会发生贷款违约。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780014200.4/1.html,转载请声明来源钻瓜专利网。