[发明专利]一种特征衍生方法、装置及电子设备在审
申请号: | 201811310629.0 | 申请日: | 2018-11-06 |
公开(公告)号: | CN109635953A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 张天翼;郭龙;宋博文 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06Q10/06 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新;朱文杰 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 备选 装置及电子设备 原始数据 变换处理 明细数据 目标特征 评分模型 特征确定 特征输入 预设 | ||
本发明公开了一种特征衍生方法、装置及电子设备,所述方法可以基于原始数据确定初始特征,所述初始特征为包含多个参数的累积型变量,所述原始数据中包含用于累积确定所述多个参数的值的事件明细数据;对所述初始特征的多个参数中的至少一个参数进行变换处理,衍生得到备选特征;将所述备选特征的元特征输入特征评分模型,得到所述备选特征的评分;如果所述备选特征的评分大于或等于第一预设值,则将所述备选特征确定为衍生出的目标特征。
技术领域
本申请涉及计算机技术领域,尤其涉及一种特征衍生方法、装置及电子设 备。
背景技术
随着人工智能技术的发展,依据现有数据中的特征进行机器学习建立相关 模型已非常常见。例如,在第三方支付平台或网络购物平台的风险防控领域, 常依据现有的包含风险特征(例如,交易事件数据中的交易金额、交易频率等 特征)的数据进行机器学习得到风控模型。
针对各种风控模型,不法分子会不断的改进作案手段以避开风险防控,使 得风险形式不断发生变化,例如,非法组织者往往会根据第三方支付平台的风 控模型不停地尝试新的手段绕过监管。这就需要不断地对风控模型进行改进, 以对未来可能出现的新风险做出有效的防控。然而,现有数据中的风险特征无 法代表未来的情况,未来的包含新风险特征的数据还没有产生,因此,需要对 现有数据中的风险特征进行学习,衍生得到能够反映未来风险的新风险特征, 以对风控模型进行改进。其中,对现有特征进行学习衍生得到新特征的过程叫 特征衍生。
目前,要么依据人工经验进行特征衍生,要么利用穷举的方式进行特征衍 生。前者依赖于领域内的专家经验,耗时长、衍生过程慢;后者需要花费大量 的计算资源进行计算,耗时也较长、衍生过程也慢。
发明内容
本申请实施例提供了一种特征衍生方法、装置及电子设备,以解决现有的 特征衍生方案耗时长、衍生过程慢的问题。
为解决上述技术问题,本申请实施例是这样实现的:
第一方面,提出了一种特征衍生方法,所述方法包括:
基于原始数据确定初始特征,所述初始特征为包含多个参数的累积型变 量,所述原始数据中包含用于累积确定所述多个参数的值的事件明细数据;
对所述初始特征的多个参数中的至少一个参数进行变换处理,衍生得到备 选特征;
将所述备选特征的元特征输入特征评分模型,得到所述备选特征的评分, 所述特征评分模型是基于包含多个备选特征的元特征的样本数据和样本数据 对应的第一标签训练得到的,第一标签为备选特征的评分;
如果所述备选特征的评分大于或等于第一预设值,则将所述备选特征确定 为衍生出的目标特征。
第二方面,提出了一种特征衍生装置,所述装置包括:
初始特征确定模块,用于基于原始数据确定初始特征,所述初始特征为包 含多个参数的累积型变量,所述原始数据中包含用于累积确定所述多个参数的 值的事件明细数据;
备选特征衍生模块,用于对所述初始特征的多个参数中的至少一个参数进 行变换处理,衍生得到备选特征;
评分模块,用于将所述备选特征的元特征输入特征评分模型,得到所述备 选特征的评分,所述特征评分模型是基于包含多个备选特征的元特征的样本数 据和样本数据对应的第一标签训练得到的,第一标签为备选特征的评分;
目标特征确定模块,用于如果所述备选特征的评分大于或等于第一预设 值,则将所述备选特征确定为衍生出的目标特征。
第三方面,提出了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使 所述处理器执行以下操作:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811310629.0/2.html,转载请声明来源钻瓜专利网。