[发明专利]处理交易数据的方法及装置在审
申请号: | 201810146777.7 | 申请日: | 2018-02-12 |
公开(公告)号: | CN108446978A | 公开(公告)日: | 2018-08-24 |
发明(设计)人: | 赵科科;赵星 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06F17/30;G06F21/62 |
代理公司: | 北京亿腾知识产权代理事务所 11309 | 代理人: | 陈霁;周良玉 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据集 交易数据 明细数据 神经网络 特征向量 时间段 方法和装置 时间顺序 有效地 递归 交易 挖掘 分析 | ||
本说明书实施例提供一种处理交易数据的方法和装置,方法包括,首先获取与连续的n个时间段分别对应的n个数据集,其中各个数据集i包括对应的时间段中用户的交易明细数据。然后,基于对应的数据集i中的交易明细数据衍生出衍生变量,并基于衍生变量形成与各数据集对应的特征向量。基于此,将各个特征向量按照时间顺序输入时间递归的神经网络,从该神经网络获得处理结果。如此,更加有效地对交易数据进行挖掘和分析。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及处理交易数据的方法和装置。
背景技术
随着互联网技术的发展,人们越来越频繁地利用互联网和电子钱包进行各种交易,由此形成了交易数据。交易数据是具有很高价值的数据资产,特别是在目前的大数据背景下,如何深入挖掘交易数据,提炼出数据价值,在技术提升和业务提升方面都有重要的意义。
进一步地,在对数据进行深入挖掘的同时,还需要考虑应用场景问题和安全性问题。交易数据一般反映用户的交易历史,如果能通过交易数据的挖掘和处理,将交易数据的信息应用在更广泛的应用场景,例如信用业务场景,将进一步提升数据的利用率。此外,在许多情况下,存在与其他机构共建模型的可能,这就需要将初步处理的数据发给其他机构。此时,既希望挖掘的数据有较高的数据价值和数据含义,又要考虑数据泄露的系统风险和用户隐私的保护,而尽量隐藏业务含义。如此,对数据的挖掘和处理提出很高的要求。
因此,希望能有改进的方案,更有效地对交易数据进行处理。
发明内容
本说明书一个或多个实施例描述了一种方法和装置,通过结合变量衍生的初步数据挖掘和神经网络的进一步数据分析,更有效地对交易数据进行处理。
根据第一方面,提供了一种处理交易数据的方法,包括:
获取与连续的n个预设时间段分别对应的n个数据集,其中各个数据集i包括对应的时间段中用户的交易明细数据;
形成与所述n个数据集分别对应的n个特征向量,其中各个特征向量Fi分别包括,基于对应的数据集i中的交易明细数据衍生出的衍生变量;
将所述n个特征向量按照时间顺序输入时间递归的神经网络,从所述时间递归的神经网络获得处理结果。
根据一个实施例,交易明细数据包括多个字段,所述多个字段至少包括:交易时间字段,交易金额字段,以及至少一个类别字段。
在一种可能的设计中,形成特征向量的步骤包括:获取数据集i中所述交易明细数据的所述多个字段;对所述多个字段的数据进行聚合操作,从而获得衍生变量;将所述衍生变量作为所述特征向量Fi的向量元素。
根据一个实施例,对多个字段中的数据进行聚合操作包括:从所述多个字段中选择至少一部分字段进行组合,得到组合字段;对组合字段的数据进行运算操作,从而得到衍生变量。
进一步地,在一个实施例中,上述运算操作包括以下中的一项或多项:数值判断、计数、求和、求平均、求标准差、求分位数、分布统计。
根据一种可能的设计,形成特征向量的步骤还包括:获取数据集i中所述至少一个类别字段的内容;利用词嵌入模型,将所述至少一个类别字段的内容转换为词向量;将所述词向量作为所述特征向量Fi的一部分。
在一个实施例中,上述时间递归的神经网络采用循环神经网络RNN,长短期记忆神经网络LSTM,门控循环单元神经网络GRU之一。
在一个实施例中,时间递归的神经网络还包括至少一个全连接层。
根据一个实施例,所述时间递归的神经网络利用已标定数据集进行训练,所述已标定数据集包括历史交易数据,且具有是否发生信用违约的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810146777.7/2.html,转载请声明来源钻瓜专利网。