[发明专利]处理交易数据的方法及装置在审

专利信息
申请号: 201810146777.7 申请日: 2018-02-12
公开(公告)号: CN108446978A 公开(公告)日: 2018-08-24
发明(设计)人: 赵科科;赵星 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06Q40/04 分类号: G06Q40/04;G06F17/30;G06F21/62
代理公司: 北京亿腾知识产权代理事务所 11309 代理人: 陈霁;周良玉
地址: 英属开曼群岛大开*** 国省代码: 开曼群岛;KY
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据集 交易数据 明细数据 神经网络 特征向量 时间段 方法和装置 时间顺序 有效地 递归 交易 挖掘 分析
【说明书】:

本说明书实施例提供一种处理交易数据的方法和装置,方法包括,首先获取与连续的n个时间段分别对应的n个数据集,其中各个数据集i包括对应的时间段中用户的交易明细数据。然后,基于对应的数据集i中的交易明细数据衍生出衍生变量,并基于衍生变量形成与各数据集对应的特征向量。基于此,将各个特征向量按照时间顺序输入时间递归的神经网络,从该神经网络获得处理结果。如此,更加有效地对交易数据进行挖掘和分析。

技术领域

本说明书一个或多个实施例涉及计算机技术领域,尤其涉及处理交易数据的方法和装置。

背景技术

随着互联网技术的发展,人们越来越频繁地利用互联网和电子钱包进行各种交易,由此形成了交易数据。交易数据是具有很高价值的数据资产,特别是在目前的大数据背景下,如何深入挖掘交易数据,提炼出数据价值,在技术提升和业务提升方面都有重要的意义。

进一步地,在对数据进行深入挖掘的同时,还需要考虑应用场景问题和安全性问题。交易数据一般反映用户的交易历史,如果能通过交易数据的挖掘和处理,将交易数据的信息应用在更广泛的应用场景,例如信用业务场景,将进一步提升数据的利用率。此外,在许多情况下,存在与其他机构共建模型的可能,这就需要将初步处理的数据发给其他机构。此时,既希望挖掘的数据有较高的数据价值和数据含义,又要考虑数据泄露的系统风险和用户隐私的保护,而尽量隐藏业务含义。如此,对数据的挖掘和处理提出很高的要求。

因此,希望能有改进的方案,更有效地对交易数据进行处理。

发明内容

本说明书一个或多个实施例描述了一种方法和装置,通过结合变量衍生的初步数据挖掘和神经网络的进一步数据分析,更有效地对交易数据进行处理。

根据第一方面,提供了一种处理交易数据的方法,包括:

获取与连续的n个预设时间段分别对应的n个数据集,其中各个数据集i包括对应的时间段中用户的交易明细数据;

形成与所述n个数据集分别对应的n个特征向量,其中各个特征向量Fi分别包括,基于对应的数据集i中的交易明细数据衍生出的衍生变量;

将所述n个特征向量按照时间顺序输入时间递归的神经网络,从所述时间递归的神经网络获得处理结果。

根据一个实施例,交易明细数据包括多个字段,所述多个字段至少包括:交易时间字段,交易金额字段,以及至少一个类别字段。

在一种可能的设计中,形成特征向量的步骤包括:获取数据集i中所述交易明细数据的所述多个字段;对所述多个字段的数据进行聚合操作,从而获得衍生变量;将所述衍生变量作为所述特征向量Fi的向量元素。

根据一个实施例,对多个字段中的数据进行聚合操作包括:从所述多个字段中选择至少一部分字段进行组合,得到组合字段;对组合字段的数据进行运算操作,从而得到衍生变量。

进一步地,在一个实施例中,上述运算操作包括以下中的一项或多项:数值判断、计数、求和、求平均、求标准差、求分位数、分布统计。

根据一种可能的设计,形成特征向量的步骤还包括:获取数据集i中所述至少一个类别字段的内容;利用词嵌入模型,将所述至少一个类别字段的内容转换为词向量;将所述词向量作为所述特征向量Fi的一部分。

在一个实施例中,上述时间递归的神经网络采用循环神经网络RNN,长短期记忆神经网络LSTM,门控循环单元神经网络GRU之一。

在一个实施例中,时间递归的神经网络还包括至少一个全连接层。

根据一个实施例,所述时间递归的神经网络利用已标定数据集进行训练,所述已标定数据集包括历史交易数据,且具有是否发生信用违约的标签。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810146777.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top