[发明专利]模型训练方法及装置、行为预测方法及装置、设备及介质在审
申请号: | 202110746650.0 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113409135A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 陈道斌;金阳;崔好好;张珺珺;邵嘉祎;罗天宇 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q10/04;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周天宇 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 行为 预测 设备 介质 | ||
1.一种模型训练方法,包括:
构建多个用户的时序数据序列样本,每个所述时序数据序列样本包括多个连续时间点下的样本,每个所述样本包括一用户在当前时间点下的至少一个预设类型的数据;
采用预设的滑动时间窗口对所述时序数据序列样本进行数据提取,得到各滑动时点对应滑动时间窗口的窗口数据;
基于各所述滑动时点对应滑动时间窗口的窗口数据,训练行为预测模型。
2.根据权利要求1所述的方法,其中,所述基于各所述滑动时点对应滑动时间窗口的窗口数据,训练行为预测模型包括:
对各所述滑动时点对应滑动时间窗口的窗口数据进行数据衍生处理,得到多种类型的衍生数据;
基于所述窗口数据和所述多种类型的衍生数据,训练行为预测模型。
3.根据权利要求1所述的方法,其中,所述采用预设的滑动时间窗口对所述时序样本序列进行数据提取,得到各滑动时点对应滑动时间窗口的窗口数据包括:
查找所述多个连续时间点中的第二个时间点;
使用所述滑动时间窗口从所述第二个时间点滑动到最后一个时间点进行数据提取,得到各滑动时点对应滑动时间窗口的窗口数据。
4.根据权利要求1所述的方法,其中,所述样本的类型包括违约样本和正常样本,所述方法还包括:
当所述滑动时间窗口内出现违约样本时,确定所述违约样本对应的违约用户;
在所述时序数据序列样本中剔除所述违约用户的所有样本。
5.根据权利要求1所述的方法,其中,所述方法还包括:
获取当前滑动时点和当前滑动时间窗口对应的时间点;
剔除所述滑动时间窗口内的样本的有效时间小于所述滑动时间窗口的当前滑动时点的样本。
6.根据权利要求1至5任意一项所述的方法,其中,所述滑动时间窗口的时间长度包括至少两个连续时间点。
7.根据权利要求1至5任意一项所述的方法,其中,所述至少一个预设类型的数据为与借贷相关的数据。
8.根据权利要求1至5任意一项所述的方法,所述基于各所述滑动时点对应滑动时间窗口的窗口数据,训练行为预测模型之前,包括:
计算所述时序数据序列样本中每一类型的数据在不同时间窗口下的稳定性指数;
判断每一类型的数据的稳定性指数是否大于预设阈值;
若存在一类型的数据的稳定性指数大于预设阈值,则去掉所述类型的数据。
9.根据权利要求2所述的方法,所述对各所述滑动时点对应滑动时间窗口的窗口数据进行数据衍生处理,得到多种类型的衍生数据包括:
统计所述窗口数据中所有样本中数据的类型的个数;
计算每一类型的数据的熵值;
根据所述每一类型的数据的熵值,对每个样本中的数据进行衍生处理。
10.一种行为预测方法,包括:
采集待预测用户的时序数据序列,所述时序数据序列包括在多个连续时间点下的至少一个预设类型的数据;
采用预设的滑动时间窗口对所述时序数据序列进行数据提取,得到各滑动时点对应滑动时间窗口的窗口数据;
基于各所述滑动时点对应滑动时间窗口的窗口数据和预先训练好的行为预测模型对所述待预测用户进行行为预测,得到与所述至少一个预设类型的数据相关的预测结果;
其中,所述预先训练好的行为预测模型通过根据权利要求1至9任意一项所述的模型训练方法训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110746650.0/1.html,转载请声明来源钻瓜专利网。