[发明专利]一种行为数据预测方法及装置有效
申请号: | 202110695116.1 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113537297B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 林智明;潘华引 | 申请(专利权)人: | 同盾科技有限公司;同盾控股有限公司 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06N3/045;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 311100 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行为 数据 预测 方法 装置 | ||
本发明提供了一种行为数据预测方法及装置,属于数据处理领域,本发明提供的方法可以获取当前用户行为对应的第一机构编码,并将第一机构编码输入预置预测模型中获取预置预测模型输出的预测结果,其中,预置预测模型通过采用注意力机制对第二机构编码以及序列编码向量进行池化处理获得的目标特征向量训练得到,第二机构编码用于标识历史用户行为发生的机构,序列编码向量根据历史用户行为的发生时序以及所述第二机构编码构建得到,通过注意力机制的池化方法进行特征提取,预置预测模型的训练过程中无需进行特征工程,从而能够有效提高数据预测效率、降低成本,还能对各历史用户行为实现注意力加权的效果,提高模型对当前用户行为预测的准确率。
技术领域
本发明涉及数据处理领域,更具体地,涉及一种行为数据预测方法及装置。
背景技术
随着网络信息技术的发展,用户的消费、借贷、收支等发生时序性数据逐渐累积丰富,为用户行为的风险预测提供了可能。
用户行为的风险预测与广告点击率预测、营销响应预测、文本分类等均可抽象为二分类建模问题,通常先对用户进行用户画像,根据用户的静态属性、动态行为等进行数据预处理和特征工程,综合运用统计学和业务领域知识提炼用于建模的特征,再利用逻辑回归、决策树、梯度提升树等集成学习算法或者深度学习算法构建模型,并根据使用场景对模型进行离线或者在线部署,进行用户行为的风险预测。
其中,特征工程通常需要先对用户行为进行分类,再根据需求对不同种类的行为分时段统计,获得次数、频率、变化率、变化趋势等方面对用户进行表征从而获取用户的特征数据,可以看出,上述过程使得数据预处理较为复杂,且特征质量对数据质量、提取方式要求较高,导致数据预测效率较低、成本较高。
发明内容
本发明提供了一种行为数据预测方法与装置,以解决在构建数据预测模型时进行数据预处理、特征工程等过程导致数据预测效率较低、成本较高的问题。
本发明第一方面提供了一种行为数据预测方法,该方法可以包括:
获取当前用户行为对应的第一机构编码,所述第一机构编码用于标识所述当前用户行为发生的机构;
将所述第一机构编码输入预置预测模型中,获取所述预置预测模型针对所述当前用户行为输出的预测结果,所述预置预测模型通过采用注意力机制对第二机构编码以及序列编码向量进行池化处理获得的目标特征向量训练得到,所述第二机构编码用于标识历史用户行为发生的机构,所述序列编码向量根据所述历史用户行为的发生时序以及所述第二机构编码构建得到。
可选地,所述获取当前用户行为对应的第一机构编码之前,还包括:
分别获取至少两个历史用户行为对应的第二机构编码以及发生时序;
根据所述发生时序与所述第二机构编码构建至少两个所述历史用户行为对应的序列编码向量;
采用注意力机制对所述序列编码向量与所述第二机构编码进行池化处理获得目标特征向量;
采用所述目标特征向量进行深度神经网络模型训练,获得所述预置预测模型。
可选地,所述采用注意力机制对所述序列编码向量与所述第二机构编码进行池化处理获得目标特征向量,包括:
对所述序列编码向量进行Transformer处理,获得第一向量;
对所述序列编码向量与所述第二机构编码进行注意力池化处理,获得第二向量;
根据所述第一向量与所述第二向量获得所述目标特征向量。
可选地,所述对所述序列编码向量与所述第二机构编码进行注意力池化处理,获得第二向量,包括:
将所述第二机构编码作为第一矩阵,所述序列编码向量作为第二矩阵进行注意力池化处理,获得所述第二向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同盾科技有限公司;同盾控股有限公司,未经同盾科技有限公司;同盾控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110695116.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置