[发明专利]预测模型建模方法、装置、设备及存储介质在审
| 申请号: | 202010617186.0 | 申请日: | 2020-06-30 |
| 公开(公告)号: | CN111782611A | 公开(公告)日: | 2020-10-16 |
| 发明(设计)人: | 贾壮;许韩晨玺 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/17 | 分类号: | G06F16/17;G06N20/00;G06Q10/04;G06Q40/00;G06Q40/02 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;臧建明 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 预测 模型 建模 方法 装置 设备 存储 介质 | ||
本申请公开了预测模型建模方法、装置、设备及存储介质,涉及大数据领域。具体实现方案为:根据样本用户的时间戳,获取样本用户在预设时间范围内的搜索日志数据;提取搜索日志数据中的时间戳,并对提取的时间戳按照时间维度进行排序整理及统计,得到搜索行为时序统计特征;对搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征;以及将搜索行为模式特征作为入模变量,以生成预测模型,从而可以提高预测模型的预测效果。
技术领域
本申请实施例涉及数据处理和深度学习领域,尤其涉及一种预测模型建模方法、装置、设备及存储介质,可用于大数据分析技术。
背景技术
预测模型的效果主要取决于所用来进行训练和预测的特征,现有技术一些预测模型存在预测效果不佳的问题,例如风险控制模型,对于银行和各类金融机构来说,行方和机构内部的数据一般都为客户的基本个人信息(性别、年龄、学历等),以及客户在该机构的交易记录与流水等,数据源种类较为单一,涉及的内容和反映用户的特性较为局限,从而导致使用该些信息对用户进行预测的效果不佳。
发明内容
本申请提供了一种用于预测模型建模的方法、装置、设备以及存储介质。
根据本申请的第一方面,提供了一种预测模型建模方法,包括:
根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据;
提取所述搜索日志数据中的时间戳;
按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征;以及
将所述搜索行为模式特征作为入模变量,以生成所述预测模型。
根据本申请的第二方面,提供了一种预测模型建模装置,包括:
获取模块,用于根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据;
提取模块,用于提取所述搜索日志数据中的时间戳;
衍生模块,用于按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征;以及
生成模块,用于将所述搜索行为模式特征作为入模变量,以生成所述预测模型。
根据本申请的第三方面,至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面所述的方法。
根据本申请第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述第一方面所述的方法。
本申请中的一个实施例具有如下优点或有益效果:通过根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据;提取所述搜索日志数据中的时间戳;按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征;对所述搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征;以及将所述搜索行为模式特征作为入模变量,以生成所述预测模型,从而可以提高预测模型的预测效果。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请一实施例提供的预测模型建模方法的流程示意图;
图2为本申请另一实施例提供的预测模型建模方法的流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010617186.0/2.html,转载请声明来源钻瓜专利网。





