[发明专利]预测模型建模方法、装置、设备及存储介质在审
| 申请号: | 202010617186.0 | 申请日: | 2020-06-30 |
| 公开(公告)号: | CN111782611A | 公开(公告)日: | 2020-10-16 |
| 发明(设计)人: | 贾壮;许韩晨玺 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/17 | 分类号: | G06F16/17;G06N20/00;G06Q10/04;G06Q40/00;G06Q40/02 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;臧建明 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 预测 模型 建模 方法 装置 设备 存储 介质 | ||
1.一种预测模型建模方法,包括:
根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据;
提取所述搜索日志数据中的时间戳;
按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征;以及
将所述搜索行为模式特征作为入模变量,以生成所述预测模型。
2.根据权利要求1所述的方法,其中,所述按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征,包括:
按照时间维度对所述提取的时间戳进行聚合,得到第一聚合时序特征;以及
对所述第一聚合时序特征进行衍生,得到第一衍生时序特征,所述搜索行为模式特征包括所述第一聚合时序特征和所述第一衍生时序特征;或者,对所述提取的时间戳进行衍生得到第二衍生时序特征,所述搜索行为模式特征包括所述第一聚合时序特征和所述第二衍生时序特征。
3.根据权利要求2所述的方法,其中,所述第一衍生时序特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种;所述第二衍生时序特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种。
4.根据权利要求1-3中任一项所述的方法,其中,所述按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征之前,还包括:
对所述提取的时间戳进行排序整理及统计,得到搜索行为时序统计特征;
所述按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征,包括:
按照时间维度对所述搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征。
5.根据权利要求4所述的方法,其中,所述按照时间维度对所述搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征,包括:
按照时间维度对所述搜索行为时序统计特征进行聚合,得到第一聚合时序统计特征;以及
对所述第一聚合时序统计特征进行衍生,得到第一衍生时序统计特征,所述搜索行为模式特征包括所述第一聚合时序统计特征和所述第一衍生时序统计特征;或者,对所述搜索行为时序统计特征进行衍生得到第二衍生时序统计特征,所述搜索行为模式特征包括所述第一聚合时序统计特征和所述第二衍生时序统计特征。
6.根据权利要求5所述的方法,其中,所述第一衍生时序统计特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种;所述第二衍生时序统计特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种。
7.根据权利要求1-6中任一项所述的方法,其中,所述时间维度包括月、日,小时、每月上旬、每月中旬、每月下旬、白天时间段以及夜间时间段中的至少一种。
8.根据权利要求1-7中任一项所述的方法,其中,所述将所述搜索行为模式特征作为入模变量,以生成所述预测模型之后,还包括:
根据所述样本用户的标识和预测标签对所述预测模型进行训练,得到训练的模型。
9.根据权利要求8所述的方法,其中,所述根据所述样本用户的标识和预测标签对所述预测模型进行训练,得到训练的模型之后,包括:
将目标用户的标识和所述目标用户的搜索行为模式特征输入所述训练的模型进行预测。
10.根据权利要求8或9所述的方法,其中,所述预测标签为风险控制标签。
11.根据权利要求1-10中任一项所述的方法,其中,所述预设时间范围包括自所述样本用户的时间戳之前的预设时间段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010617186.0/1.html,转载请声明来源钻瓜专利网。





