[发明专利]搜索数据处理方法、装置、电子设备及计算机可读介质在审
申请号: | 201810361882.2 | 申请日: | 2018-04-20 |
公开(公告)号: | CN110399479A | 公开(公告)日: | 2019-11-01 |
发明(设计)人: | 魏毅;邵荣防;郝晖;罗宝胜;邓旺文;刘爽爽 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/9535;G06Q30/06 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 阚梓瑄;王卫忠 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机可读介质 电子设备 数据处理 关键词集合 关键词特征 搜索 特征数据 店铺 集合 计算机信息处理 搜索关键词 分类算法 输入预测 数据确定 搜索系统 特征处理 用户性别 预测模型 预测数据 预定特征 点击率 地域 干预 预测 制定 | ||
1.一种搜索数据处理方法,其特征在于,包括:
根据店铺数据确定关键词集合;
提取所述关键词集合中的每一个关键词的预定特征以生成关键词特征集合;
对所述关键词特征集合进行特征处理生成特征数据;以及
将所述特征数据输入预测模型以获取每一个关键词对应的点击预测数据,所述预测模型通过分类算法建立。
2.如权利要求1所述的方法,其特征在于,还包括:
通过历史店铺数据与分类算法生成预测模型,所述分类算法包括逻辑回归算法。
3.如权利要求2所述的方法,其特征在于,通过历史店铺数据与分类算法生成预测模型包括:
获取历史店铺数据中的历史特征数据;以及
将历史特征数据作为自变量,将预定用户行为作为输出变量,通过训练所述分类算法生成所述预测模型。
4.如权利要求1所述的方法,其特征在于,根据店铺数据确定关键词集合包括:
对所述店铺数据进行数据预处理;
提取预处理之后的店铺数据中的多个第一关键词;
对所述多个第一关键词分别进行聚合处理,获取多个第一关键词维度搜索量;以及
对所述多个第一关键词维度搜索量进行筛选处理以获取所述关键词集合。
5.如权利要求4所述的方法,其特征在于,对所述店铺数据进行数据预处理包括:
对所述店铺数据中的用户点击日志与订单日志进行数据预处理。
6.如权利要求4所述的方法,其特征在于,对所述多个第一关键词分别进行聚合处理,获取多个第一关键词维度搜索量包括:
将所述多个第一关键词分别在预定维度特征下进行聚合处理,生成多个第一关键词维度搜索量。
7.如权利要求6所述的方法,其特征在于,对所述多个第一关键词维度搜索量进行筛选处理以获取所述关键词集合包括:
分别判断每一个第一关键词维度搜索量是否满足预定条件;以及
通过满足预定条件的关键词维度搜索量对应的第一关键词生成所述关键词集合。
8.如权利要求7所述的方法,其特征在于,所述预定条件包括:
第一关键词流量占比、点击转化率、以及下单转化率。
9.一种搜索数据处理装置,其特征在于,包括:
集合模块,用于根据店铺数据确定关键词集合;
提取模块,用于提取所述关键词集合中的每一个关键词的预定特征以生成关键词特征集合;
特征模块,用于对所述关键词特征集合进行特征处理生成以及特征数据;以及
预测模块,用于将所述特征数据输入预测模型以获取每一个关键词对应的点击预测数据,所述预测模型通过分类算法建立。
10.如权利要求9所述的装置,其特征在于,还包括:
训练模块,用于通过历史店铺数据与分类算法生成预测模型,所述分类算法包括逻辑回归算法。
11.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-8中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810361882.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:事件发现方法和装置
- 下一篇:一种网页的训练方法及系统