[发明专利]搜索热词的确定方法、装置、计算机设备及存储介质有效
申请号: | 202310024195.2 | 申请日: | 2023-01-09 |
公开(公告)号: | CN115757923B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 朱建伟 | 申请(专利权)人: | 北京创新乐知网络技术有限公司;长沙开发者科技有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/35;G06F40/289;G06F40/30;G06F11/34 |
代理公司: | 深圳市诺正鑫泽知识产权代理有限公司 44689 | 代理人: | 罗秦 |
地址: | 100020 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 确定 方法 装置 计算机 设备 存储 介质 | ||
1.一种搜索热词的确定方法,所述方法包括:
获取每个本平台用户对应的历史搜索数据,根据各个所述历史搜索数据生成搜索热词,得到本平台搜索热词集;
获取每个第三方平台发送的跳转关键词数据集,跳转关键词数据是指第三平台跳转到本平台的页面时向本平台反馈搜索到的该页面对应的关键词组合,根据各个所述跳转关键词数据集生成搜索热词,得到第三方搜索热词集,包括:对各个所述跳转关键词数据集进行分词,根据分词得到的各个短语生成每个短语的词频,从各个词频中提取排名靠前的M个词频,将提取的每个词频对应的短语作为一个搜索热词,将M个搜索热词作为第三方搜索热词集,M是大于0的整数;
获取每个所述本平台用户对应的第一浏览器记录,并获取每个所述第三方平台对应的每个用户对应的第二浏览器记录,根据各个所述第一浏览器记录和各个所述第二浏览器记录生成搜索热词,得到浏览器搜索热词集,其中,所述第一浏览器记录和所述第二浏览器记录均包括:平台标识、浏览器缓存和浏览历史记录;
将所述本平台搜索热词集、所述第三方搜索热词集和所述浏览器搜索热词集依次进行合集、去重处理,得到目标搜索热词集;
所述将所述本平台搜索热词集、所述第三方搜索热词集和所述浏览器搜索热词集依次进行合集、去重处理,得到目标搜索热词集的步骤之后,还包括:
对预设的高频请求识别器进行数据清除处理;
将所述目标搜索热词集更新到所述高频请求识别器;
在预设的目标缓存中,对不包含所述目标搜索热词集中的搜索热词的关联数据进行清空处理;
根据所述高频请求识别器和所述目标缓存响应搜索请求,包括:获取所述搜索请求,其中,所述搜索请求携带有请求内容;将所述请求内容输入所述高频请求识别器进行是否高频请求识别,得到识别结果;若所述识别结果为否,则根据所述请求内容调用预设的搜索服务搜索预设的业务数据库,得到目标搜索结果;若所述识别结果为是,则根据所述请求内容,从所述目标缓存中查找搜索热词,得到查找结果,若所述查找结果为成功,则将所述目标缓存中的与所述查找结果对应的搜索结果作为所述目标搜索结果,若所述查找结果为失败,则根据所述请求内容调用所述搜索服务搜索所述业务数据库,得到所述目标搜索结果,并将所述请求内容和所述目标搜索结果作为关联数据更新到所述目标缓存中;将所述目标搜索结果发送给所述搜索请求对应的调用对象。
2.根据权利要求1所述的搜索热词的确定方法,其特征在于,所述根据各个所述第一浏览器记录和各个所述第二浏览器记录生成搜索热词,得到浏览器搜索热词集的步骤,包括:
将每个所述第一浏览器记录中的每个单记录数据输入预设的分类模型进行分类预测,得到第一分类结果,根据预设的分类配置,从所有所述第一分类结果中筛选出一个或多个第一分类结果,作为第一命中结果集,对所述第一命中结果集对应的各个所述单记录数据进行关键词提取,得到第一数据集,对所述第一命中结果集对应的各个所述单记录数据进行主题提取,得到第二数据集,对所述第一数据集和所述第二数据集依次进行合集、去重处理,得到第一属性信息;
将每个所述第二浏览器记录中的每个单记录数据输入所述分类模型进行分类预测,得到第二分类结果,根据所述分类配置,从各个所述第二分类结果中筛选出一个或多个第二分类结果,作为第二命中结果集,对所述第二命中结果集对应的各个所述单记录数据进行关键词提取,得到第三数据集,对所述第二命中结果集对应的各个所述单记录数据进行主题提取,得到第四数据集,对所述第三数据集和所述第四数据集依次进行合集、去重处理,得到第二属性信息;
根据所述第一属性信息和所述第二属性信息生成搜索热词,得到所述浏览器搜索热词集。
3.根据权利要求2所述的搜索热词的确定方法,其特征在于,所述将所述本平台搜索热词集、所述第三方搜索热词集和所述浏览器搜索热词集依次进行合集、去重处理,得到目标搜索热词集的步骤之后,还包括:
将任一个所述第三方平台作为目标平台;
从所述第三方搜索热词集中提取出与所述目标平台对应的各个搜索热词,作为第一搜索热词集;
在所述目标搜索热词集中,删除与所述第一搜索热词集对应的各个搜索热词,得到第二搜索热词集;
将所述第二搜索热词集发送给所述目标平台。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京创新乐知网络技术有限公司;长沙开发者科技有限公司,未经北京创新乐知网络技术有限公司;长沙开发者科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310024195.2/1.html,转载请声明来源钻瓜专利网。