[发明专利]关键词推荐方法、装置、设备及存储介质在审
申请号: | 202110248977.5 | 申请日: | 2021-03-05 |
公开(公告)号: | CN115017344A | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 卢凯敏;李愈曈;张绍瑞 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F16/48 | 分类号: | G06F16/48;G06F16/45;G06F16/41;G06F16/9532;G06F16/9535;G06F16/9536;G06F40/279;G06F40/30 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 关向兰 |
地址: | 100088 北京市西城区酒仙桥*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 推荐 方法 装置 设备 存储 介质 | ||
本发明涉及搜索技术领域,公开了一种关键词推荐方法、装置、设备及存储介质,该方法包括在接收到用户输入的检索指令时,从检索指令中提取检索关键词;在检索关键词不满足预设条件时,获取用户对应的多媒体信息关键词候选集;根据预设细粒度识别策略和多媒体信息关键词候选集确定用户兴趣词语集合;根据预设召回策略分别对多媒体信息关键词候选集和用户兴趣词语集合进行召回,以获得多个关键词更新候选集;对关键词更新候选集进行粗排序,根据排序结果进行关键词推荐。本发明中,用户输入的检索词不满足预设条件即不规范或语义混淆无法识别时,通过融合综合搜索的用户行为即用户对应的多媒体信息关键词候选集,来对多媒体信息关键词进行推荐。
技术领域
本发明涉及搜索技术领域,尤其涉及一种关键词推荐方法、装置、设备 及存储介质。
背景技术
搜索多媒体信息中需要基于用户检索关键词query进行多媒体信息召回, 但是在一些垂直搜索场景下,缺少用户检索query或者query表达不清,此时 会导致一次请求到达多媒体信息引擎后无法召回多媒体信息,进而导致多媒 体信息主、媒体资源方、多媒体信息受众这三方的多媒体信息需求及收益低 效,媒体流量的商业化变现低。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是 现有技术。
发明内容
本发明的主要目的在于提供一种关键词推荐方法、装置、设备及存储介 质,旨在解决现有检索query不规范或语义混淆导致无法召回多媒体信息的技 术问题。
为实现上述目的,本发明提供一种关键词推荐方法,所述关键词推荐方 法包括以下步骤:
在接收到用户输入的检索指令时,从所述检索指令中提取检索关键词;
在所述检索关键词不满足预设条件时,获取所述用户对应的多媒体信息 关键词候选集;
根据预设细粒度识别策略和所述多媒体信息关键词候选集确定用户兴趣 词语集合;
根据预设召回策略分别对所述多媒体信息关键词候选集和所述用户兴趣 词语集合进行召回,以获得多个关键词更新候选集;
对所述关键词更新候选集进行粗排序,根据排序结果进行关键词推荐。
可选地,所述获取所述用户对应的多媒体信息关键词候选集的步骤,包 括:
获取全网用户多媒体信息关键词改写的基础训练数据;
获取用户的IP常驻地址,根据预设IP定位技术确定所述IP常驻地址的 常驻地特征;
将所述常驻地特征作为所述IP常驻地址对应的地理属性;
根据所述地理属性和所述基础训练数据生成所述用户对应的多媒体信息 关键词候选集。
可选地,所述根据所述地理属性和所述基础训练数据生成所述用户对应 的多媒体信息关键词候选集的步骤,包括:
根据所述地理属性和所述基础训练数据生成所述用户对应的初始多媒体 信息关键词候选集;
读取所述初始多媒体信息关键词候选集,并根据预设时间粒度对所述初 始多媒体信息关键词候选集进行聚合,以获得聚合多媒体信息关键词候选集;
根据预设横向切分规则将所述聚合多媒体信息关键词候选集按照时间戳 切分成横向多媒体信息关键词候选集;
根据预设纵向维度列对所述横向多媒体信息关键词候选集的列维度进行 编号,以获得纵向多媒体信息关键词候选集;
根据预设位图算法对所述纵向多媒体信息关键词候选集进行压缩,并将 压缩后的纵向多媒体信息关键词候选集作为用户对应的多媒体信息关键词候 选集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110248977.5/2.html,转载请声明来源钻瓜专利网。