[发明专利]关键词召回方法、装置、电子设备以及存储介质在审
申请号: | 202110867106.1 | 申请日: | 2021-07-29 |
公开(公告)号: | CN113822065A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 石磊 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06K9/62 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 徐明霞 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 召回 方法 装置 电子设备 以及 存储 介质 | ||
本申请的实施例揭示了一种关键词召回方法、装置、电子设备以及存储介质,该方法包括:计算待召回词与种子关键词之间的第一相似度,将第一相似度大于第一阈值的待召回词确定为目标关键词,并将第一相似度小于第一阈值且大于第二阈值的待召回词确定为候选关键词,第一阈值大于第二阈值;计算待召回句与种子关键句之间的第二相似度,种子关键句包括至少一个种子关键词,待召回句包括至少一个待召回词;将第二相似度大于第三阈值的待召回句作为候选待召回句,并将候选待召回句中包含的候选关键词确定为目标关键词;召回目标关键词。本申请实施例的技术方案能够提高关键词的召回率。
技术领域
本申请涉及计算机信息处理技术领域,具体而言,涉及一种关键词召回方法、装置、电子设备以及存储介质。
背景技术
基于关键词的信息推荐方式是根据用户在搜索引擎中输入的关键词来确定向用户推送的信息。用户在网站内外进行信息投放时,必须以关键词为单位选择投放,如何获得适合自己的关键词成为关键操作之一。现有的关键词召回方法普遍存在召回率低的问题。
发明内容
为解决上述技术问题,本申请的实施例提供了一种关键词召回方法、装置、电子设备以及存储介质,能够提高关键词的召回率。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种关键词召回方法,包括:计算待召回词与种子关键词之间的第一相似度,将第一相似度大于第一阈值的待召回词确定为目标关键词,并将第一相似度小于第一阈值且大于第二阈值的待召回词确定为候选关键词,第一阈值大于第二阈值;计算待召回句与种子关键句之间的第二相似度,种子关键句包括至少一个种子关键词,待召回句包括至少一个待召回词;将第二相似度大于第三阈值的待召回句作为候选待召回句,并将候选待召回句中包含的候选关键词确定为目标关键词;召回所有的目标关键词。
根据本申请实施例的一个方面,提供了一种关键词召回装置,包括:第一计算模块,用于计算待召回词与种子关键词之间的第一相似度,将第一相似度大于第一阈值的待召回词确定为目标关键词,并将第一相似度小于第一阈值且大于第二阈值的待召回词确定为候选关键词,第一阈值大于第二阈值;第二计算模块,用于计算待召回句与种子关键句之间的第二相似度,种子关键句包括至少一个种子关键词,待召回句包括至少一个待召回词;分析模块,用于将第二相似度大于第三阈值的待召回句作为候选待召回句,并将候选待召回句中包含的候选关键词确定为目标关键词;召回模块,用于召回所有的目标关键词。
根据本申请实施例的一个方面,提供了一种电子设备,包括处理器及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的关键词召回方法。
根据本申请实施例的一个方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,当计算机可读指令被计算机的处理器执行时,使计算机执行如前提供的关键词召回方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实施例中提供的关键词召回方法。
在本申请的实施例所提供的技术方案中,首先计算种子关键词与待召回词之间的第一相似度,并根据第一相似度大小确定一部分相似度值较大的带待召回关键词作为目标关键词,然后计算待召回句与种子关键句之间的第二相似度,确定第二相似度值较大的一部分待召回句中的待召回词,并将其作为候选关键词,若候选关键词与种子关键词的第一相似度值大于第二阈值且小于第一阈值,则将候选关键词确定为目标关键词,最后将所有目标关键词召回。本申请方案通过种子关键句对待召回词进行召回,能够弥补仅利用种子关键词召回的关键词所造成的召回率不足的问题,进而提高关键词的召回率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110867106.1/2.html,转载请声明来源钻瓜专利网。