[发明专利]目标人群搜索意图的识别方法、装置、电子设备及介质在审
申请号: | 202110592047.1 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113407666A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 黎晓东;冯翔 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/335 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 人群 搜索 意图 识别 方法 装置 电子设备 介质 | ||
本公开关于一种目标人群搜索意图的识别方法、装置、电子设备和存储介质,其中,该方法包括:在获取到搜索请求时,获取搜索请求中各搜索词在预设时间段之内的搜索特征和统计特征,其中,统计特征用于表征搜索词在预设时间段之内的分布情况;根据每个搜索词的搜索特征,从各搜索词中确定出候选搜索词;根据候选搜索词的统计特征,判定候选搜索词是否具有搜索目标人群意图。由此,通过根据搜索词在预设时间段之内的搜索特征和统计特征,确定搜索词是否具有搜索目标人群意图,提高了搜索准确性。
技术领域
本公开涉及搜索技术领域,尤其涉及一种目标人群搜索意图的识别方法、装置、电子设备和存储介质。
背景技术
在搜索领域,准确的搜索意图可以辅助进行召回结果的过滤,可见,搜索意图识别具有重要作用。在一些搜索场景下,存在对目标人群进行搜索的搜索行为,比如,在社交平台搜索粉丝数量较多的用户,因此需要对目标人群搜索意图进行识别。
相关技术中,常见的识别用户搜索意图的方法有基于机器学习的搜索意图识别,主要是基于已有搜索词进行搜索意图的标注,利用标注样本训练机器学习模型,利用训练好的模型预测搜索词的搜索意图。
但是,基于机器学习的搜索意图识别,是通过学习文本的语义信息识别搜索意图,而通常目标人群的用户名蕴含的语义信息较少,识别准确性低。
发明内容
根据本公开实施例的第一方面,提供一种目标人群搜索意图的识别方法,包括:
在获取到搜索请求时,获取所述搜索请求中各搜索词在预设时间段之内的搜索特征和统计特征,其中,所述统计特征用于表征所述搜索词在所述预设时间段之内的分布情况;
根据每个所述搜索词的搜索特征,从所述各搜索词中确定出候选搜索词;
根据所述候选搜索词的统计特征,判定所述候选搜索词是否具有搜索目标人群意图。
在本公开第一方面实施例一种可能的实现方式中,在所述根据每个所述搜索词的搜索特征,从所述各搜索词中确定出候选搜索词之后,所述方法还包括:
在所述搜索词非候选搜索词时,基于所述搜索词的关联搜索词或目标用户列表,判定所述搜索词是否具有搜索目标人群意图,其中,所述目标用户列表中的用户属于所述目标人群。
在本公开第一方面实施例一种可能的实现方式中,所述基于所述搜索词的关联搜索词或目标用户列表,判定所述搜索词是否具有搜索目标人群意图,包括:
基于各搜索词与改写词之间的映射关系,确定所述搜索词对应的改写词,其中,所述改写词为用于替换所述搜索词的分词;
在所述改写词具有搜索目标人群意图时,确定所述搜索词具有搜索目标人群意图。
在本公开第一方面实施例一种可能的实现方式中,所述基于所述搜索词的关联搜索词或目标用户列表,判定所述搜索词是否具有搜索目标人群意图,包括:
获取所述目标用户列表;
计算所述搜索词与所述目标用户列表中每个用户标识之间的第一文本相似度;
根据所述第一文本相似度,判定所述搜索词是否具有搜索目标人群意图。
在本公开第一方面实施例一种可能的实现方式中,所述基于所述搜索词的关联搜索词或目标用户列表,判定所述搜索词是否具有搜索目标人群意图,包括:
从具有搜索目标人群意图的历史搜索词中,确定出与所述搜索词的相关度大于相关度阈值的目标搜索词;
计算所述搜索词与所述目标搜索词之间的第二文本相似度;
根据所述第二文本相似度,判定所述搜索词是否具有搜索目标人群意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110592047.1/2.html,转载请声明来源钻瓜专利网。