[发明专利]一种类目预测方法、装置、电子设备及存储介质在审
| 申请号: | 202010988807.6 | 申请日: | 2020-09-18 |
| 公开(公告)号: | CN112182323A | 公开(公告)日: | 2021-01-05 |
| 发明(设计)人: | 任磊;王金刚;刘金宝;杨扬;步佳昊;张富峥;王仲远 | 申请(专利权)人: | 北京三快在线科技有限公司 |
| 主分类号: | G06F16/908 | 分类号: | G06F16/908;G06F16/953;G06F40/295;G06K9/62 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
| 地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 类目 预测 方法 装置 电子设备 存储 介质 | ||
本申请实施例提供了一种类目预测方法、装置、电子设备及存储介质,该方法包括:获取用户输入的目标搜索词;提取目标搜索词的语义特征;提取目标搜索词所包括的目标实体;在预先确定的类目知识库中查询目标实体所属的类目;根据目标实体所属的类目为类目知识库中的各个类目设置知识标志位特征;基于语义特征,类目知识库中的各个类目对应的知识标志位特征,以及类目知识库中的各个类目对应的类目语义特征,确定目标搜索词所属的目标类目。可见,在预测类目时,通过实体识别任务识别出的目标实体,并引入了高质量的类目知识库,最终,通过目标搜索词的语义特征,类目知识标志位特征以及类目语义特征来确定目标类目,进而提高类目预测的准确率。
技术领域
本申请涉及互联网技术领域,特别是涉及一种类目预测方法、装置、电子设备及存储介质。
背景技术
互联网时代,搜索引擎是一个基础且核心的功能,无论是传统互联网还是移动互联网,一个好的搜索引擎可以理解用户搜索意图,使得用户能够及时找到自己想要搜索的信息。对于搜索引擎来说,理解用户搜索意图的核心是理解用户输入的搜索词,通常来说,对搜索词文本的理解包括类目预测,以分析搜索词意图和哪些类目更相关。
相关技术中,类目预测的方法通常为:通过统计用户对搜索词在各个类目下召回的召回结果的用户行为数据来预测搜索词所属的类目,如果用户对某类目下召回的召回结果的用户行为数据多,则确定该搜索词属于该类目。
但是,相关技术中的类目预测方法存在较明显的马太效应。具体的,统计的用户行为数据对于曝光较多的类目会占优势,从而使得所预测的类目更偏向于曝光较多的类目,导致类目预测准确度较低。
发明内容
为解决相关技术中存在的类目预测准确度较低的技术问题,本申请示出了一种类目预测方法、装置、电子设备及存储介质。
第一方面,本申请实施例示出了一种类目预测方法,所述方法包括:
获取用户输入的目标搜索词;
提取所述目标搜索词的语义特征;
提取所述目标搜索词所包括的目标实体;
在预先确定的类目知识库中查询所述目标实体所属的类目;
根据所述目标实体所属的类目为所述类目知识库中的各个类目设置知识标志位特征;
基于所述语义特征,所述类目知识库中的各个类目对应的知识标志位特征,以及所述类目知识库中的各个类目对应的类目语义特征,确定所述目标搜索词所属的目标类目。
可选的,所述根据所述目标实体所属的类目为所述类目知识库中的各个类目设置知识标志位特征,包括:
为所述目标实体所属的类目设置第一知识标志位特征;
为所述类目知识库中除所述目标实体所属的类目之外的其他类目设置第二知识标志位特征,所述第二知识标志位特征与所述第一知识标志位特征不同。
可选的,所述基于所述语义特征,所述类目知识库中的各个类目对应的知识标志位特征,以及所述类目知识库中的各个类目对应的类目语义特征,确定所述目标搜索词所属的目标类目,包括:
获取所述类目知识库中的各个类目对应的类目语义特征;
对于所述类目知识库中的任一类目,将所述语义特征,该类目对应的知识标志位特征,以及该类目对应的类目语义特征进行拼接,得到拼接后的特征;
将所述类目知识库中的各个类目对应的拼接后的特征输入预先训练好的分类器中,得到各个类目对应的概率值;
将概率值大于预设概率值的类目确定为所述目标搜索词对应的目标类目。
可选的,所述获取所述类目知识库中的各个类目对应的类目语义特征,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010988807.6/2.html,转载请声明来源钻瓜专利网。





