[发明专利]排序模型训练及样本数据生成方法、装置及电子设备在审
申请号: | 202111436721.3 | 申请日: | 2021-11-29 |
公开(公告)号: | CN114238560A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 潘迪生;黄腾玉 | 申请(专利权)人: | 北京爱奇艺科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/338;G06F40/284 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 项京;丁芸 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 排序 模型 训练 样本 数据 生成 方法 装置 电子设备 | ||
本申请实施例提供了一种排序模型训练及样本数据生成方法、装置及电子设备,用于训练排序模型的目标样本数据中不仅包括用户最终输入的用户输入关键词,还包括用户输入关键词输入完成之前的词形态,用户输入关键词输入完成之前的词形态的词长度短于用户输入关键词的词长度,从而可以利用更短的关键词来对排序模型进行训练,训练得到的排序模型也就能够在用户输入较短的关键词时得到准确的查询关键字智能提示果,从而实现了在用户输入较短的关键词时便能够得到准确的查询关键字智能提示。
技术领域
本申请涉及数据搜索技术领域,特别是涉及排序模型训练及样本数据生成方法、装置及电子设备。
背景技术
Suggestion(查询关键字智能提示)是指根据用户在搜索框内输入的关键词向用户返回的预测的用户希望搜索的关键词,例如图1所示,用户在搜索框内输入的关键词为“神经网络”,返回的查询关键字智能提示为“神经网络算法”、“神经网络模型”、“神经网络算法三大类”、“神经网络原理”、“神经网络引擎”等。
现有技术中,利用用户在搜索框中最终输入的关键词及用户希望搜索的真值关键词对排序模型进行训练,从而得到预先训练的排序模型。在实际使用过程中,利用预先训练的排序模型对搜索框中的关键词进行分析,得到多个预测的关键词,并对各预测的关键词进行排序从而得到查询关键字智能提示。
发明人在研究中发现,采用上述方法得到的排序模型中,仅在用户输入较为完整的关键词时,才能够得到准确的查询关键字智能提示,而在用户输入较短的关键词时查询关键字智能提示往往并不准确。例如,用户希望搜索的关键词为“神经网络原理”,当用户在输入框中输入较短的关键词“神经”时,查询关键字智能提示为“神经衰弱的症状”、“神经性耳鸣的治疗方法”等,“神经”对应的查询关键字智能提示中完全不包括“神经网络算法原理”,而在用户输入“神经网络”后,返回的查询关键字智能提示中排序第四的关键词“神经网络原理”才是用户希望搜索的关键词。因此,如何在用户输入较短的关键词时便得到准确的查询关键字智能提示,成为亟待解决的技术问题。
发明内容
本申请实施例的目的在于提供一种排序模型训练及样本数据生成方法、装置及电子设备,以实现在用户输入较短的关键词时便能够得到准确的查询关键字智能提示。具体技术方案如下:
第一方面,本申请实施例提供了一种排序模型训练方法,所述方法包括:
获取用户输入关键词及真值关键词,其中,所述用户输入关键词为用户在输入框中最终输入的关键词,所述真值关键词为用户触发搜索时所使用的关键词;
将所述用户输入关键词作为排序模型的输入,将所述真值关键词作为所述用户输入关键词的真值标定,得到所述排序模型的目标样本数据;
判断目标关键词输入完成前的上一词形态的召回结果中是否存在所述真值关键词,其中,初始的目标关键词为所述用户输入关键词;
若存在,则将目标关键词输入完成前的上一词形态作为所述排序模型的输入,将所述真值关键词作为目标关键词输入完成前的上一词形态的真值标定,得到所述排序模型的目标样本数据;
将目标关键词更新为目标关键词输入完成前的上一词形态,返回执行步骤:判断目标关键词输入完成前的上一词形态的召回结果中是否存在所述真值关键词;
若不存在,结束本次目标样本数据的添加;
利用所述目标样本数据对排序模型进行训练。
在一种可能的实施方式中,所述若存在,则将目标关键词输入完成前的上一词形态作为所述排序模型的输入,将所述真值关键词作为目标关键词输入完成前的上一词形态的真值标定,得到所述排序模型的目标样本数据,包括:
若存在,则按照预设概率值将目标关键词输入完成前的上一词形态作为所述排序模型的输入,将所述真值关键词作为目标关键词输入完成前的上一词形态的真值标定,得到所述排序模型的目标样本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱奇艺科技有限公司,未经北京爱奇艺科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111436721.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种飞灰输送系统
- 下一篇:一种基于单路口多传感器的航迹融合方法及系统