[发明专利]数据确定方法、装置、电子设备及存储介质有效
| 申请号: | 202111245730.4 | 申请日: | 2021-10-26 |
| 公开(公告)号: | CN113688295B | 公开(公告)日: | 2022-03-25 |
| 发明(设计)人: | 谢淼;姜峰;郭远;解浪 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
| 主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/9038 |
| 代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 黄丽霞 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 确定 方法 装置 电子设备 存储 介质 | ||
本公开关于一种数据确定方法、装置、电子设备及存储介质,其中方法通过获取各排序队列中每个初始搜索结果的转化特征,并根据转化特征确定各排序队列中的候选区间,进而基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果,得到对应的目标搜索结果队列。由于本实施例是基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果,以得到对应的目标搜索结果队列,从而实现通过在线决策的方式来解决集成排序问题,不仅不依赖于候选搜索结果位于原队列的分数,且能够达到较好的效果。
技术领域
本公开涉及数据处理技术领域,尤其涉及一种数据确定方法、装置、电子设备及存储介质。
背景技术
随着数据处理技术的发展,如何从海量候选中,实时地获得与检索目标“最相关”的候选元素是当今在线搜索、推荐和在线广告中的核心技术问题之一。例如:在图像搜索领域,面对给定的一幅查询图像,系统要从庞大的数据库里(比如包含百万、千万甚至上亿图像)快速找出相似的图像;在新闻推荐中,计算机也需要根据用户画像,从大量的新闻中找到最相关的新闻推荐给用户;在广告系统中,则需要根据当前用户请求的上下文,从大量可推荐广告中选择一个最靠谱的广告推荐给用户。
相关技术中,为了解决上述大数据时代海量候选的搜索与排序问题,在线系统常常被分解成召回、粗排、精排、后处理等系统组件与过程阶段。而在每一阶段中,往往设计多个算法或者策略来对候选元素进行排序。例如在召回阶段,可以分别部署冷启动召回策略、标签召回策略、热门元素召回策略、基于候选元素和用户的协同过滤召回策略以及基于GNN(Graph Neural Network,图神经网络)的用户-候选元素关系挖掘的召回策略等,粗排通常也会有多个预测模型对召回选择的几千个候选进行逐一打分,形成以多个打分为依据的多个队列,例如广告竞价分队列、下发率队列等。精排中依据精排模型,对几十最多几百个元素进行打分,可以得到精排分数,按照系统的最终目标,通常还会在精排中部署多个基于精排打分的辅助策略,例如依据流量质量好坏的多个动态调价策略。
目前通常采用基于某个给定的融合函数和在线调参方法,对某一阶段中多个算法或策略分别得到的原队列的候选元素进行融合排序,从而得到该阶段的融合排序结果。然而,由于目前的融合排序方法考虑了候选元素位于原队列的分数,从而难以有效提升排序结果的质量。
发明内容
本公开提供一种数据确定方法、装置、电子设备及存储介质,以至少解决相关技术中的融合排序方法难以有效提升排序结果的质量问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种数据确定方法,包括:
获取各排序队列中每个初始搜索结果的转化特征,所述各排序队列是预先按照不同的业务目标分别对多个初始搜索结果进行排序后得到的与各业务目标一一对应的队列;
根据所述转化特征确定各排序队列中的候选区间,所述候选区间包括至少一个候选搜索结果;
基于决策算法从各候选区间对应的候选搜索结果中确定目标搜索结果,得到对应的目标搜索结果队列。
在其中一个实施例中,所述获取各排序队列中每个初始搜索结果的转化特征,包括:获取各排序队列中每个初始搜索结果的历史日志数据,所述历史日志数据包括所述初始搜索结果的历史转化次数和历史展示次数;根据每个初始搜索结果对应的历史转化次数和历史展示次数,计算得到所述初始搜索结果的转化特征。
在其中一个实施例中,所述根据所述转化特征确定各排序队列中的候选区间,包括:确定所述排序队列中所述转化特征满足设定阈值范围的至少一个候选搜索结果;将所述至少一个候选搜索结果位于所述排序队列的区间确定为对应的候选区间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111245730.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





