[发明专利]一种面向动态环境的自适应在线排序方法和系统在审
申请号: | 202210337150.6 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114861093A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 张利军;程权;卢世银 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/9538 | 分类号: | G06F16/9538;G06F16/9535;G06Q30/06;G06N5/02 |
代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李玉平 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 动态 环境 自适应 在线 排序 方法 系统 | ||
1.一种面向动态环境的自适应在线排序方法,其特征在于,用于信息检索场景,首先,确定排序模型,设置相关参数;接着,使用一个自适应方法更新排序模型的参数,利用更新后的排序模型对查询结果进行排序;其中,自适应方法包含一个元方法和多个专家方法;每个专家方法针对一种可能的用户偏好,被配置不同的探索步长参数,用梯度下降的方式更新专家方法的参数;元方法接收所有的专家方法的参数结果,对每个专家方法分别配置不同的权重;然后将每个专家方法的参数结果进行加权求和构成当前排序模型的参数,接着计算探索排序模型参数,根据当前排序模型和探索排序模型二者参数的比较结果来更新排序模型的参数,用更新后的排序模型对查询结果进行排序;最后,更新每个专家方法的权重。
2.根据权利要求1所述的面向动态环境的自适应在线排序方法,其特征在于,所述元方法的具体步骤为:
步骤101,设置步长参数α;所述步长用于更新每个专家方法的权重;
步骤102,设置元方法运行回合数T;
步骤103,设置专家方法个数N;
步骤104,设置探索步长参数δ;
步骤105,设置每个专家方法的利用步长参数γ1,…,γN;
步骤106,初始化第一个回合中每个专家方法的权重
步骤107,在第t回合,t=1,2,…,T执行以下步骤:
步骤108,接收第i个专家方法的输出i=1,…,N;
步骤109,计算当前排序模型参数为第t回合中第i个专家方法的权重;
步骤110,从单位球中均匀采样向量ut作为探索方向;
步骤111,创建一个探索排序模型,其参数为
步骤112,比较参数w′t和wt的优劣,根据比较结果更新排序模型的参数;
步骤113,用更新后的排序模型对查询结果进行排序;
步骤114,构造替代损失函数lt(w);
步骤115,更新每个专家方法的权重
步骤116,将和ut发送给每个专家方法。
3.根据权利要求1所述的面向动态环境的自适应在线排序方法,其特征在于,所述每个专家方法的具体步骤为:
步骤200,初始化其中指第i个专家方法在第一个回合的参数;
步骤201,在第t回合,t=1,2,…,T执行以下步骤:
步骤202,将发送给元方法;
步骤203,从元方法接收和ut;
步骤204,更新输出
4.根据权利要求2所述的面向动态环境的自适应在线排序方法,其特征在于,所述步骤101中步长参数α的设置方式为所述步骤103中专家方法个数所述步骤104中探索步长参数其中d是参数决策集的维度;所述步骤105中每个专家方法的利用步长参数其中R是参数决策集的上界;
5.根据权利要求2所述的面向动态环境的自适应在线排序方法,其特征在于,所述步骤112中的投影操作符ΠW[·]的具体定义为
所述步骤113中对参数w′t和wt对应的排序结果进行交叉展示,通过用户对排序结果的反馈来比较参数w′t和wt的优劣;
所述步骤114中构造的替代损失函数lt(w)的具体定义为
所述步骤116中为指示函数,w′t>wt表示参数w′t优于wt。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210337150.6/1.html,转载请声明来源钻瓜专利网。