[发明专利]多媒体资源排序方法、装置、电子设备及存储介质在审
申请号: | 202010850843.6 | 申请日: | 2020-08-21 |
公开(公告)号: | CN112000822A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 张志伟;林靖;张水发 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/435 | 分类号: | G06F16/435;G06F16/438;G06F40/289;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 仝丽 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体 资源 排序 方法 装置 电子设备 存储 介质 | ||
1.一种多媒体资源排序方法,其特征在于,包括:
获取搜索词对应的文本特征和多个多媒体资源的多媒体特征,;
基于注意力机制,根据各所述多媒体资源的多媒体特征对所述搜索词对应的文本特征进行加权处理,得到所述搜索词的加权文本特征;
将所述搜索词的加权文本特征与各所述多媒体资源的多媒体特征分别进行融合,得到各所述多媒体资源对应的融合特征;
将各所述融合特征输入至点击概率预估模型,通过所述点击概率预估模型对各所述融合特征进行卷积处理,得到各所述多媒体资源的点击概率估计值;
根据各所述多媒体资源的点击概率估计值,对各所述多媒体资源进行排序。
2.根据权利要求1所述的多媒体资源排序方法,其特征在于,所述搜索词对应有词组合,所述词组合包括多个词语;所述获取搜索词对应的文本特征和多个多媒体资源的多媒体特征,包括:
获取各所述词语的标识和各所述多媒体资源的标识;
对各所述词语的标识分别进行嵌入处理,得到各所述词语的文本特征,并通过各所述词语的文本特征,得到所述搜索词对应的文本特征;
对各所述多媒体资源的标识进行嵌入处理,得到各所述多媒体资源的多媒体特征。
3.根据权利要求2所述的多媒体资源排序方法,其特征在于,所述搜索词对应的词组合的生成方式,包括:
获取搜索请求,所述搜索请求携带有搜索词;
对所述搜索词进行分词处理,得到所述搜索词对应的词组合。
4.根据权利要求1所述的多媒体资源排序方法,其特征在于,所述基于注意力机制,根据各所述多媒体资源的多媒体特征对所述搜索词对应的文本特征进行加权处理,得到所述搜索词的加权文本特征,包括:
对各所述多媒体资源的多媒体特征进行注意力分配处理,得到各所述多媒体特征对应的注意力权重;
根据各所述多媒体特征对应的注意力权重对所述搜索词对应的文本特征进行加权处理,得到所述搜索词的加权文本特征。
5.根据权利要求4所述的多媒体资源排序方法,其特征在于,在所述对各所述多媒体资源的多媒体特征进行注意力分配处理之前,所述方法还包括:
对任一多媒体资源的多媒体特征,根据所述搜索词对应的文本特征的维数,对所述多媒体资源的多媒体特征进行维数变化处理,得到与所述搜索词对应的文本特征维数相同的多媒体特征。
6.根据权利要求5所述的多媒体资源排序方法,其特征在于,所述对各所述多媒体资源的多媒体特征进行注意力分配处理,得到各所述多媒体特征对应的注意力权重,包括:
对任一多媒体资源的多媒体特征,对维数变化后的多媒体特征进行归一化处理,得到所述多媒体特征对应的注意力权重。
7.根据权利要求1至6任一项所述的多媒体资源排序方法,其特征在于,所述点击概率预估模型的生成方式,包括:
获取若干条历史搜索日志,各所述历史搜索日志包括历史搜索词、所述历史搜索词对应的多媒体资源、所述多媒体资源对应的实际触发行为;
对各所述历史搜索词进行分词处理,得到各所述历史搜索词对应的词组合;
根据各所述历史搜索词对应的词组合、各所述历史搜索词对应的多媒体资源、各所述多媒体资源对应的实际触发行为,构建训练样本集;每个训练样本包括一个所述历史搜索词对应的一个词组合、一个所述多媒体资源和所述多媒体资源对应的一个实际触发行为;
根据所述训练样本集对初始的点击概率预估模型进行迭代训练,直至满足收敛条件时停止训练,得到所述点击概率预估模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010850843.6/1.html,转载请声明来源钻瓜专利网。