[发明专利]多媒体资源排序方法、装置、电子设备及存储介质在审
申请号: | 202010850843.6 | 申请日: | 2020-08-21 |
公开(公告)号: | CN112000822A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 张志伟;林靖;张水发 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/435 | 分类号: | G06F16/435;G06F16/438;G06F40/289;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 仝丽 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体 资源 排序 方法 装置 电子设备 存储 介质 | ||
本公开关于一种多媒体资源排序方法、装置、电子设备及存储介质,通过根据多媒体资源的多媒体特征对搜索词对应的文本特征进行加权处理,得到包含有注意力分布信息的加权文本特征;并将搜索词的加权文本特征与多媒体资源的多媒体特征进行融合,得到特征表达能力提升的融合特征;将融合特征输入至点击概率预估模型,输出多媒体资源的点击概率估计值。由于融合特征不仅包含有多媒体资源的注意力分布信息,还增大了文本特征与多媒体特征之间的紧密联系,从而通过点击概率预估模型对融合特征进行预测时,可以对用户的点击行为进行准确预估,进而根据点击概率预估模型输出的点击概率估计值进行多媒体资源的排序,提升搜索多媒体资源的准确性。
技术领域
本公开涉及计算机技术领域,尤其涉及一种多媒体资源排序方法、装置、电子设备及存储介质。
背景技术
随着机器学习领域的发展,深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。由于其超强的拟合能力以及端到端的全局优化能力,使得深度学习在多媒体资源的内容理解方面大放异彩。
相关技术中,在搜索一些音频、视频类的多媒体资源时,服务器根据终端的搜索请求查找对应的多媒体资源,并对查找到的多媒体资源进行点击概率的预估,按照预估的点击概率对多媒体资源进行排序,将排序后的多媒体资源返回至终端。
然而,目前的搜索方法存在不能对用户的点击行为进行准确预估的技术问题。
发明内容
本公开提供一种多媒体资源排序方法、装置、电子设备及存储介质,以至少解决相关技术中不能准确预估点击概率的技术的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种多媒体资源排序方法,包括
获取搜索词对应的文本特征和多个多媒体资源的多媒体特征;
基于注意力机制,根据各所述多媒体资源的多媒体特征对所述搜索词对应的文本特征进行加权处理,得到所述搜索词的加权文本特征;
将所述搜索词的加权文本特征与各所述多媒体资源的多媒体特征分别进行融合,得到各所述多媒体资源对应的融合特征;
将各所述融合特征输入至点击概率预估模型,通过所述点击概率预估模型对所述融合特征进行卷积处理,得到各所述多媒体资源的点击概率估计值;
根据各所述多媒体资源的点击概率估计值,对各所述多媒体资源进行排序。
在其中一个实施例中,所述搜索词对应有词组合,所述词组合包括多个词语;所述获取搜索词对应的文本特征和多媒体资源的多媒体特征,包括:
获取各所述词语的标识和各所述多媒体资源的标识;
对各所述词语的标识分别进行嵌入处理,得到各所述词语的文本特征,并通过各所述词语的文本特征,得到所述搜索词对应的文本特征;
对所述多媒体资源的标识进行嵌入处理,得到各所述多媒体资源的多媒体特征。
在其中一个实施例中,所述搜索词对应的词组合的生成方式,包括:
获取搜索请求,所述搜索请求携带有搜索词;
对所述搜索词进行分词处理,得到所述搜索词对应的词组合。
在其中一个实施例中,所述基于注意力机制,根据各所述多媒体资源的多媒体特征对所述搜索词对应的文本特征进行加权处理,得到所述搜索词的加权文本特征,包括:
对各所述多媒体资源的多媒体特征进行注意力分配处理,得到各所述多媒体特征对应的注意力权重;
根据各所述多媒体特征对应的注意力权重对所述搜索词对应的文本特征进行加权处理,得到所述搜索词的加权文本特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010850843.6/2.html,转载请声明来源钻瓜专利网。