[发明专利]媒体文件的处理方法、装置及电子设备在审
申请号: | 202010432702.2 | 申请日: | 2020-05-20 |
公开(公告)号: | CN113297464A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 周银达;王炜;许艳;王兴勇 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 南海燕 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 媒体文件 处理 方法 装置 电子设备 | ||
本申请实施例公开了媒体文件的处理方法、装置及电子设备,所述方法包括:收集已发布媒体文件关联的主题词,并生成主题词库;根据目标推荐维度,保存并更新所述主题词库中的主题词与所述目标推荐维度相关的属性信息;根据已发布媒体文件关联的主题词与所述目标推荐维度相关的属性信息,确定所述已发布媒体文件在所述目标推荐维度上的属性信息;根据所述已发布媒体文件在所述目标推荐维度上的属性信息,向客户端提供已发布媒体文件列表。通过本申请实施例,能够实现更简单有效的信息推荐。
技术领域
本申请涉及媒体文件信息处理技术领域,特别是涉及媒体文件的处理方法、装置及电子设备。
背景技术
在一些新闻类的应用中,其主要功能是向用户推送一些新闻类的媒体文件信息,主要形式可以包括文章、视频等等。而具体如何进行媒体文件信息的推荐,也即针对具体用户,如何在海量媒体信息中进行筛选或者排序,以使得推送的信息更能够引起用户的阅读兴趣,通常是很具关键性的问题,会影响到用户的驻留时间等系统指标。
现有技术中比较流行的推送方案是WideDeep模型方案,其核心思想是结合线性模型的记忆能力和DNN(Deep Neural Networks,深度神经网络)模型的泛化能力,在训练过程中同时优化两个模型的参数,从而优化整体模型的预测能力。其中,记忆能力即从历史数据中发现对象或者特征之间的相关性。泛化能力即相关性的传递,发现在历史数据中很少或者没有出现的新的特征组合。
这种方案虽然效果显著,但是存在模型复杂度高,工程特征极其繁琐,工程部署难度大等问题。此外,在实现的应用场景中,可能会很难获得和捕捉一些用户的属性、行为、习惯等数据,尤其是在推荐的初期阶段,存在用户数据稀疏等问题,使得WideDeep模型很难起作用。
因此,如何实现更简单有效的信息推荐,成为需要本领域技术人员解决的技术问题。
发明内容
本申请提供了媒体文件的处理方法、装置及电子设备,能够实现更简单有效的信息推荐。
本申请提供了如下方案:
一种媒体文件的处理方法,包括:
收集已发布媒体文件关联的主题词,并生成主题词库;
根据目标推荐维度,保存并更新所述主题词库中的主题词与所述目标推荐维度相关的属性信息;
根据已发布媒体文件关联的主题词与所述目标推荐维度相关的属性信息,确定所述已发布媒体文件在所述目标推荐维度上的属性信息;
根据所述已发布媒体文件在所述目标推荐维度上的属性信息,向客户端提供已发布媒体文件列表。
一种媒体文件的处理方法,包括:
获取媒体文件列表信息,所述媒体文件列表信息是根据已发布媒体文件在目标推荐维度上的属性信息生成的,所述已发布媒体文件在目标推荐维度上的属性信息是根据所述已发布媒体文件关联的主题词与所述目标推荐维度相关的属性信息确定的;
对所述媒体文件列表信息进行展示。
一种媒体文件的处理方法,包括:
收集已发布媒体文件,保存并更新所述已发布媒体文件的时间属性信息,其中,所述已发布媒体文件在被发布时赋予初始的时间属性值,并按照时间推移而降低;
收集所述已发布媒体文件关联的主题词,保存并更新所述主题词的时间属性信息,其中,所述主题词在首次出现时被赋予初始的时间属性值,并按照时间推移而降低;
根据已发布媒体文件的当前时间属性值,以及所述媒体文件对应的至少一个主题词的当前时间属性值,确定所述媒体文件在时间维度上的属性信息;
根据所述在时间维度上的属性信息向客户端提供媒体文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010432702.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种鞋垫袜
- 下一篇:行程管理方法、机器人和平台