[发明专利]一种语音包推荐方法、装置、设备及存储介质有效
申请号: | 202010463433.6 | 申请日: | 2020-05-27 |
公开(公告)号: | CN113746875B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 黄际洲;丁世强;吴迪 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | H04L67/55 | 分类号: | H04L67/55;H04L67/06;G06N3/08 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 推荐 方法 装置 设备 存储 介质 | ||
本申请公开了一种语音包推荐方法、装置、设备及存储介质,涉及智能搜索技术。具体实现方案为:根据视频推荐场景下的第一样本用户的第一用户行为数据和第一用户行为数据关联的第一视频数据,构建第一视频训练样本;根据第一样本用户的样本搜索数据和对第一样本语音包的历史交互数据,构建用户训练样本;根据第一视频训练样本和用户训练样本,对神经网络模型进行预训练;采用第二样本语音包关联的样本视频和样本标注数据,对预训练好的神经网络模型进行再训练,得到语音包推荐模型。本申请实施例能够实现在冷启动情况下,进行神经网络模型的训练,从而使得神经网络模型具备了冷启动情况下的语音包自动推荐能力。
技术领域
本申请涉及数据处理技术领域,尤其涉及智能搜索技术。
背景技术
在包含语音播报功能的应用程序中,通常设置有多种语音包供用户选 择使用。为了提高语音包选取效率以及用户操作便捷度,通常会采用个性 化推荐的方式,向用户推荐感兴趣的语音包。
然而,个性化推荐严重依赖于用户的历史行为数据。当应用程序开发 前期没有注册用户或注册用户行为较少时,根本无法提供足够多的行为数 据来针对用户进行个性化推荐。
发明内容
本申请实施例提供了一种冷启动情况下,实现语音包自动推荐的一种 语音包推荐方法、装置、设备及存储介质。
根据本申请的一方面,提供了一种语音包推荐方法,包括:
根据视频推荐场景下的第一样本用户的第一用户行为数据和所述第 一用户行为数据关联的第一视频数据,构建第一视频训练样本;
根据所述第一样本用户的样本搜索数据和对第一样本语音包的历史 交互数据,构建用户训练样本;
根据所述第一视频训练样本和所述用户训练样本,对神经网络模型进 行预训练;
采用第二样本语音包关联的样本视频和样本标注数据,对预训练好的 神经网络模型进行再训练,得到语音包推荐模型。
根据本申请的另一方面,提供了另一种语音包推荐装置,包括:
第一视频训练样本构建模块,用于根据视频推荐场景下的第一样本用 户的第一用户行为数据和所述第一用户行为数据关联的第一视频数据,构 建第一视频训练样本;
用户训练样本构建模块,用于根据所述第一样本用户的样本搜索数据 和对第一样本语音包的历史交互数据,构建用户训练样本;
预训练模块,用于根据所述第一视频训练样本和所述用户训练样本, 对神经网络模型进行预训练;
再训练模块,用于采用第二样本语音包关联的样本视频和样本标注数 据,对预训练好的神经网络模型进行再训练,得到语音包推荐模型。
根据本申请的又一方面,提供了又一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被 所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任一 实施例提供的一种语音包推荐方法。
根据本申请的在一方面,提供了再一种存储有计算机指令的非瞬时计 算机可读存储介质,所述计算机指令用于使所述计算机执行本申请任一实 施例提供的一种语音包推荐方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010463433.6/2.html,转载请声明来源钻瓜专利网。