[发明专利]社区推荐及模型训练方法、装置、电子设备及存储介质有效
申请号: | 202010073190.5 | 申请日: | 2020-01-22 |
公开(公告)号: | CN111274497B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 陈亮辉;杨晓璇;付琰;彭炼钢 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社区 推荐 模型 训练 方法 装置 电子设备 存储 介质 | ||
本申请公开了社区推荐及模型训练方法、装置、电子设备及存储介质,涉及人工智能技术领域。具体实现方案为:采集用户的标识和所述用户的社区关注列表中的各社区的标识,作为用户数据;利用预先训练好的特征预测模型和所述用户数据,生成所述用户的特征表达;基于所述用户的特征表达和预先生成的社区列表的社区特征表达库,从所述社区列表中获取与所述用户的特征表达相似度最大的N个社区的标识;向所述用户推荐所述N个社区的标识。本申请能够准确地向用户推荐N个社区,有效地提高社区推荐的准确性。
技术领域
本申请涉及计算机技术领域,尤其涉及人工智能,具体涉及社区推荐及模型训练方法、装置、电子设备及存储介质。
背景技术
互联网发展到今天,社区类产品广泛性使用,每天占据用户较高的时长。且互联网用户基数巨大,各种兴趣社区层出不穷,随着时间演进,不断涌现出越来越多的社区。用户可以从社区中获取大量的信息。但是由于社区较多,导致用户无法筛选出自己最感兴趣的社区。基于此,现有的推荐方案可以帮助用户从大量的社区中找到用户真正感兴趣的社区。
例如,现有的社区推荐方式可以采用排行榜单的方式。具体地,基于网站或者应用内的用户行为数据进行统计,在全局用户数据下选择最近一段时间窗口内比较热门、互动较强的社区进行推荐。
但是现有的上述推荐方式推荐的社区并非用户真正想要关注的社区,导致社区推荐的准确性较差。
发明内容
为了解决上述技术问题,本申请提供一种社区推荐及模型训练方法、装置、电子设备及存储介质,用于提高社区推荐的准确性。
一方面,本申请提供一种社区推荐方法,包括:
采集用户的标识和所述用户的社区关注列表中的各社区的标识,作为用户数据;
利用预先训练好的特征预测模型和所述用户数据,生成所述用户的特征表达;
基于所述用户的特征表达和预先生成的社区列表的社区特征表达库,从所述社区列表中获取与所述用户的特征表达相似度最大的N个社区的标识;
向所述用户推荐所述N个社区的标识。
进一步可选地,如上所述的方法中,基于所述用户的特征表达和预先生成的社区列表的社区特征表达库,从所述社区列表中获取与所述用户的特征表达相似度最大的N个社区的标识,包括:
从所述社区列表的社区特征表达库中获取与所述用户的特征表达相似度最大的N个社区的特征表达;
从所述社区列表中获取所述N个社区的特征表达对应的标识。
进一步可选地,如上所述的方法中,基于所述用户的特征表达和预先生成的社区列表的社区特征表达库,从所述社区列表中获取与所述用户的特征表达相似度最大的N个社区的标识之前,所述方法包括:
采用预先训练好的特征表达模型,基于所述社区列表中各所述社区的标识,生成对应的社区特征表达;
基于所述社区列表中各所述社区的社区特征表达,构建所述社区特征表达库。
另一方面,本申请还提供了一种特征预测模型的训练方法,包括:
采集数条训练数据,各所述训练数据中包括训练用户的标识和所述训练用户的社区关注子列表中的各社区标识;
对于各所述训练数据,从所述社区关注子列表选择一个社区标识,作为标注数据;将所述训练用户的标识和所述社区关注子列表中其余的社区标识,作为输入数据;
采用各所述训练数据中的所述输入数据和所述标注数据,对特征预测模型进行训练。
进一步可选地,如上所述的方法中,采集数条训练数据,包括:
挖掘各所述训练用户的标识和社区关注列表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010073190.5/2.html,转载请声明来源钻瓜专利网。