[发明专利]信息召回、信息聚类方法、装置及设备在审

申请号：	201910044328.6	申请日：	2019-01-17
公开（公告）号：	CN109740063A	公开（公告）日：	2019-05-10
发明（设计）人：	马国伟	申请（专利权）人：	北京奇艺世纪科技有限公司
主分类号：	G06F16/9535	分类号：	G06F16/9535
代理公司：	北京柏杉松知识产权代理事务所(普通合伙) 11413	代理人：	李欣;马敬
地址：	100080 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	类簇聚类信息装置及设备历史信息信息聚类预设信息获得用户点击用户需要聚类应用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种信息召回、信息聚类方法、装置及设备，该方法包括：确定需要进行信息召回的用户点击过的历史信息；针对每一已有信息类簇，将该已有信息类簇包含的信息与所确定的历史信息进行比较，确定该已有信息类簇包含的信息中具有相同信息的个数，其中，已有信息类簇为：根据每一待聚类信息的特征对待聚类信息进行聚类得到的信息类簇，每一待聚类信息的特征为：根据点击过该待聚类信息的用户的信息获得的特征；在已有信息类簇中选取第一预设数量个信息类簇；将第一预设数量个已有信息类簇中包含的信息作为针对用户需要召回的信息。应用本发明实施例提供的方案召回信息时，能够提高信息召回的效率。

技术领域

本发明涉及计算机技术领域，特别是涉及信息召回、信息聚类方法、装置及设备。

背景技术

信息召回是指针对某一个用户获取该用户可能感兴趣的信息的过程。

信息召回过程中，为了有效获取用户可能感兴趣的信息，通常会收集用户的性别、年龄、职业、爱好等基本信息，根据用户的基本信息，通过遍历信息库中存储的信息的方式，筛选出用户可能感兴趣的信息，进而实现信息召回。

然而，发明人在实现本发明的过程中发现，现有技术至少存在如下问题：

由于信息库中所存储信息的信息量一般非常大，且遍历并筛选信息的效率又较低，因此，应用上述方式确定用户可能感兴趣信息的效率较低，进而易导致信息召回的效率低。

发明内容

本发明实施例的目的在于提供一种信息召回、信息聚类方法、装置及设备，以实现提高信息召回的效率。具体技术方案如下：

本发明实施的一方面，提供了一种信息召回方法，所述方法包括：

确定需要进行信息召回的用户点击过的历史信息；

针对每一已有信息类簇，将该已有信息类簇包含的信息与所确定的历史信息进行比较，确定该已有信息类簇包含的信息中具有相同信息的个数，其中，所述已有信息类簇为：根据每一待聚类信息的特征对待聚类信息进行聚类得到的信息类簇，所述每一待聚类信息的特征为：根据点击过该待聚类信息的用户的信息获得的特征；