[发明专利]兴趣标签确定方法和装置有效
申请号: | 201710074401.5 | 申请日: | 2017-02-10 |
公开(公告)号: | CN108335165B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 孔行;叶浩 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;H04L12/18 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平;邓云鹏 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 兴趣 标签 确定 方法 装置 | ||
本发明提供一种兴趣标签确定方法和装置,该方法包括:获取群组标识和对应的群组名称,获取与群组标识对应的各用户标识及各用户标识的第一用户内容;第一用户内容包括对与用户标识对应的所有群组标识的群组名称进行拼接获得的内容,对与群组标识对应的所有用户标识的第一用户内容进行拼接,获得群组标识的第一群组内容,根据预先训练确定的主题标识和主题‑词语分布结果,计算第一群组内容在各主题标识下的概率,根据第一群组内容在各主题标识下的概率、根据预先训练确定的主题标识与兴趣标签之间的关联关系,确定群组标识的兴趣标签。基于群组的兴趣标签能够为群组的用户精确的进行信息推广。
技术领域
本发明涉及互联网技术领域,特别是涉及一种兴趣标签确定方法和装置。
背景技术
了解用户的兴趣对于信息提供商而言,非常重要。在了解用户的兴趣后,为用户设置兴趣标签,可以向用户精确地提供信息服务。例如,向用户提供推荐的商品信息等。
一些即时通讯工具提供群组功能,在创建群组时随机会为群组分配一个群组ID,不需要创建人选择兴趣、爱好等标签即可创建成功。一些群组的创建者设置了这些标签,而由于标签可以随机设置为数字、人名、地名等不具有实际意义的词,这就导致关于群组的有效信息量少,难以通过群组名称和兴趣爱好标签直接推断群组成员共同的兴趣、爱好,进而无法精确地对用户进行信息推广。
发明内容
基于此,有必要提供一种兴趣标签确定方法和装置,能够确定群组的兴趣标签,进而基于群组的兴趣标签为群组的用户精确的进行信息推广。
为达到上述目的,本发明实施例采用以下技术方案:
一种兴趣标签确定方法,包括:
获取群组标识和对应的群组名称;
获取与所述群组标识对应的各用户标识及各用户标识的第一用户内容;所述第一用户内容包括对与所述用户标识对应的所有群组标识的群组名称进行拼接获得的内容;
对与所述群组标识对应的所有用户标识的第一用户内容进行拼接,获得所述群组标识的第一群组内容;
根据预先训练确定的主题标识和主题-词语分布结果,计算所述第一群组内容在各主题标识下的概率;
根据所述第一群组内容在各主题标识下的概率、根据预先训练确定的主题标识与兴趣标签之间的关联关系,确定所述群组标识的兴趣标签。
一种兴趣标签确定装置,包括:群组获取模块、用户获取模块、群组拼接模块、计算模块和标签确定模块;
所述群组获取模块,用于获取群组标识和对应的群组名称;
所述用户获取模块,用于获取与所述群组标识对应的各用户标识及各用户标识的第一用户内容;所述第一用户内容包括对与所述用户标识对应的所有群组标识的群组名称进行拼接获得的内容;
所述群组拼接模块,用于对与所述群组标识对应的所有用户标识的第一用户内容进行拼接,获得所述群组标识的第一群组内容;
所述计算模块,用于根据预先训练确定的主题标识和主题-词语分布结果,计算所述第一群组内容在各主题标识下的概率;
所述标签确定模块,用于根据所述第一群组内容在各主题标识下的概率、根据预先训练确定的主题标识与兴趣标签之间的关联关系,确定所述群组标识的兴趣标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710074401.5/2.html,转载请声明来源钻瓜专利网。