[发明专利]用户属性区分方法、装置、设备及计算机可读介质有效
申请号: | 201811278701.6 | 申请日: | 2018-10-30 |
公开(公告)号: | CN111125498B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 周俊;刘康;戴明洋;石逸轩;潘剑飞 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 属性 区分 方法 装置 设备 计算机 可读 介质 | ||
本发明提出一种用户属性区分方法、装置、设备和计算机可读介质,所示方法包括:推送不同类别的资讯至用户;接收用户的资讯点击数据,获取各个类别的重度用户和负反馈用户;所述重度用户为对推送的资讯的点击频次或频率大于设定阈值的用户,所述负反馈用户为对推送的资讯的点击频次或频率小于设定阈值的用户;对每个类别的重度用户和负反馈用户进行差异分析,获取每个类别的重度用户的类别属性。本发明实施例可以有效地分析某个类别特别倾向的用户群体的属性特点,更能突出群体的共性特点,能够区分真正喜欢以及真正不喜欢的人群的差异。
技术领域
本发明涉及互联网技术领域,尤其涉及一种用户属性区分方法及装置、设备和计算机可读介质。
背景技术
目前在进行资讯的推送时,需要确定目标用户,从而提高推送的精度。因此需要对用户的属性进行分析。用户属性涉及用户信息,如姓名、年龄、家庭、婚姻状况、性别、最高教育程度等自然信息,也有产品相关属性,如用户常驻省市、用户等级、用户首次访问渠道来源等。
现有的分析方法是基于用户关于多个类别之间的区分性来表达用户属性区分性,比如阅读“A类别”文章的用户集合X与阅读“非A类别”文章的用户集合Y,通过分析X与Y对应的属性占比的差异来进行区分。
然而,大部分推送场景下,用户所看到的内容并不完全是用户主动选择的,有一定比例的文章是通过探索触发的,用户点击探索对应的文章也有一定随机性,仅通过比较集合X、Y的差异有一定偏差。
发明内容
本发明实施例提供一种用户属性区分方法、装置、设备及计算机可读介质,以解决或缓解现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种用户属性区分方法,包括:
推送不同类别的资讯至用户;
接收用户的资讯点击数据,获取各个类别的重度用户和负反馈用户;所述重度用户为对推送的资讯的点击频次或频率大于设定阈值的用户,所述负反馈用户为对推送的资讯的点击频次或频率小于设定阈值的用户;
对每个类别的重度用户和负反馈用户进行差异分析,获取每个类别的重度用户的类别属性。
在一种实施方式中,所述接收客户端反馈的点击数据,获取各个类别的重度用户和负反馈用户,包括:
统计用户对不同类别资讯的点击频次或频率;
根据统计的点击频次或频率分别提取出重度用户和负反馈用户。
在一种实施方式中,所述对每个类别的重度用户和负反馈用户进行差异分析,获取每个类别的重度用户的类别属性,包括:
分别计算各个类别中重度用户的每个属性的目标群体指数;
获取目标群体指数最高的属性,将该属性作为所属类别的类别属性。
在一种实施方式中,所述分别计算各个类别中重度用户的每个属性的目标群体指数,包括:
分别提取重度用户集合中的每个属性的占比,以及分别提取负反馈用户集合中的每个属性的占比;
计算相同属性的重度用户集合中的占比与负反馈用户集合中的占比的比值,将该比值乘以标准数作为该属性的目标群体指数。
在一种实施方式中,所述资讯类别包括:体育类别、娱乐类别、新闻类别、教育类别、财经类别中的一种或多种;所述类别属性包括:性别属性、年龄属性、职业属性中的一种或多种。
第二方面,本发明实施例提供一种用户属性区分装置,包括:
推送模块,用于推送不同类别的资讯至用户;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811278701.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体器件及其制作方法
- 下一篇:一种全数字低压低功耗钟控电压比较器