[发明专利]一种基于社交媒体平台数据的用户年龄标注方法在审
申请号: | 201911003529.8 | 申请日: | 2019-10-22 |
公开(公告)号: | CN110827064A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 唐亮;曹特磊 | 申请(专利权)人: | 时趣互动(北京)科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/2457 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100124 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社交 媒体 平台 数据 用户 年龄 标注 方法 | ||
本发明提供了一种基于社交媒体平台数据的用户年龄标注方法,包括:步骤1,基于积累的KOL的粉丝列表和互动信息,获取用户所关注的KOL列表;步骤2,基于每个年龄段的有代表性的KOL列表,得到KOL列表对各个年龄段的代表性数据;步骤3,基于用户所关注的KOL列表及KOL列表对各个年龄段的代表性数据,得到没有年龄数据的用户的年龄信息。本发明采用从“特征用户”入手的方法,一方面避开了获取每个普通用户的历史行为数据的难题,又通过“特征用户”所独有的“重要性”提高了年龄推断的准确度。
技术领域
本发明属于互联网社交舆情的数据洞察技术领域,具体涉及一种基于社交媒体平台数据的用户年龄标注方法。
背景技术
各类互联网社交平台,是当前重要的营销推广和数据洞察的渠道和数据源。这些平台包括微博、微信,行业论坛(如汽车之家等),社交电商(如小红书等),普通论坛(如知乎、豆瓣等);而且,有更多的互联网产品也都在向社交化演进,以此来提高用户粘性和更方便的进行目标人群的商业营销。用户的年龄分布情况,做为重要的人群画像维度,又是广告主非常关注的舆情数据项。广告主要根据不同年龄段用户对产品的使用体验,来做出有针对性的营销推广方案,来扩大产品用户的覆盖度。
传统的方法在对每个用户的年龄进行推测的时候,是根据当前用户的历史行为特征进行推断。包括该用户的历史发文、评价、关注,以及收藏和购买等。这需要收集针对每个用户的历史信息,而且每个成熟的社交平台动辄就会有上亿的用户规模,作为服务广告主的第三方营销数据服务公司来说,难以获取如此规模的用户信息来做出合理的用户年龄的推断。
发明内容
本发明的目的是提供一种基于社交媒体平台数据的用户年龄标注方法,采用从“特征用户”入手的方法,一方面避开了获取每个普通用户的历史行为数据的难题,又通过“特征用户”所独有的“重要性”提高了年龄推断的准确度。
本发明提供了一种基于社交媒体平台数据的用户年龄标注方法,包括:
步骤1,基于积累的KOL的粉丝列表和互动信息,获取用户所关注的KOL列表;
步骤2,基于每个年龄段的有代表性的KOL列表,得到KOL列表对各个年龄段的代表性数据;
步骤3,基于用户所关注的KOL列表及KOL列表对各个年龄段的代表性数据,得到没有年龄数据的用户的年龄信息。
进一步地,所述步骤1包括:
基于爬虫技术,获取社交平台上普通用户的基础信息;所述基础信息包括粉丝量;
将达到预设粉丝量的用户,添加到所述社交平台的KOL库,并定期抓取和更新其新增的粉丝列表,以及普通用户对其的互动数据。
进一步地,所述步骤2包括:
针对已知年龄的普通用户,基于步骤1中获取的用户所关注的KOL列表,提取出各个年龄段相对于其它年龄段的具有代表性的KOL列表。
与现有技术相比本发明的有益效果是:
采用从“特征用户”入手的方法,一方面避开了获取每个普通用户的历史行为数据的难题,又通过“特征用户”所独有的“重要性”提高了年龄推断的准确度。
附图说明
图1是本发明一种基于社交媒体平台数据的用户年龄标注方法的流程图;
图2为本发明KOL历史数据的抓取和积累的流程图;
图3为本发明提取每个年龄段的有代表性的KOL列表的流程图;
图4为本发明对没有年龄信息的用户进行年龄标注的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于时趣互动(北京)科技有限公司,未经时趣互动(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911003529.8/2.html,转载请声明来源钻瓜专利网。