[发明专利]社交媒体流量的水分流量处理方法、系统及设备有效
申请号: | 201910567614.0 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110287322B | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 孔晓晴;李百川;蔡锐涛 | 申请(专利权)人: | 有米科技股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/958;G06F17/18;G06Q50/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 古利兰 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 媒体 流量 水分 处理 方法 系统 设备 | ||
本发明提供一种社交媒体流量的水分流量处理方法、系统及设备,该方法为:获取多个待分析博主的账号信息和在预设周期内发布的每条内容对应的流量数据。基于待分析博主的账号信息,对待分析博主进行分类,得到多组博主列表。针对每一博主列表,对博主列表中的所有内容进行正态性检验,确定博主列表中的所有内容是否符合正态分布。根据检验结果,对博主列表中的所有内容进行一元离群点检测或异常检测,得到每条内容的流量数据中的水分流量。根据每一博主列表中每条内容的水分流量,计算每一博主列表中每个待分析博主的水分流量。本方案中,通过博主的内容和内容的流量数据评估博主的水分流量,获取博主相关信息的难度低、评估成本低和准确性高。
技术领域
本发明涉及数据处理技术领域,具体涉及一种社交媒体流量的水分流量处理方法、系统及设备。
背景技术
随着互联网的发展,社交媒体软件逐渐成为人们日常生活中重要的组成部分。用户在社交媒体软件上发布各式各类的内容,以供其他用户进行浏览,因此信息通过社交媒体软件可以得到快速的传播和推广。
在社交媒体软件中,一些用户为了增加自身的影响力或者为了实现某种目的,会雇佣俗称“网络水军”的用户来发表和传播大量特定的消息,以达到增加转发量和评论量等目的。但是,绝大部分网络水军通常为机器人账号,在转发和传播信息时,接收到该信息的真实用户量较少,信息传播质量低下以及无法准确判断用户的真实影响力。因此需要评估用户的粉丝中网络水军的占比数量,从而评估用户的网络流量中的水分流量。
目前评估用户的粉丝中网络水军的占比数量的方式为:预先设置多种水军特征,获取用户的粉丝和评论者的详细信息,若该用户的粉丝或评论者的信息符合多种水军特征中预设数量的水军特征,则说明该粉丝或评论者为网络水军。但是,第一方面,制造水军的策略在不断发生变化,需要人为不断更新预设的水军特征才能保证评估水军的准确性,更新成本较高。第二方面,在评估水军时,需要获取用户的全部粉丝和评论者的详细信息,获取难度较大。第三方面,有些真实用户的日常行为有可能符合多项水军特征,因此容易将真实用户误判为水军,评估水军的准确性较低。
发明内容
有鉴于此,本发明实施例提供一种社交媒体流量的水分流量处理方法、系统及设备,以解决目前评估水军的方法存在的更新水军特征成本较高、获取粉丝和评论者详细信息的难度较大和评估准确性低等问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开了一种社交媒体流量的水分流量处理方法,所述方法包括:
获取多个待分析博主的账号信息;
获取每个所述待分析博主在预设周期内发布的每条内容对应的流量数据,其中,所述流量数据至少包括:每条内容的点击数和获取所述点击数时所述待分析博主的粉丝数,所述点击数包括转发数或播放量;
基于每个所述待分析博主的账号信息,对所述多个待分析博主进行分类,得到多组博主列表,其中,一组博主列表对应一类别博主;
针对每一组所述博主列表,对所述博主列表中所有待分析博主的所有内容进行正态性检验,确定所述博主列表中的所有内容是否符合正态分布;
若所述博主列表中的所有内容符合正态分布,对所述博主列表中的所有内容进行一元离群点检测,得到每条内容的流量数据中的水分流量;
若所述博主列表中的所有内容不符合正态分布,对所述博主列表中的所有内容进行异常检测,得到每条内容的流量数据中的水分流量;
根据每一组所述博主列表中每条内容的水分流量,计算得到每一组所述博主列表中每个待分析博主的水分流量。
优选的,所述获取多个待分析博主的账号信息,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于有米科技股份有限公司,未经有米科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910567614.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于改进特征选择的电力文本分类方法
- 下一篇:一种面向目标的情感分类方法