[发明专利]项目声量排序方法、装置、电子设备、存储介质有效
申请号: | 201810787720.5 | 申请日: | 2018-07-17 |
公开(公告)号: | CN108875084B | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 张茂洪 | 申请(专利权)人: | 上海精数信息科技有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955;G06F16/26;H04L12/24 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 臧云霄;潘一诺 |
地址: | 200333 上海市普*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 项目 排序 方法 装置 电子设备 存储 介质 | ||
本发明提供一种同源样本的项目声量排序方法、装置、电子设备、存储介质。方法包括:获取一段时间内多个路由器的行为日志数据;根据所述行为日志数据筛选路由器和行为日志数据;对各行为日志数据设置项目标注;对各行为日志数据设置设备标识;至少根据项目ID对关联同一设备的行为日志数据进行聚合计数作为该设备对该项目ID的准项目声量;判断各设备对各项目ID的准项目声量是否大于所述项目声量阈值;若是,则使该设备对该项目ID的项目声量为项目声量阈值;若否,则使该设备对该项目ID的项目声量为准项目声量;对各项目ID,按项目声量对各设备进行排序,并以图形化显示排序结果。本发明提供的方法及设备实现跨终端类型建立同源样本。
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种项目声量排序方法、装置、电子设备、存储介质。
背景技术
传统的用户研究一直存在几个不足:
一方面,传统研究采用主动调研问卷的方式,样本招募、留存、维护困难,并且受访样本受当时主观感受或记忆的影响,调研结果有一定的偏差。
另一方面,样本行为触点的覆盖有限,跨平台同源打通困难。在早期互联网环境中设备单一,主要集中在电脑端时是可行的,但是当前移动互联网、智能家居、互联网电视等设备越来越普及的情况下,用户的行为习惯被不同的设备终端所分拆,用户在不同的终端上出现不同的行为特征,旧的基于一台终端设备代表一个研究对象的分析方法明显不再适用于当前的环境。
基于传统用户研究的不足,目前急需一种可以客观分析用户行为、跨终端类型建立同源样本并且可以持续观测样本行为特征的样本库项目来满足在当前环境下的用户研究需求。
发明内容
本发明为了克服上述现有技术存在的缺陷,提供一种同源样本的项目声量排序方法、装置、电子设备、存储介质,以客观分析用户行为、跨终端类型建立同源样本并且可以持续观测样本行为特征的样本库项目来满足在当前环境下的用户研究需求。
根据本发明的一个方面,提供一种同源样本的项目声量排序方法,包括:
获取一段时间内多个路由器的行为日志数据;
根据所述行为日志数据筛选路由器,将与所述路由器连接的设备活跃参数符合预定阈值的路由器加入样本库;
提取关联所述样本库中的路由器的行为日志数据中的URL,将包含有效URL的行为日志数据加入行为日志数据库;
对各行为日志数据设置项目标注,所述项目标注为行为日志数据库中各行为日志数据的所包含的URL涉及项目数据,所述项目标注至少包括项目ID;
对各行为日志数据设置设备标注,所述设备标注至少包括设备标识,所述设备标识用于标识与所述样本库中的路由器连接的设备;
至少根据项目ID对关联同一设备的行为日志数据进行聚合计数作为该设备对该项目ID的准项目声量;
计算一项目声量阈值,所述项目声量阈值mode=med+2std,其中,med为各设备对各项目ID的准项目声量的中位数,std为各设备对各项目ID的准项目声量的标准差;
判断各设备对各项目ID的准项目声量是否大于所述项目声量阈值;
若是,则使该设备对该项目ID的项目声量为项目声量阈值;
若否,则使该设备对该项目ID的项目声量为准项目声量;
对各项目ID,按项目声量对各设备进行排序,并以图形化显示排序结果。
可选地,将与所述路由器连接的设备活跃参数符合预定阈值的路由器加入样本库包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海精数信息科技有限公司,未经上海精数信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810787720.5/2.html,转载请声明来源钻瓜专利网。