[发明专利]基于移动手机app使用行为数据的多序列对比分类方法在审
申请号: | 202110554096.6 | 申请日: | 2021-05-20 |
公开(公告)号: | CN113378892A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 陆艺;李嘉晨;马卫卫;周建成 | 申请(专利权)人: | 南京光普信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/9535 |
代理公司: | 盐城市大丰区丰晟知识产权代理事务所(特殊普通合伙) 32454 | 代理人: | 葛潇敏 |
地址: | 210000 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 移动 手机 app 使用 行为 数据 序列 对比 分类 方法 | ||
本发明公开一种基于移动手机app使用行为数据的多序列对比分类方法,包括如下步骤:步骤1,收集若干移动手机用户的app使用行为数据,形成用户行为序列;步骤2,对用户行为序列进行全局匹配,并且构建距离矩阵;步骤3,对距离矩阵采取非加权分组平均法进行建树,从而分类。此种分类方法参考生物信息序列的系统发育分析方法,利用全局匹配算法(Needleman‑Wunsch算法),对序列计算距离计算进行建树分类,能够在人群行为值周期性不足、波动性较强时将人群行为较好地进行分类。
技术领域
本发明属于大数据分类技术领域,特别涉及一种包含移动手机用户行为分类的分析方法。
背景技术
人群分类技术是针对人群的属性数据或者时序数据,利用技术方法,进行分类,提取出人群之间的共性和差异点,使得同一人群的特征尽可能相似,方便进一步挖掘具有相同行为的人群的属性特征的方法。
目前,用户分类方法在精准营销,用户画像等方面有巨大的商业价值。可以大幅度提升营销活动的转化率。随着大数据技术的普及,各行各业的数据基础建设越发完善,人群的各种活动都被较为完善的记录下来,这为我们利用人群活动数据进行分析奠定了基础。
传统的人群分类方法主要分为两种:一是静止的分类方法:即分类的角度和时序无关,通过对不同的属性和维度进行打标签,在利用标签对人群进行分类划分。这种分类方法能够较好的结合多个维度将人群分开;二是通过人群在时序上的表现,利用DTW(动态规划)等相似性计算方法,将人群在时序表现上的相似性进行分类,这种分类方法能够较好地体现出人群在一个既定的时间周期内的行为表现的相似性,缺点是当人群行为之间差异不是特别大,或者周期性不强,随机性较大时,无法很好地进行人群分类。
发明内容
本发明的目的,在于提供一种基于移动手机app使用行为数据的多序列对比分类方法,参考生物信息序列的系统发育分析方法,利用全局匹配算法(Needleman-Wunsch算法),对序列计算距离计算进行建树分类,能够在人群行为值周期性不足、波动性较强时将人群行为较好地进行分类。
为了达成上述目的,本发明的解决方案是:
一种基于移动手机app使用行为数据的多序列对比分类方法,包括如下步骤:
步骤1,收集若干移动手机用户的app使用行为数据,形成用户行为序列;
步骤2,对用户行为序列进行全局匹配,并且构建距离矩阵;
步骤3,对距离矩阵采取非加权分组平均法进行建树,从而分类。
上述步骤1中,对收集的若干移动手机用户的app使用行为数据进行处理,形成用户行为序列的具体方法是:
步骤11,收集若干移动手机用户的app使用行为数据,user(p):[(X1,t1),(X2,t2),…],其中,p为第p个用户,X1,X2,…表示使用的第1,2,…个app,t1,t2,…表示对应app的使用时长;
步骤12,将使用时长小于阈值的app使用行为数据作为噪声删除,仅按序提取app得到新的序列作为用户行为序列user(p):[X01,X02,…]。
上述步骤2的具体过程是:
步骤21,采用动态规划的Needleman-Wunsch算法,得到用户行为序列得分最高的匹配方式;
步骤22,对各移动手机用户利用全局匹配算法进行两两对比,基于序列两两对比的结果添加第三个序列,进行多序列对比;
多序列联配的LCS定义如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京光普信息技术有限公司,未经南京光普信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110554096.6/2.html,转载请声明来源钻瓜专利网。