[发明专利]基于移动手机app使用行为数据的多序列对比分类方法在审
申请号: | 202110554096.6 | 申请日: | 2021-05-20 |
公开(公告)号: | CN113378892A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 陆艺;李嘉晨;马卫卫;周建成 | 申请(专利权)人: | 南京光普信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/9535 |
代理公司: | 盐城市大丰区丰晟知识产权代理事务所(特殊普通合伙) 32454 | 代理人: | 葛潇敏 |
地址: | 210000 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 移动 手机 app 使用 行为 数据 序列 对比 分类 方法 | ||
1.一种基于移动手机app使用行为数据的多序列对比分类方法,其特征在于包括如下步骤:
步骤1,收集若干移动手机用户的app使用行为数据,形成用户行为序列;
步骤2,对用户行为序列进行全局匹配,并且构建距离矩阵;
步骤3,对距离矩阵采取非加权分组平均法进行建树,从而分类。
2.如权利要求1所述的方法,其特征在于:所述步骤1中,对收集的若干移动手机用户的app使用行为数据进行处理,形成用户行为序列的具体方法是:
步骤11,收集若干移动手机用户的app使用行为数据,user(p):[(X1,t1),(X2,t2),…],其中,p为第p个用户,X1,X2,…表示使用的第1,2,…个app,t1,t2,…表示对应app的使用时长;
步骤12,将使用时长小于阈值的app使用行为数据作为噪声删除,仅按序提取app得到新的序列作为用户行为序列user(p):[X01,X02,…]。
3.如权利要求1所述的方法,其特征在于:所述步骤2的具体过程是:
步骤21,采用动态规划的Needleman-Wunsch算法,得到用户行为序列得分最高的匹配方式;
步骤22,对各移动手机用户利用全局匹配算法进行两两对比,基于序列两两对比的结果添加第三个序列,进行多序列对比;
多序列联配的LCS定义如下:
对于由(u1,u2,u3,...,un)组合得到的联配序列组合[A11 A21 A31 ... An1 A12 A22A32 ... An2 A13 A23 A33 ... An3 .... A1i A2i A3i ... Ani],其与另一个独立序列的LCS计算方式定义如下:
LCS(i,j)
=LCS(A11 A21 A31 ... An1 A12 A22 A32 ... An2 A13 A23 A33 ... An3 .... A1i A2iA3i ... Ani,c1 c2 c3 c4 ... cj),其中0≤i≤N,0≤j≤M
对于1≤i≤N,1≤j≤M,有公式:
步骤23,根据全局匹配结果计算序列两两之间的相似度矩阵,即为距离矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京光普信息技术有限公司,未经南京光普信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110554096.6/1.html,转载请声明来源钻瓜专利网。