[发明专利]基于聚类算法的用户行为分析方法、装置、设备及介质在审
申请号: | 202110702485.9 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113434745A | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 谌永材;周汉民 | 申请(专利权)人: | 未鲲(上海)科技服务有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06K9/62 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 涂年影 |
地址: | 200000 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 算法 用户 行为 分析 方法 装置 设备 介质 | ||
本申请涉及数据分析技术领域,揭露一种基于聚类算法的用户行为分析方法、装置、设备及介质,其中方法包括:通过埋点数据,按照时间戳收集用户行为路径数据;通过K均值聚类算法,对用户行为路径数据进行聚类分析,得到节点路径数据;构造节点路径数据中每个长度为1投影,得到投影路径,基于预设支持度阈值,将满足阈值支持度阈值的投影序列进行递归处理,得到候选路径,再统计候选路径的转化率,选取转化率最高的基础转化率作为目标转化率,并将目标转化率对应的候选路径作为目标路径。本申请还涉及区块链技术,用户行为路径数据存储于区块链中。本申请通过用户行为路径数据进行精准分析,有利于提高对用户行为数据的分析准确度。
技术领域
本申请涉及数据分析技术领域,尤其涉及一种基于聚类算法的用户行为分析方法、装置、设备及介质。
背景技术
对于网页来说,每天都有大量的用户进行访问,点击页面的每个部分,这些点击行为正是代表用户的真实操作行为,隐含着用户的兴趣、习惯、爱好等信息。如果能正确获取用户在页面的行为路径,那就能捕捉到用户的行为习惯,这无论对一个互联网产品的提升以及用户操作的便捷性都是非常用帮助的。
现有技术中一般是基于预设时间范围内所有的用户行为数据,采用机器学习算法或者通过人工配置漏斗的方式,计算得到用户的行为路径;而得到的可以指示用户行为路径的网状图,无法直观清楚地展示用户真正的路径,以及受冗余数据的影响得到的数据的准确性不够精准,从而导致得出的用户行为路径不够精准。
发明内容
本申请实施例的目的在于提出一种基于聚类算法的用户行为分析方法、装置、设备及介质,以提高对用户行为数据的分析准确度。
为了解决上述技术问题,本申请实施例提供一种基于聚类算法的用户行为分析方法,包括:
通过埋点数据,按照时间戳收集用户行为路径数据;
基于K均值聚类算法,对所述用户行为路径数据进行聚类分析,得到节点路径数据;
将所述节点路径数据中最小长度的节点路径作为前缀,并构造所述前缀对应的投影,得到初始投影路径;
基于预设支持度阈值,将高于所述预设支持度阈值的初始投影路径进行递归处理,得到候选路径;
统计每个所述候选路径从起点到终点的转化率,得到基础转化率;
选取转化率最高的基础转化率作为目标转化率,并将所述目标转化率对应的候选路径作为目标路径。
为了解决上述技术问题,本申请实施例提供一种基于聚类算法的用户行为分析装置,包括:
行为路径数据获取模块,用于通过埋点数据,按照时间戳收集用户行为路径数据;
节点路径数据获取模块,用于基于K均值聚类算法,对所述用户行为路径数据进行聚类分析,得到节点路径数据;
初始投影路径构造模块,用于将所述节点路径数据中最小长度的节点路径作为前缀,并构造所述前缀对应的投影,得到初始投影路径;
候选路径选取模块,用于基于预设支持度阈值,将高于所述预设支持度阈值的初始投影路径进行递归处理,得到候选路径;
基础转化率统计模块,用于统计每个所述候选路径从起点到终点的转化率,得到基础转化率;
目标路径确定模块,用于选取转化率最高的基础转化率作为目标转化率,并将所述目标转化率对应的候选路径作为目标路径。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种计算机设备,包括,一个或多个处理器;存储器,用于存储一个或多个程序,使得一个或多个处理器实现上述任意一项所述的基于聚类算法的用户行为分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于未鲲(上海)科技服务有限公司,未经未鲲(上海)科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110702485.9/2.html,转载请声明来源钻瓜专利网。