[发明专利]一种用户信息修正方法、装置、计算机设备及存储介质在审
申请号: | 202010182246.0 | 申请日: | 2020-03-16 |
公开(公告)号: | CN111506802A | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 董萍 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/955;G06K9/62 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户信息 修正 方法 装置 计算机 设备 存储 介质 | ||
1.一种用户信息修正方法,其特征在于,包括:
实时监视客户端的历史浏览信息;
基于所述历史浏览信息,获取被分析用户的页面跳转轨迹;
对所述页面跳转轨迹中的每一个页面设置对应的功能埋点;
将预设时间内的所述被分析用户的所有所述页面跳转轨迹进行合并,形成被分析行为轨迹;
获取所述被分析行为轨迹中的每一功能埋点对应的重要值;
根据每一所述功能埋点对应的重要值,获取所述被分析用户与预设的历史浏览信息库中的样本用户之间的相似度;
利用所述被分析用户与所述样本用户之间的相似度,获取被分析用户信息;
根据所述被分析用户信息对所述被分析用户的原始用户信息进行修正。
2.如权利要求1所述的用户信息修正方法,其特征在于,所述获取所述被分析行为轨迹中的每一功能埋点对应的重要值,包括以下步骤:
根据所述被分析行为轨迹,获取所述被分析用户的总功能埋点数,和所述总功能埋点数的每一功能埋点对应的触发次数;
从所述预设的历史浏览信息库中,获取样本用户总数和存在所述功能埋点的样本用户数;
采用如下TF-IDF加权公式,对所述被分析行为轨迹中的每一功能埋点进行计算,得到每一所述功能埋点的重要值;
TFIDF=TF*IDF;
其中,TFIDF为每一所述功能埋点的重要值,TF为每一所述功能埋点的触发频率,IDF为每一所述功能埋点的逆文档频率,TF=为所述总功能埋点中每一所述功能埋点对应的触发次数/被分析用户中的所述总功能埋点数,IDF=所述样本用户总数/存在所述功能埋点的样本用户数。
3.如权利要求2所述的用户信息修正方法,其特征在于,所述根据所述被分析行为轨迹,获取所述被分析用户的总功能埋点数,包括:
判断所述功能埋点对应的触发次数是否小于预设的触发阈值;
若所述功能埋点对应的触发次数小于所述预设的触发阈值,则去除所述功能埋点对应的触发次数小于所述预设的触发阈值的功能埋点,获取到经过所述去除后得到的目标功能埋点数;
将所述目标功能埋点数作为所述被分析用户的总功能埋点数。
4.如权利要求1所述的用户信息修正方法,其特征在于,所述根据每一所述功能埋点对应的重要值,获取所述被分析用户与预设的历史浏览信息库中的样本用户之间的相似度,包括:
根据每一所述功能埋点对应的重要值,获取所述被分析用户的被分析行为轨迹的第一向量;
从所述预设的历史浏览信息库中,获取样本用户的样本行为轨迹;
获取所述样本用户的样本行为轨迹的第二向量;
对所述被分析用户的被分析行为轨迹的第一向量与所述样本用户的样本行为轨迹的第二向量进行计算,得到所述被分析用户与所述样本用户之间的相似度。
5.如权利要求1所述的用户信息修正方法,其特征在于,所述利用所述被分析用户与所述样本用户之间的相似度,获取被分析用户信息,包括:
判断所述被分析用户与所述样本用户之间的所述相似度是否小于预设的阈值;
若所述被分析用户与所述样本用户之间的相似度小于所述预设的阈值,则对所述相似度小于预设的阈值的样本用户进行去除处理,获取经过去除处理后得到的目标样本用户;
对所述目标样本用户进行聚类分析,获取被分析聚类群体;
对所述被分析聚类群体的样本用户信息进行统计,获取统计结果;
根据所述统计结果,获取被分析用户信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010182246.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:树脂浸渗氮化硼烧结体及其用途
- 下一篇:一种屏幕保护方式的工艺