[发明专利]一种基于DPI解析与决策树模型的用户画像识别方法在审

专利信息
申请号: 202110434413.0 申请日: 2021-04-22
公开(公告)号: CN113312531A 公开(公告)日: 2021-08-27
发明(设计)人: 陈曦;蓝志坚;林炫宇 申请(专利权)人: 广州丰石科技有限公司
主分类号: G06F16/951 分类号: G06F16/951;G06F16/955
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 刘俊
地址: 510640 广东省广州市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 dpi 解析 决策树 模型 用户 画像 识别 方法
【说明书】:

本发明公开了一种基于DPI解析与决策树模型的用户画像识别方法,包括以下步骤:S1:获取移动大数据平台的用户各维度数据及互联网数据;S2:对获取的互联网数据进行深度报文检测得到解析后的互联网数据;S3:对移动大数据平台的用户各维度数据和解析后的互联网数据进行数据预处理;S4:构建决策树算法模型,将预处理后的数据作为模型的输入,输出预测类别;S5:选择评估指标对模型进行评估得到准确率符合要求的模型。本发明通过深度报文检测解析用户上网行为,挖掘用户更深层特征属性,结合决策树模型,建立客户全方位的用户画像,使得用户画像更加精细,能够适用不同业务场景。

技术领域

本发明涉及大数据技术领域,更具体地,涉及一种基于DPI解析与决策树模型的用户画像识别方法。

背景技术

当前国内移动通信行业已进入饱和期,净增用户数增长速度放缓,使得运营商的运营重心逐步倾向存量用户资源的争夺和运营上。用户群体的划分、对于用户需求的精确洞察和及时认知,是根据用户特征进行个性化业务推送,辅助客户留存和新客获取的重要前提。当前运营商用户画像的构建主要基于用户基础信息、服务使用信息、用户通信记录、网络行为数据和地理位置信息等,采用频繁模式挖掘、多分类算法等分析形成用户标签,对客户群进行划分并提供精准推荐服务。

现有技术在实现过程中亦存在一些问题:

(1)用户画像构建不全面:现有技术用户画像实现仍要通过文献查询和市场调研,结合业务场景对用户进行人工划分群体,分类很大程度依据人工经验导致分类不够具体;

(2)现有技术针对运营商的海量数据梳理、挖掘不全面,画像识别只用到部分数据,用户标签建立的精度和广度不足,导致最终分类过于粗糙;

现有技术实现用户画像分类的过程中无法有效处理缺失值,且对异常值相对敏感,对数据完整度及数据预处理程度要求较高。

公开号为CN111191122A的中国发明专利,于2020年5月22日公开了一种基于用户画像的学习资源推荐系统,用于准确的、个性化的推荐课程资源,包括了四大层级,数据采集层,数据处理层,模型算法层,个性化服务层。本发明先采集用户的基本信息,对网站的浏览行为信息,查看的内容信息,评价交流信息。通过采集的信息将我们的数据进行分类和聚集,为每一个学习者建立对应的标签库,将其中的资源进行关联,随着用户的访问次数不停的增加,对当前的学习者建立个人的画像,同时也建立群体画像。通过推荐算法获得的课程资源列表,将其推荐给学习者。记录学习者给予的反馈和点击记录,我们能够做到更加好个性化服务与精确的推荐,可以节约学习者资源的查找时间,同时也能通过画像的方式了解学习者对于知识的学习情况。该方案是基于用户画像构建了一个分层的学习资源推荐系统,没有解决上述用户画像构建过程中存在的问题。

发明内容

本发明为克服现有技术中用户画像构建方法无法适用不同业务场景,用户画像不精细的缺陷,提供一种基于DPI解析与决策树模型的用户画像识别方法。

本发明的首要目的是为解决上述技术问题,本发明的技术方案如下:

一种基于DPI解析与决策树模型的用户画像识别方法,包括以下步骤:

S1:获取移动大数据平台的用户各维度数据及互联网数据;

S2:对获取的互联网数据进行深度报文检测得到解析后的互联网数据;

S3:对移动大数据平台的用户各维度数据和解析后的互联网数据进行数据预处理;

S4:构建决策树模型,将预处理后的数据作为模型的输入,输出预测类别,所述预测类别为预测职业分类,也即用户画像。

S5:选择评估指标对模型进行评估得到准确率符合要求的模型。

进一步的,获取互联网数据的具体步骤为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州丰石科技有限公司,未经广州丰石科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110434413.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top