[发明专利]一种电信套餐个性化匹配方法、系统、计算机设备及终端在审
申请号: | 202210425171.3 | 申请日: | 2022-04-22 |
公开(公告)号: | CN114861047A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 王彦本;白菊蓉 | 申请(专利权)人: | 西安邮电大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06;G06K9/62;G06N20/20;G06Q50/30 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 何畏 |
地址: | 710061 陕西省西安*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电信 套餐 个性化 匹配 方法 系统 计算机 设备 终端 | ||
1.一种电信套餐个性化匹配方法,其特征在于,所述电信套餐个性化匹配方法通过特征工程进行特征排序与筛选,使用KNN、决策树、随机森林、朴素贝叶斯机器学习算法构建模型,对用户选用套餐进行预测,并且对比四种算法之间的差异性;对决策树模型和随机森林模型改进优化,使用网格调优对参数进行调优,使用十折交叉验证对模型进行验证。
2.如权利要求1所述的电信套餐个性化匹配方法,其特征在于,所述电信套餐个性化匹配方法的去重:使用drop_duplicates方法对数据集中重复出现的数据进行去重操作,重复是指表中两行数据完全一致;
数据类型转换:使用pandas库中dtypes和info方法对数据集中各字段的数据类型进行展示,发现数据集中“2_total_fee”、“3_total_fee”、“gender”、“age”这四个特征的数据类型为‘object’,对应的数据类型应该是数值类型,使用astype方法进行数据类型转换,转换为数值类型;
空值和异常值:使用Matplotlib工具对数据进行可视化展示,绘制出数据的散点图,来检测异常值。
3.如权利要求1所述的电信套餐个性化匹配方法,其特征在于,所述电信套餐个性化匹配方法的特征选择依靠统计学方法或者机器学习模型本身的特征选择功能实现降维;计算数据集中套餐current_service和其他特征之间的相关性帮助选择特征;
使用pandas工具对数据集中的各个特征进行分析,并使用Matplotlib工具对其进行可视化的展示;对原始数据集进行清洗,提高数据质量;计算原始特征之间的相关性,对于低相关度的特征进行了删除,对于高相关度的数据进行了组合,构建出新的特征。
4.如权利要求1所述的电信套餐个性化匹配方法,其特征在于,所述电信套餐个性化匹配方法包括以下步骤:
第一步,使用提供的训练集和测试集;
第二步,将处理好的数据集使用Python中的pandas模块进行读入;
第三步,通过分析原始数据集中的数据,构造出新的特征;
第四步,构建算法模型,使用训练集对模型进行训练;
第五步,使用测试集对模型进行测试;
第六步,计算模型的准确率和F1_score,作为评测标准;
第七步,使用Matplotlib对预测结果进行可视化展示。
5.如权利要求4所述的电信套餐个性化匹配方法,其特征在于,训练模型的时候,将套餐设为目标变量,其余特征设为输入;根据不同的特征训练模型。
6.如权利要求4所述的电信套餐个性化匹配方法,其特征在于,所述电信套餐个性化匹配方法采用宏平均F1-score进行评价,F1-score是分类问题的一个衡量标准,定义如下:
(1)针对每个用户套餐类别,分别统计预测答案正确TP,错将其他类预测为本类FP,本类标签预测为其他类标签FN;
(2)通过统计值计算每个类别下的precision和recall,计算公式如下:
(3)通过计算结果计算每个类别下的F1-score,计算方式如下:
(4)通过求得的各个类别下的F1-score求均值,得到最后的评测结果,计算方式如下:
7.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~6任意一项所述电信套餐个性化匹配方法的步骤。
8.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1~6任意一项所述电信套餐个性化匹配方法的步骤。
9.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现权利要求1~6任意一项所述电信套餐个性化匹配方法的步骤。
10.一种实施权利要求1~6任意一项所述电信套餐个性化匹配方法的电信套餐个性化匹配系统,其特征在于,所述电信套餐个性化匹配系统包括:
数据准备模块,使用官方提供的训练集和测试集;
数据读入模块,将处理好的数据集使用Python中的pandas模块进行读入;
特征处理模块,通过分析原始数据集中的数据,构造出新的特征;
模型构建与训练模块,构建算法模型,使用训练集对模型进行训练;
测试模型模块,使用测试集对模型进行测试;
评分标准模块,计算模型的准确率和F1_score,作为评测标准;
绘图分析模块,使用Matplotlib对预测结果进行可视化展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210425171.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种儿科头部静脉注射的辅助输液架
- 下一篇:一种家用富氢水加湿器