[发明专利]彩票用户产品参与度预测方法、系统及设备、存储介质在审
申请号: | 201810841269.0 | 申请日: | 2018-07-26 |
公开(公告)号: | CN109146549A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 谭浩宇;郭贤均;丁烨 | 申请(专利权)人: | 云数信息科技(深圳)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 梁顺宜;郝传鑫 |
地址: | 518000 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户产品 参与度 用户数据 预测 彩票 预测模型 多维度 特征集 融合 数据库 计算机可读存储介质 随机森林分类器 预处理 贝叶斯分类器 决策树分类器 系统及设备 存储介质 预测系统 终端设备 准确率 迭代 加载 抽取 存储 分类 转换 | ||
本发明公开了一种彩票用户产品参与度预测方法,包括:获取原始用户数据,对所述原始用户数据进行抽取和转换后,以指定格式分类加载至数据库中;对所述数据库中存储的所述原始用户数据进行预处理,获得多维度用户数据;根据所述多维度用户数据获得与用户产品参与度相关的预测特征集;将所述预测特征集输入预先训练的融合预测模型中,对用户产品参与度进行预测;其中,所述融合预测模型至少由贝叶斯分类器、随机森林分类器和迭代决策树分类器融合生成。相应的,本发明还公开了一种彩票用户产品参与度预测系统及终端设备、计算机可读存储介质。采用本发明的技术方案能够降低彩票用户产品参与度的预测难度,并提高预测准确率。
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种彩票用户产品参与度预测方法、系统及终端设备、计算机可读存储介质。
背景技术
彩票行业产品种类众多,各种产品对于彩票公司的盈利价值有所不同,即抽成比例有高低之分。彩票公司希望发现用户的投注偏好,吸引用户更多地参与到高利润率的彩票产品中,从而带来更多的利润。因此,针对彩票用户对高利润率产品的参与度预测正逐步得到重视。
根据用户对高利润率产品的参与度,可以将用户划分为两大类,即低参与度用户和高参与度用户,其中,高参与度用户又可以细分为两小类,即由于投注偏好的变化或者投注总量提升这两类原因成为高参与度用户。
现有技术中,用于预测用户产品参与度的分类模型主要有基于经验和统计的规则模型,但这样的模型在面对彩票行业海量、多样、复杂的数据时很难提取出准确的规则来预测用户的产品参与度;回归分析也被广泛应用于分类问题中,但对训练数据的质量要求高,需排除自变量中的共线性问题以及合理地处理异常值和缺省值,而彩票用户数据来源广泛而复杂,往往存在异常和缺省,简单的回归分析并不能得到准确的预测结果。另外,神经网络也是常用的预测模型,它是一组连接的输入/输出单元,其中每个连接都有一个加权值,神经网络的分类知识体现在网络连接上,被隐式地存储在连接的权值中。神经网络的学习过程是通过迭代运算对权值不断进行调整的过程,学习的目标就是通过权值的调整使输入元组被正确的标号,相比其他常用的数据挖掘技术,神经网络用于分类问题预测有着良好的预测能力,但是缺点也不容忽视,比如神经网络本身的黑盒化、不易解释以及对计算力的高要求等,导致预测的难度较大。
发明内容
本发明实施例所要解决的技术问题在于,提供一种彩票用户产品参与度预测方法、系统及终端设备、计算机可读存储介质,能够降低彩票用户产品参与度的预测难度,并提高预测准确率。
为了解决上述技术问题,本发明实施例提供了一种彩票用户产品参与度预测方法,包括:
获取原始用户数据,对所述原始用户数据进行抽取和转换后,以指定格式分类加载至数据库中;
对所述数据库中存储的所述原始用户数据进行预处理,获得多维度用户数据;其中,所述预处理至少包括一致性处理、除重处理、数据变换和数据归约处理;所述多维度用户数据至少包括用户的个人信息、历史投注信息和历史盈利信息;
根据所述多维度用户数据获得与用户产品参与度相关的预测特征集;
将所述预测特征集输入预先训练的融合预测模型中,对用户产品参与度进行预测;其中,所述融合预测模型至少由贝叶斯分类器、随机森林分类器和迭代决策树分类器融合生成。
进一步地,所述根据所述多维度用户数据获得与用户产品参与度相关的预测特征集,具体包括:
根据数据统计分析从所述多维度用户数据中构建与用户产品参与度相关的潜在特征集;
根据迭代测试对所述潜在特征集进行调整、筛选和组合,获得所述预测特征集。
进一步地,所述方法通过以下步骤对所述融合预测模型进行训练:
将预先获得的与用户产品参与度相关的训练特征集划分为训练集和验证集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云数信息科技(深圳)有限公司,未经云数信息科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810841269.0/2.html,转载请声明来源钻瓜专利网。