[发明专利]一种数据分析处理系统及自动建模方法在审
申请号: | 201810632499.6 | 申请日: | 2018-06-19 |
公开(公告)号: | CN109389143A | 公开(公告)日: | 2019-02-26 |
发明(设计)人: | 姜琦;路宏琦;耿迪;路明奎 | 申请(专利权)人: | 北京九章云极科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;胡影 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据分析处理系统 用户界面 场景 业务模型 用户设置 自动建模 算法 用户选择模型 策略创建 用户体验 自动选择 自动化 创建 | ||
本发明提供一种数据分析处理系统及自动建模方法,该方法包括:显示用户界面,所述用户界面用于供用户设置用于创建业务模型的场景和数据;获取用户在所述用户界面上设置的场景和/或数据;根据获取的所述场景和/或数据,从多个模型策略中选择一模型策略,根据选择的模型策略创建业务模型,所述模型策略至少包括以下信息:算法和所述算法的参数调优方法。本发明中,能够根据用户设置的场景和/或数据,自动选择模型策略,不需要用户选择模型策略,提高了数据分析处理系统的自动化程度,提高了用户体验。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据分析处理系统及自动建模方法。
背景技术
当前的数据分析处理系统进行业务模型训练的主要方式为:从数据库中将用于训练业务模型的数据导出到本地,由建模师利用第三方建模工具,根据业务需求选择模型策略,训练业务模型,在训练业务模型的过程中不断地人工调试,得到优化的模型参数,从而得到训练出的业务模型。
上述业务模型训练方式存在很大弊端:业务模型训练的过程复杂,自动化程度低,不适用于非专业的用户使用。
发明内容
有鉴于此,本发明提供一种数据分析处理系统及自动建模方法,以解决现有的数据分析处理系统训练模型过程复杂,自动化程度低的问题。
为解决上述技术问题,本发明提供一种数据分析处理系统的自动建模方法,包括:
显示用户界面,所述用户界面用于供用户设置用于创建业务模型的场景和数据;
获取用户在所述用户界面上设置的场景和/或数据,并根据获取的所述场景和/或数据,从多个模型策略中选择一模型策略,根据选择的模型策略创建业务模型,所述模型策略至少包括以下信息:算法和所述算法的参数调优方法。
优选地,所述模型策略还包括以下信息中的至少之一:所述算法的评估方法、所述算法的参数设置方法、所述数据的拆分方法、所述数据的处理方法和所述数据的特征选择方法。
优选地,所述用户界面还用于供用户设置用于创建业务模型的目标特征。
优选地,所述显示用户界面的步骤包括:
在所述用户界面上显示场景表单供用户选择;
当检测到用户选择所述场景表单中的一场景的操作时,在所述用户界面上显示选择的场景;
或者
在所述用户界面上显示场景输入区域;
当检测到用户在所述输入区域输入场景的操作时,获取用户输入的所述场景;
将场景表单中与用户输入的场景匹配的场景显示在所述用户界面上。
优选地,所述场景包括以下至少之一:对应聚类算法的场景、对应分类算法的场景、对应回归算法的场景、对应异常检测的场景和对应语言处理的场景。
优选地,当所述场景为对应聚类算法的场景时,所述选择的模型策略的信息包括:算法和所述算法的参数调优方法,所述算法包括以下至少之一:层次聚类、贝叶斯高斯混合、KD树、受限波尔兹曼机,所述算法的参数调优方法基于超参数优化进行,所述超参数优化的方法包括以下至少之一:随机参数搜索方法、网格参数搜索方法、轮廓系数方法;
当所述场景为对应分类算法的场景时,所述选择的模型策略的信息包括:算法和所述算法的参数调优方法,所述算法包括以下至少之一:逻辑回归、随机森林、Bagging、AdaBoost、神经网络、堆栈模型,所述算法的参数调优方法基于超参数优化进行,所述超参数优化的方法包括以下至少之一:随机参数搜索方法、网格参数搜索方法、曲线下面积AUC分数方法;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京九章云极科技有限公司,未经北京九章云极科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810632499.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:分类器训练方法
- 下一篇:一种基于菜品识别的菜品组成分析系统和方法