首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于数据挖掘的建模方法及系统在审

申请号：	201910528701.5	申请日：	2019-06-18
公开（公告）号：	CN110457360A	公开（公告）日：	2019-11-15
发明（设计）人：	汪尚;闫秀媛	申请（专利权）人：	北京易莱信科技有限公司
主分类号：	G06F16/2458	分类号：	G06F16/2458;G06F16/26
代理公司：	11611 北京聿华联合知识产权代理有限公司	代理人：	张文娟;朱绘<国际申请>=<国际公布>=
地址：	101100北京市通州区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	源数据建模目标模型数据类型角色自变量模型表达式模型构建模型类型人员技术数据构建数据挖掘用户操作复杂度模型库因变量预设分析保证
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于数据挖掘的建模方法，其特征在于，所述方法包括：

步骤S1、获取有建模需求的源数据集；

步骤S2、对源数据集进行分析，确定源数据集中所有源数据的数据类型和数据角色；

步骤S3、利用预设的模型库根据源数据的数据类型和数据角色提供目标模型的模型类型和模型表达式；

步骤S4、利用各角色源数据对应的数据值计算获取各目标模型的最终表达式。

2.如权利要求1所述的方法，其特征在于，所述数据角色包括：因变量、自变量和次要数据。

3.如权利要求1或2所述的方法，其特征在于，在所述步骤S2中，具体包括：

对源数据集进行分析，确定源数据集中所有源数据的数据类型；

根据各源数据和对应的数据类型确定源数据集中是否包含角色为因变量的源数据；

若包含，则分别选取角色为因变量的源数据和角色为自变量的源数据；若不包含，则选取角色为自变量的源数据。

4.如权利要求1～3所述的方法，其特征在于，在所述步骤S4中，按照如下步骤计算获取各目标模型的最终表达式：

步骤A1、若目标模型的算法类型为监督式，模型类型为指数平滑模型，则由用户输入设定的平滑常数β，并通过下式获取目标模型的最终表达式：

y_a＝βx_a+(1-β)y_a-1

其中,a∈[1,n],y₀＝x₁；

步骤A2、若目标模型的算法类型为监督式，模型类型为逻辑回归模型，则通过以下操作获取目标模型的最终表达式：

根据目标模型的模型类型建立源数据集对应的自变量数据矩阵；

通过令如下等式成立确定针对类别t的模型参数向量β_t的估计值并根据模型参数向量的估计值确定目标模型的表达式；

其中，

式中，x_a为自变量数据中第a条记录对应的自变量向量，x_a′为第a条记录对应的自变量数据矩阵的转置矩阵，为针对类别t的模型参数向量估计值向量矩阵转置矩阵，y_a为第a条记录对应的因变量数据，y_ta^*为第a条记录对应的因变量数据针对类别t的所属结果；t∈(1,T)；

步骤A3、若目标模型的算法类型为监督式，模型类型不为指数平滑模型或逻辑回归模型，则通过以下操作获取目标模型的最终表达式：

根据目标模型的模型类型建立源数据集对应的自变量数据矩阵；

利用所述自变量数据矩阵和目标模型的类型计算模型参数向量的估计值；

根据模型参数向量的估计值返回获得目标模型的估计参数值，将所述估计参数值代入目标模型的表达式中确定目标模型的最终表达式；

步骤A4、若目标模型的算法类型为非监督式，则由用户指定需求的聚类数量K，根据所述聚类数量确定K个聚类中心，并通过下式确定最终的模型聚类结果：

其中，μ_l是类别C_l的聚类中心，第a条记录中的自变量数据x_a属于类别C_l，l∈[1,K]，d(x_a，μ_l)表示第a条记录的自变量数据在D个维度上分别与类别C_l类中心的距离的平方和，x_an代表x_a在第m个维度上的数值，m和D取正整数，m∈[1,D]。

5.如权利要求4所述的方法，其特征在于，在所述步骤A2中，通过下式根据模型参数向量的估计值确定目标模型的表达式：

其中，

式中，表示逻辑回归模型的最终因变量类别结果，T为因变量数据对应的总类别数量，为因变量y的第a个元素属于第t个类别的概率，为y的第a个元素属于第T个类别的概率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京易莱信科技有限公司，未经北京易莱信科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910528701.5/1.html，转载请声明来源钻瓜专利网。

上一篇：一种关联性分析方法
下一篇：特征数据获取方法、装置、计算机设备和存储介质

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top