[发明专利]一种基于分时拟合的黑盒数据拆分方法在审
申请号: | 202111572316.4 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114398265A | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 程磊;俞永浩;杨欣如;唐光宇;闫乃永;卢学明 | 申请(专利权)人: | 宝宝巴士股份有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06K9/62;G06Q30/02 |
代理公司: | 北京易捷胜知识产权代理事务所(普通合伙) 11613 | 代理人: | 蔡晓敏 |
地址: | 350000 福建省福州市仓山*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分时 拟合 黑盒 数据 拆分 方法 | ||
1.一种基于分时拟合的黑盒数据拆分方法,其特征在于,包括:
S1、将数据集中的部分数据划分为训练集,按照星期几、单位时间段分类整理所述训练集的自然新增用户数据,其中,一天划分有多个单位时间段;
S2、分别根据某一单位时间段的自然新增用户数据与下一单位时间段的自然新增用户数据多次训练计算得到所述某一单位时间段的数据模型,最终得到所有单位时间段的数据模型;
所述数据模型用于根据某一时间段的新增用户数据预测下一单位时间段的自然新增用户数据。
2.根据权利要求1所述的基于分时拟合的黑盒数据拆分方法,其特征在于,所述S1中还包括:
将数据集中的另一部分数据划分为测试集,按照星期几、单位时间段分类整理所述测试集的自然新增用户数据;
分别将所述数据模型对应代入至所述测试集的某一单位时间段的自然新增用户数据,预测下一单位时间段的自然新增用户数据,基于预测的下一单位时间段的自然新增用户数据与所述测试集对应的实际的下一单位时间段的自然新增用户数据进行对比,若对比结果超过预设阈值,则标记所述数据模型。
3.根据权利要求1所述的基于分时拟合的黑盒数据拆分方法,其特征在于,以小时段H作为时间单位段。
4.根据权利要求3所述的基于分时拟合的黑盒数据拆分方法,其特征在于,所述数据模型的建立过程如下:
S21、确定自变量X和因变量Y;
所述自变量X中的参数有:星期几W、单位时间段H和所述单位时间段内的自然新增用户实际数据x;
所述因变量Y中的参数有:星期几W、单位时间段H+1和所述单位时间段内的自然新增用户的实际数据y;
S22、建立单位时间段H+1内自然新增用户的实际数据y与单位时间段H内自然新增用户实际数据x的回归方程作为所述数据模型的模型方程:
hθ(x)=θ0+θ1·x,所述θ0为常数项,θ1为回归系数,hθ(x)用于基于单位时间段H自然新增用户实际数据x来计算出单位时间段H+1自然新增用户的预测数据;
S23、J(θ)是关于参数θ0、θ1的代价函数,是为了计算自然新增用户的预测数据hθ(x)与自然新增用户的实际数据y之间最小的残差平方和,计算过程如下:
S23、根据梯度下降算法,计算出使J(θ0,θ1)的值最小的θ0和θ1:
上述为偏导数,α为梯度下降学习率;
根据以上迭代过程,当迭代次数达到预设次数或者当前后两次迭代结果的差值小于预设迭代阈值时,迭代结束,最终确定参数θ0与θ1的值,从而确定了回归方程的表达式,数据模型建立完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宝宝巴士股份有限公司,未经宝宝巴士股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111572316.4/1.html,转载请声明来源钻瓜专利网。