[发明专利]一种年龄分布预测方法、装置、设备以及存储介质在审
申请号: | 202111446143.1 | 申请日: | 2021-11-30 |
公开(公告)号: | CN114186143A | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 丁建辉;陈珍 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/909;G06F16/906;G06Q10/04;G06Q50/14 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 兰海叶 |
地址: | 100089 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 年龄 分布 预测 方法 装置 设备 以及 存储 介质 | ||
1.一种年龄分布预测方法,包括:
获取第一数据集和第二数据集,所述第一数据集中包括分别对应各区域的第一数据子集,所述第二数据集中包括分别对应各区域的第二数据子集;
根据所述第一数据集和第二数据集构建全局比例因子和个性化比例因子;
根据所述全局比例因子对所述待预测区域的年龄分布进行预测,获得第一预测结果;
根据所述个性化比例因子对所述待预测区域的年龄分布进行预测,获得第二预测结果;
根据所述第一预测结果、第二预测结果和所述第一数据集获得最终预测结果。
2.根据权利要求1所述的方法,其中,所述根据第一数据集和第二数据集构建全局比例因子,包括:
分别针对各区域,获取所述第一数据集中各年龄段的第一占比{ai1,ai2,…,ain}、以及所述第二数据集中各年龄段的第二占比{bi1,bi2,…,bin};
分别计算所述各区域对应的第一占比与第二占比之间的比例因子{bi1/ai1,bi2/ai2,…,bin/ain};其中,bin/ain表示第i个区域中第n个年龄段的比例因子,i和n为正整数,n表示划分的年龄段总数;
将同一年龄段对应的所有区域的比例因子求和取平均,第j个年龄段的所述求和取平均结果为:Pj=(b1j/a1j+b2j/a2j+…+bmj/amj)/m,其中,m表示区域的总数,bmj/amj表示第m个区域的第j个年龄段的比例因子;
对各个年龄段对应的所述求和取平均结果进行组合构建所述全局比例因子P={P1,P2,…,Pn}。
3.根据权利要求2所述的方法,其中,所述根据全局比例因子对待预测区域的年龄分布进行预测,获得第一预测结果,包括:
根据所述全局比例因子训练逻辑回归模型;
根据逻辑回归模型对所述待测区域的年龄分布进行预测,获得第一预测结果。
4.根据权利要求3所述的方法,其中,所述根据全局比例因子训练逻辑回归模型,包括:
根据所述全局比例因子初始化逻辑回归模型中的权重矩阵;
基于采集到的训练数据根据梯度下降策略优化所述权重矩阵的参数;
当所述逻辑回归模型在训练集或验证集上的预测结果收敛时,结束对所述逻辑回归模型的训练。
5.根据权利要求4所述的方法,其中,所述根据全局比例因子初始化逻辑回归中的权重矩阵,包括:
将所述逻辑回归中的权重矩阵V及偏置项c设置为0矩阵;
利用所述全局比例因子调整所述权重矩阵V的对角线,V[i,i]=Pi。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111446143.1/1.html,转载请声明来源钻瓜专利网。