[发明专利]兴趣点新增率预测模型训练及预测方法、装置及存储介质有效
申请号: | 201711457811.4 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108182240B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 吴俊;柯海帆 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 兴趣 新增 预测 模型 训练 方法 装置 存储 介质 | ||
本发明公开了兴趣点新增率预测模型训练及预测方法、装置及存储介质,其中预测方法包括:当需要对任一区域的POI新增率进行预测时,分别获取区域当前时刻的POI维度特征以及情报维度特征;将获取到的特征输入预先训练得到的POI新增率预测模型,得到区域的POI新增率预测结果。应用本发明方案,可准确地预测出不同区域的POI新增率,后续可根据新增率的大小来安排不同区域的更新频率,从而使得更新频率的安排更为合理,进而节省了采集资源等。
【技术领域】
本发明涉及计算机应用技术,特别涉及兴趣点新增率预测模型训练及预测方法、装置及存储介质。
【背景技术】
地图的广泛应用让人们的生活更加便利。地图数据如兴趣点(POI,Point ofInterest)是地图的基础,人们的出行离不开覆盖完整且坐标准确的POI。
现实世界中的POI在不断变化,为了让地图数据更加拟合现实世界,需要不断地通过众包采集、外业采集等方式更新地图上的POI。
目前,还没有一种有效地预测区域POI新增率的方法,地图对于所有区域一视同仁的去更新,这样,就会导致某些变化不大的区域的更新频率与变化较大的区域的更新频率相同,更新频率安排不合理,从而造成采集资源的浪费。
【发明内容】
有鉴于此,本发明提供了POI新增率预测模型训练及预测方法、装置及存储介质。
具体技术方案如下:
一种POI新增率预测模型训练方法,包括:
针对作为训练样本的每个区域,分别获取所述区域的以下信息:
采集时刻所述区域的POI维度特征,所述采集时刻为将当前时刻减去第一预定时长得到的时刻;采集时刻所述区域的情报维度特征;从采集时刻到当前时刻的第一预定时长内,所述区域的POI新增率;
根据获取到的作为训练样本的区域的POI维度特征、情报维度特征以及POI新增率,训练得到POI新增率预测模型。
根据本发明一优选实施例,所述采集时刻所述区域的POI维度特征包括以下之一或任意组合:
采集时刻所述区域内的POI数量;
采集时刻所述区域内属于预先定义的易变类型的POI数量;
截至采集时刻,所述区域内建立时长大于第二预定时长的POI数量;
截至采集时刻,所述区域内建立时长小于第三预定时长的POI数量;
截至采集时刻的第四预定时长内,所述区域内的所有POI的点击热度之和。
根据本发明一优选实施例,所述采集时刻所述区域的情报维度特征包括以下之一或任意组合:
所述区域内在采集时刻之前曾存在wifi定位信息,但在截至采集时刻的第五预定时长内无wifi定位信息的POI数量;
截至采集时刻的第六预定时长内,所述区域内新增wifi定位信息的POI数量;
截至采集时刻的第七预定时长内,所述区域内根据获取到的快递订单信息中的发件地址和收件地址确定出的新增POI数量;
截至采集时刻的第八预定时长内,所述区域的POI新增率。
根据本发明一优选实施例,该方法进一步包括:
将全国的城市划分为N个类别,N为大于一的正整数,其中,每个城市分别被切分为一系列预定大小的区域;
针对每个类别,分别训练得到对应的POI新增率预测模型。
根据本发明一优选实施例,所述将全国的城市划分为N个类别包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711457811.4/2.html,转载请声明来源钻瓜专利网。