[发明专利]职住地提取方法、装置及计算机可读存储介质在审
申请号: | 201911394758.7 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111190984A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 马宇岩 | 申请(专利权)人: | 上海炬宏信息技术有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/28 |
代理公司: | 南京九致知识产权代理事务所(普通合伙) 32307 | 代理人: | 严巧巧 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 住地 提取 方法 装置 计算机 可读 存储 介质 | ||
1.职住地提取方法,其特征在于:
采集第一数据,所述第一数据为车辆的历史行驶数据;
采集第二数据,所述第二数据为第一职住地信息,所述第一职住地信息为先验信息;
根据DBSCAN算法,将车辆的每段行程中的起始路段和终止路段进行空间聚类,获得第一聚类结果;
根据第二数据建立决策树模型,并根据第一聚类结果判断第一聚类结果中的簇中心是否为职住地。
2.根据权利要求1所述的职住地提取方法,其特征在于:
所述第一数据包括车辆ID、时间戳、经纬度、速度、打火点和熄火点。
3.根据权利要求2所述的职住地提取方法,其特征在于:
所述第二数据包括车辆ID、工作地、居住地以及工作地的所属商圈、居住地的所属住宅群。
4.根据权利要求3所述的职住地提取方法,其特征在于:
所述第一聚类结果包括第一簇集合和第一簇属性集;
所述第一簇集合包括第一簇集合内的路段和簇中心;
所述第一簇属性集包括第一簇集合内的路段通过时间在5点-10点的数量和频次、在17点-24点的数量和频次、通过时间属于工作日的数量和频次、通过时间属于周末及节假日的数量和频次、第一簇集合内的路段总数。
5.根据权利要求4所述的职住地提取方法,其特征在于:所述方法还包括:
当所述簇中心为职住地时,
根据该簇中心为工作地获得第一商圈信息,所述第一商圈信息为所述为工作地的簇中心的邻近商圈,或根据该簇中心为居住地获得第一住宅信息,所述第一住宅信息为所述居住地的簇中心的邻近住宅;
发送第一商圈信息或第一住宅信息以便告知。
6.根据权利要求1所述的职住地提取方法,其特征在于:
在所述DBSCAN算法中采用路网拓扑距离计算路段之间的距离。
7.根据权利要求6所述的职住地提取方法,其特征在于:对于属于起始路段或终止路段的任意第一路段和第二路段,按照如下方法计算第一路段与第二路段之间的距离:
获得第一路段和第二路段的起终点,计算起终点之间的球面距离;
比较球面距离与邻域半径;
若球面距离小于邻域半径,且第二路段属于第一路段的终点的邻域半径范围内,根据广度优先算法计算第一路段的终点到第二路段的起始点之间的最短拓扑距离;
所述最短拓扑距离为第一路段与第二路段之间的距离。
8.职住地提取装置,其特征在于:包括
第一采集模块,用于采集第一数据,所述第一数据为车辆的历史行驶数据;
第二采集模块,用于采集第二数据,所述第二数据为第一职住地信息,所述第一职住地信息为先验信息;
第一计算模块,用于根据DBSCAN算法,将车辆的每段行程中的起始路段和终止路段进行空间聚类,获得第一聚类结果;
第一判断模块,用于建立决策树模型,并根据第一职住地信息和第一聚类结果判断第一聚类结果中的簇中心是否为职住地。
9.职住地提取装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序实现如权利要求1-7中的任意一项所述的方法步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中的任意一项所述的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海炬宏信息技术有限公司,未经上海炬宏信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911394758.7/1.html,转载请声明来源钻瓜专利网。