[发明专利]一种基于聚类的常去地识别方法及装置、存储介质在审
| 申请号: | 202010273065.9 | 申请日: | 2020-04-09 |
| 公开(公告)号: | CN111611500A | 公开(公告)日: | 2020-09-01 |
| 发明(设计)人: | 罗冬阳 | 申请(专利权)人: | 中国平安财产保险股份有限公司 |
| 主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/906 |
| 代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
| 地址: | 518046 广东省深圳市福田区益田路*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 常去 识别 方法 装置 存储 介质 | ||
本申请公开了一种基于聚类的常去地识别方法及装置、存储介质、计算机设备,该方法包括:获取用户行程数据,其中,所述用户行程数据包括目的地坐标;对所述目的地坐标进行聚类,得到至少一个目的地坐标簇,以使任一所述目的地簇中包含的目的地坐标的数量大于或等于最小数量阈值且同一所述目的地簇中的任一目的地坐标与其他目的地坐标之间的最小距离小于或等于最大距离阈值;计算每个所述目的地坐标簇的聚类中心;基于所述聚类中心,识别用户的常去地。本申请通过对特定用户的目的地坐标聚类的方式划分坐标簇,从而基于坐标簇的聚类中心确定用户常去地,所得到的常去地与用户个体更加匹配,并且解决了现有技术中区域分块粒度难以把握的问题。
技术领域
本申请涉及数据分析技术领域,尤其是涉及到一种基于聚类的常去地识别方法及装置、存储介质、计算机设备。
背景技术
基于用户APP的GPS定位的数据,分析和推测用户的行为习惯、消费水平和家庭状况等,进而据此为用户提供更加个性化的服务和推荐,是目前LBS的常规应用方式。包括百度、阿里和腾讯在内的许多巨头,都在积极运用LBS类型的画像,强化客群的智能运营。在此过程中,通过处理和分析GPS打点数据识别用户的常去地点,是极其重要的一环。能准确识别客户的常去地点,对于改善用户画像的精准度,提升业务侧在用户运营方面的效率和满意度,都有非常积极的作用。
在传统的用户常去地点识别方法中,一般需要先对单个用户的GPS打点区域进行分块,统计各块内GPS坐标点数量并据此对分块排序,然后取TOPn的块作为用户常去的n个地点块,最后再取块内中心点作为用户常去点坐标。
传统方法存在明显不足,结果准确性也相当有限:首先,对不同用户的打点区域分块的粒度难以把握,过细则导致常去地一点多分的情况;过大则容易导致无法区分较近的多个常去地点。其次,分块边界容易对GPS打点数据造成分割,且对于边界附近坐标点的归属问题也没有很可靠解决方案,例如,高频打点的用户在常去地的打点数据非常容易被分块边界影响,导致一个常去地点的GPS打点数据被分割至多个分块,进而造成一点多分。
发明内容
有鉴于此,本申请提供了一种基于聚类的常去地识别方法及装置、存储介质、计算机设备,得到的常去地与用户个体更加匹配,并且解决了现有技术中区域分块粒度难以把握的问题。
根据本申请的一个方面,提供了一种基于聚类的常去地识别方法,包括:
获取用户行程数据,其中,所述用户行程数据包括目的地坐标;
对所述目的地坐标进行聚类,得到至少一个目的地坐标簇,以使任一所述目的地簇中包含的目的地坐标的数量大于或等于最小数量阈值且同一所述目的地簇中的任一目的地坐标与其他目的地坐标之间的最小距离小于或等于最大距离阈值;
计算每个所述目的地坐标簇的聚类中心;
基于所述聚类中心,识别用户的常去地。
具体地,所述对所述目的地坐标进行聚类,得到至少一个目的地坐标簇,具体包括:
步骤1,利用全部所述目的地坐标建立目的地坐标集合D,并将所述目的地坐标集合中的每个所述目的地坐标标记为未被访问;
步骤2,选取一个未被访问的所述目的地坐标p,并将所选取的所述目的地坐标p标记为已被访问;
步骤3,从所述目的地坐标集合中获取所述目的地坐标p的邻域目的地坐标,并统计所述邻域目的地坐标中的所述目的地坐标的数量,其中,所述邻域目的地坐标与所述目的地坐标p之间距离可达;
步骤4,若所述数量小于所述最小数量阈值,则将所述目的地坐标p标记为噪声点;
步骤5,若所述数量大于或等于所述最小数量阈值,则根据所述目的地坐标p及其所述邻域目的地坐标建立候选集合N;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安财产保险股份有限公司,未经中国平安财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010273065.9/2.html,转载请声明来源钻瓜专利网。





