[发明专利]基于信令数据的用户职住地分析方法有效
申请号: | 201611085317.5 | 申请日: | 2016-11-30 |
公开(公告)号: | CN106792514B | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 代心灵;石路路;徐珊珊 | 申请(专利权)人: | 南京华苏科技有限公司 |
主分类号: | H04W4/029 | 分类号: | H04W4/029;H04W16/22;H04W24/08 |
代理公司: | 江苏纵联律师事务所 32253 | 代理人: | 戴勇 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 用户 住地 分析 方法 | ||
1.一种基于信令数据的用户职住地分析方法,其特征在于,包括:
根据用户在设定时间段内的小区驻留信息,利用权重算法清除干扰小区得到用户重要小区后,对得到的用户重要小区进行基于地理位置信息的空间聚类,把聚类中密集出现的区域,划分为常驻地;
根据驻留时间对常驻地中各小区设置不同权重,来挖掘用户常驻小区;
在得到用户常驻小区后,根据用户常驻地的驻留时间分布,对建立基于频次及时长的常驻小区评分模型,用户的常驻小区进行属性划分,得到用户的居住地和工作地的信息;
利用权重算法清除干扰小区,具体为,对用户在设定时间段内的驻留小区进行平均驻留时长的计算和排名,把平均驻留时长低于某一阈值的小区进行清洗删除,去除干扰小区,划分出用户重要小区;
根据驻留时间对常驻地中各小区设置不同权重,来挖掘用户常驻小区,具体为:依据驻留时间设置用户所在常驻地中小区权重情况,加上权重参数,再去除权重小于设定阈值的小区;在以上小区中重新设置小区权重选取设定数量的权重最高的小区,得到用户常驻小区;
采用有代表性的基于密度的聚类算法即DBSCAN算法对得到的用户重要小区进行基于地理位置信息的空间聚类,具体为:
给定数据集D中所有对象都被标记为“未访问”,随机选择一个未访问的对象p,标记p为“已访问”,并检查p的ε-邻域是否至少包含MinPts个对象,如果不是,则对象p被标记为噪声点;否则为p创建一个新的簇C,并且把p的ε-邻域中所有对象都放在候选集合N中;
迭代地把候选集合N中不属于其他簇的对象添加到簇C中;在此过程中,对应候选集合N中标记为“未访问”的对象P*,DBSCAN把对象P′标记为“已访问”,并且检查对象P*的ε-邻域,如果对象P*的ε-邻域至少包含MinPts个对象,则对象P*的ε-邻域中的对象都被添加到候选集合N中,DBSCAN继续添加对象到簇C,直到簇C不能扩展,即直到候选集合N为空,此时簇C完成生成并输出;
继续找到下一个簇,DBSCAN从剩下的对象中随机选择一个未访问过的对象,聚类过程继续,直到给定数据集D中所有对象都被访问;
建立基于频次及时长的常驻小区评分模型,判定居民居住地,具体为:
抽取连续历史数据中每日的23:00-次日6:00时段的所有数据,得到用户在期间所有驻留小区信息,假设用户在小区c出现的频次为fc_home,驻留总时长为dc_home,对每个用户在所有小区的出现总频数及驻留总时长进行如下0-1标准化处理:
其中max为样本数据的最大值,min为样本数据的最小值;
从而得到所有用户驻留时长及总频数的0-1标准化后的值,分别为则居住地小区重要性评分即为:其中wf和wd分别表示频数和驻留时长的权重;
使用倍数环比法对权重进行设定:将各个考评因素随机排列,然后按照顺序对各项因素进行比较,得出各因素重要度之间的倍数关系,即环比比率,再将环比比率进行统一转换为基准值,最后进行归一化处理,确定其最终权重;根据以上权重算法,对所有小区评分进行排序,选取评分最高的小区,并且投射到附近地图上,即为挖掘出用户居住地。
2.如权利要求1所述的基于信令数据的用户职住地分析方法,其特征在于:建立基于频次及时长的常驻小区评分模型,判定工作地,具体为:
提取历史数据中所有的工作日数据,得到用户在期间所有驻留小区信息,假设用户在小区c出现的频次为fc_work,驻留总时长为dc_work,进行0-1标准化处理得到用户所有小区驻留时长及总频数的0-1标准化后的值,分别为fc_work、dc_work,对每个用户在所有小区的出现总频数及驻留总时长进行如下0-1标准化处理:
其中max为样本数据的最大值,min为样本数据的最小值;
从而得到所有用户驻留时长及总频数的0-1标准化后的值,分别为则工作地小区重要性评分即为:
其中wf和wd分别表示频数和驻留时长的权重;
使用倍数环比法对权重进行设定:首先将各个考评因素随机排列,然后按照顺序对各项因素进行比较,得出各因素重要度之间的倍数关系,即环比比率,再将环比比率进行统一转换为基准值,最后进行归一化处理,确定其最终权重;根据以上权重算法,对所有小区评分进行排序,选取评分最高的小区,并且投射到地图上,即为用户工作地。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京华苏科技有限公司,未经南京华苏科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611085317.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种湿法脱硫吸收塔提效装置
- 下一篇:一种新型液压动力扰动系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置