[发明专利]一种基于GCN嵌入空间聚类模型的商业区发现方法有效
| 申请号: | 202011499260.X | 申请日: | 2020-12-18 |
| 公开(公告)号: | CN112559909B | 公开(公告)日: | 2022-06-21 |
| 发明(设计)人: | 沈国江;赵振振;孔祥杰;刘娜利;刘志 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06K9/62;G06N3/04;G06N3/08;G06Q30/02;G06Q30/06;G06Q50/30 |
| 代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵 |
| 地址: | 310014 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 gcn 嵌入 空间 模型 商业区 发现 方法 | ||
1.一种基于GCN嵌入空间聚类模型的商业区发现方法,包括如下步骤:
(1)对多源异构城市数据进行预处理,多源异构城市数据包括路网数据、地理因素数据和出租车轨迹数据,保证数据的正确性;
(2)以表征任意两个地区地理相似性的矩阵和表征地区受欢迎程度的出租车轨迹点分布矩阵为输入,应用GCN模型挖掘地区的特征;
(3)联合步骤(2)所得的特征,利用层次聚类算法对不同行为模式下的地区进行伪标签定义;具体包括如下步骤:
3a).行为模式划分,人们在不同的日子里采取不同的活动模式,根据节假日和工作日将出租车轨迹数据分为两类;
3b).结合步骤(2)所得到的边特征与节点特征,对不同的行为模式利用GCN模型进行特征表示,图结构数据上的快速卷积公式如下:
其中IN表示单位矩阵,D是度矩阵D=∑jAij,λmax是Lsys矩阵的最大特征值,Tk(·)表示k阶切比雪夫多项式;θ表示切比雪夫系数的向量;同时利用神经网络进行参数向量进行优化,采用两层图卷积神经网络进行特征提取;公式如下:
f(A,X)=(gθH0W1+b1+H0)*σ(gθH0W1+b1) (3)
其中H0=Relu(gθXW0+b0+X)表示带有残差结构的第一层神经网络输出,gθ的常数项可以计算得到,待优化的参数项由神经网络参数进行优化,最后得到在嵌入空间中的聚合多个节点后生成的新的节点表示向量;
3c).在提取特征之后,采用层次聚类算法来挖掘地区的潜在商业指数,定义聚类的规则为样本之间的相关系数,具体包括如下步骤:
A:依照最优实验结果设置层次聚类的阈值,对于任意两个地区,计算相关系数公式如下:
B:根据相似度从强到弱连接对应节点对,并形成树状图,以阈值分割所得到的簇,最终得到所有的聚类结果;
3d).对不同行为模式下的聚类结果取交集;
(4)联合步骤(3)所得伪标签定义,利用高斯核密度估计算法对地区进行功能估计,最终确定合适的商业区。
2.根据权利要求1所述的一种基于GCN嵌入空间聚类模型的商业区发现方法,其特征在于:所述步骤(1)具体包括如下步骤:
1a).出租车轨迹数据的清洗,清除缺失值、噪声数据,以及出租车数据的规范化处理;
1b).原始路网数据的清洗,将具有共同路口的两个不同方向的车道看作一条道路,以及对路网数据的规范化处理;
1c).地理数据的统计,统计地区范围内的常用兴趣点的数量,用以表征地理相似性;
1d).区域的划分,基于清洗的路网数据,将城市划分为多个地区单元。
3.根据权利要求1所述的一种基于GCN嵌入空间聚类模型的商业区发现方法,其特征在于:所述步骤(2)具体包括如下步骤:
2a).按照时间段统计步骤(1)中所得到出租车轨迹数据,构造图卷积神经网络(GCN)所需要的节点特征,最终得到表征地区受欢迎程度的出租车轨迹点分布矩阵X;
2b).按照步骤(1)中所得到的地理因素数据,采用皮尔逊相关系数计算地理相似性,对于任意两个地区的地理特征向量U、V,计算公式如下:
其中表示特征向量的平均值;最终得到表征任意两个地区地理相似性的矩阵A。
4.根据权利要求1所述的一种基于GCN嵌入空间聚类模型的商业区发现方法,其特征在于:所述步骤(4)具体包括如下步骤:
4a).商业区估计,对整个路网区域进行全局细粒度的购物中心功能估计,采用高斯核密度方法进行估计,对于给定的多个二维数据点,核密度通过一个核估计器来计算地区强度,公式如下:
其中h是带宽,K(·)是指高斯核函数,公式如下:
4b).簇内功能强度计算,通过细粒度的高斯核密度估计,我们可以得到每一个地区的核密度分数,然后计算不同簇内功能强度的平均值,最终我们可以得到聚类伪标签结果的高斯核密度估计分数值;
4c).语义标签,为了更好的理解伪标签的结果,结合出租车轨迹点和簇内的功能强度,将商业区候选地区分为三部分:
S1.具有高数量出租车轨迹点但购物中心密度小的地区,这种区域属于要达到目的地必须经过的道路,可以认为是重要的道路区域;
S2.具有高数量出租车轨迹点但购物中心密度中的地区,这种区域属于发展中的商业区,可以认为是适合建造成熟商业区的地区;
S3.具有高数量出租车轨迹点同时购物中心密度大的地区,这种区域属于已经发展成熟的商业区;
最终,得到候选的商业地区的语义标签,用于指导城市中商业区的建设和规划。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011499260.X/1.html,转载请声明来源钻瓜专利网。





