[发明专利]一种基于社交网络的互联网班车线路优化方法有效

专利信息
申请号: 201611187726.6 申请日: 2016-12-21
公开(公告)号: CN106651027B 公开(公告)日: 2021-08-20
发明(设计)人: 于海洋;陈鸿溪;马晓磊;杨刚;杨帅 申请(专利权)人: 北京航空航天大学
主分类号: G06Q10/04 分类号: G06Q10/04;G06Q50/30;G06K9/62;G06F16/9536
代理公司: 北京和信华成知识产权代理事务所(普通合伙) 11390 代理人: 胡剑辉
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 专利公开了一种互联网班车路线优化方法,所述方法包括:步骤一,社交软件数据采集步骤,所述社交软件数据采集包括获取社交软件的信息数据,并从中采集到与班车线路有关的信息。步骤二、对所述数据采集步骤采集到的数据进行挖掘,得到用户不同出行时段的OD点(起终点)。步骤三、目标用户关系挖掘,在找到目标用户之后,根据其微博的朋友关系,寻找与其出行规律相似的用户,从而进一步扩大目标用户的范围。步骤四、对目标用户群体进行聚类,得到用户群最终的聚类中心(μk,ρk),此值即可作为互联网班车线路的OD点。利用社交网络中的海量数据挖掘潜在的目标用户可以帮助用户订制更符合用户实际需求的个性化出行方案,易于被用户接受。
搜索关键词: 一种 基于 社交 网络 互联网 班车 线路 优化 方法
【主权项】:
一种基于社交网络的互联网班车线路优化方法,其特征在于,所述方法包括如下步骤:步骤一,社交软件数据采集步骤,所述社交软件数据采集包括获取社交软件的信息数据,并从中采集到与班车线路有关的信息。在本步骤中,通过设置抓取条件的方式从获取所述社交软件提供的开放接口,抓取发布的微博中的相关信息数据;所述条件包括地理位置信息、时间信息、朋友关联关系。步骤二、对所述数据采集步骤采集到的数据进行挖掘,得到用户不同出行时段的OD点(起终点)。在本步骤中,利用K‑means聚类算法对所述采集到的所述相关信息数据进行挖掘;在本步骤中将采集到所述数据中的的第i个数据定义为向量:xi=(xi1,xi2,xi3),其中xi表示向量,xi1表示第i个点的经度,xi2表示第i个点的纬度,xi3表示第i个点的时间;在计算地点聚类中心之前先利用时间进行分类,根据所述社交软件的发布时间xi3将数据集分割为上班集与下班集;当xi3∈(5,9)时,将xi点放进上班集进行地点聚类,当xi3∈(16,20)时,将xi点放进下班集中进行地点聚类,其余数据点视为无效点被过滤掉;这一步实现了初步的数据过滤与分类,有利于后续步骤的聚类;然后进行第一次地点聚类,分别在上班集和下班集中各选出3个点作为备选点,即确定聚类中心数k=3;先定义上班集的第k个地点聚类中心为:其中,该公式的意义是将参与了第k个上班集地点聚类的点的经纬度计算平均值,计算出的经纬度作为第k个上班集的聚类中心的坐标;所述n为所采集的有效数据点的个数;定义第i个点xi与第k个聚类中心μk之间的距离为:Dik=(xi-μk)T(xi-μk)]]>则所述第一次地点聚类的计算步骤包括上班集聚类和下班集聚类,所述上上班集聚类包括:(1)先随机初始化聚类均值μ1、μ2、μ3;(2)对每个点xi都找到使Dik最小的k,将i点聚到该中心,并设置该分配系数zik=1;(3)如果所有的zik与上一次迭代没有变化,则停止聚类,输出μ1、μ2、μ3;(4)否则按照①式更新μ1、μ2、μ3;用与所述上班集聚类同样的办法可以得到下班集的三个聚类中心ρ1、ρ2、ρ3;步骤三、目标用户关系挖掘,在找到目标用户之后,根据其微博的朋友关系,寻找与其出行规律相似的用户,从而进一步扩大目标用户的范围。遍历目标用户的朋友圈关系,找出满足预定条件的所有重点朋友,然后计算出每一个朋友s的上班集聚类中心μs=(μ1、μ2、μ3)和下班集聚类中心ρs=(ρ1、ρ2、ρ3);然后余弦相似度可以定义上班集线路相似度计算每一个重点朋友s与目标用户d(μd、ρd)的线路相似度:cosθ=(μs,ρs)T(μd,ρd)(μs,ρs)T(μs,ρs)(μd,ρd)T(μd,ρd)]]>所述cosθ为阈值,如果cosθ大于预定的数值,则认为朋友s和目标用户d的线路相似,将所有相似的朋友放进一个新的集合中,进行第四步的二次聚类;步骤四、对目标用户群体进行聚类,得到用户群最终的聚类中心(μk,ρk),此值即可作为互联网班车线路的OD点。在本步骤中,利用K‑means聚类算法对所述采集到的所述相关信息数据进行挖掘;将步骤三得到的用户群的(μ、ρ)按照上班集与下班集分为两个集合,分别计算两个聚类点;由于经过步骤三的相似度判断,所以在本步骤中设定聚类中心数为1,设μ=(μ1,μ2,...,μ3n),当k=1时,根据步骤二的公式可以推出最终的上班集聚类中心为:同理可以算出下班集聚类中心为:ρk=13nΣi3nρi]]>最终得到第k个用户群的OD点为(μk,ρk),以根据这个点来增设互联网班车线路。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201611187726.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top