[发明专利]一种基于社交网络的互联网班车线路优化方法有效
申请号: | 201611187726.6 | 申请日: | 2016-12-21 |
公开(公告)号: | CN106651027B | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 于海洋;陈鸿溪;马晓磊;杨刚;杨帅 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/30;G06K9/62;G06F16/9536 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本专利公开了一种互联网班车路线优化方法,所述方法包括:步骤一,社交软件数据采集步骤,所述社交软件数据采集包括获取社交软件的信息数据,并从中采集到与班车线路有关的信息。步骤二、对所述数据采集步骤采集到的数据进行挖掘,得到用户不同出行时段的OD点(起终点)。步骤三、目标用户关系挖掘,在找到目标用户之后,根据其微博的朋友关系,寻找与其出行规律相似的用户,从而进一步扩大目标用户的范围。步骤四、对目标用户群体进行聚类,得到用户群最终的聚类中心(μ |
||
搜索关键词: | 一种 基于 社交 网络 互联网 班车 线路 优化 方法 | ||
【主权项】:
一种基于社交网络的互联网班车线路优化方法,其特征在于,所述方法包括如下步骤:步骤一,社交软件数据采集步骤,所述社交软件数据采集包括获取社交软件的信息数据,并从中采集到与班车线路有关的信息。在本步骤中,通过设置抓取条件的方式从获取所述社交软件提供的开放接口,抓取发布的微博中的相关信息数据;所述条件包括地理位置信息、时间信息、朋友关联关系。步骤二、对所述数据采集步骤采集到的数据进行挖掘,得到用户不同出行时段的OD点(起终点)。在本步骤中,利用K‑means聚类算法对所述采集到的所述相关信息数据进行挖掘;在本步骤中将采集到所述数据中的的第i个数据定义为向量:xi=(xi1,xi2,xi3),其中xi表示向量,xi1表示第i个点的经度,xi2表示第i个点的纬度,xi3表示第i个点的时间;在计算地点聚类中心之前先利用时间进行分类,根据所述社交软件的发布时间xi3将数据集分割为上班集与下班集;当xi3∈(5,9)时,将xi点放进上班集进行地点聚类,当xi3∈(16,20)时,将xi点放进下班集中进行地点聚类,其余数据点视为无效点被过滤掉;这一步实现了初步的数据过滤与分类,有利于后续步骤的聚类;然后进行第一次地点聚类,分别在上班集和下班集中各选出3个点作为备选点,即确定聚类中心数k=3;先定义上班集的第k个地点聚类中心为:其中,该公式的意义是将参与了第k个上班集地点聚类的点的经纬度计算平均值,计算出的经纬度作为第k个上班集的聚类中心的坐标;所述n为所采集的有效数据点的个数;定义第i个点xi与第k个聚类中心μk之间的距离为:Dik=(xi-μk)T(xi-μk)]]>则所述第一次地点聚类的计算步骤包括上班集聚类和下班集聚类,所述上上班集聚类包括:(1)先随机初始化聚类均值μ1、μ2、μ3;(2)对每个点xi都找到使Dik最小的k,将i点聚到该中心,并设置该分配系数zik=1;(3)如果所有的zik与上一次迭代没有变化,则停止聚类,输出μ1、μ2、μ3;(4)否则按照①式更新μ1、μ2、μ3;用与所述上班集聚类同样的办法可以得到下班集的三个聚类中心ρ1、ρ2、ρ3;步骤三、目标用户关系挖掘,在找到目标用户之后,根据其微博的朋友关系,寻找与其出行规律相似的用户,从而进一步扩大目标用户的范围。遍历目标用户的朋友圈关系,找出满足预定条件的所有重点朋友,然后计算出每一个朋友s的上班集聚类中心μs=(μ1、μ2、μ3)和下班集聚类中心ρs=(ρ1、ρ2、ρ3);然后余弦相似度可以定义上班集线路相似度计算每一个重点朋友s与目标用户d(μd、ρd)的线路相似度:cosθ=(μs,ρs)T(μd,ρd)(μs,ρs)T(μs,ρs)(μd,ρd)T(μd,ρd)]]>所述cosθ为阈值,如果cosθ大于预定的数值,则认为朋友s和目标用户d的线路相似,将所有相似的朋友放进一个新的集合中,进行第四步的二次聚类;步骤四、对目标用户群体进行聚类,得到用户群最终的聚类中心(μk,ρk),此值即可作为互联网班车线路的OD点。在本步骤中,利用K‑means聚类算法对所述采集到的所述相关信息数据进行挖掘;将步骤三得到的用户群的(μ、ρ)按照上班集与下班集分为两个集合,分别计算两个聚类点;由于经过步骤三的相似度判断,所以在本步骤中设定聚类中心数为1,设μ=(μ1,μ2,...,μ3n),当k=1时,根据步骤二的公式可以推出最终的上班集聚类中心为:同理可以算出下班集聚类中心为:ρk=13nΣi3nρi]]>最终得到第k个用户群的OD点为(μk,ρk),以根据这个点来增设互联网班车线路。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611187726.6/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理