[发明专利]一种基于半监督聚类的无线小区信息侦测方法在审
申请号: | 201710479088.3 | 申请日: | 2017-06-22 |
公开(公告)号: | CN107295530A | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 李克;王海 | 申请(专利权)人: | 北京联合大学 |
主分类号: | H04W16/18 | 分类号: | H04W16/18;H04W16/24;H04W24/00;H04W24/10 |
代理公司: | 北京思海天达知识产权代理有限公司11203 | 代理人: | 刘萍 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种基于半监督聚类的无线小区信息侦测方法,要解决如何及时、准确地获取移动网络的基站和小区关键参数、以及基站运行状态从而构建和更新基站信息表,便于移动网络运营商更好地掌握网络中基站的部署和运行情况、进行有效管理。具体步骤详细如下输入从用户智能终端采集的无线网络在网信息采样数据;步骤S1终端数据清洗;步骤S2站型判定;步骤S3采用了矢量聚类的算法小区站址初定位;步骤S4同站小区站址聚合;步骤S5采用了软间隔SVM支持向量机确定小区张角和方向角;步骤S6在更新基站信息表时增加了小区状态和变更日期等字段,用于指示哪些小区在什么时间发生了变更(新增、拆除、搬迁、参数更新等)。 | ||
搜索关键词: | 一种 基于 监督 无线 小区 信息 侦测 方法 | ||
【主权项】:
一种基于半监督聚类的无线小区信息侦测方法,其特征在于,具体步骤如下:输入:从用户智能终端采集的无线网络在网信息采样数据采样数据,其所包含的信息应包括:日期,时间,大区编号,基站编号,小区编号,终端经纬度,定位方式,定位精度,当前所在省和地市名称,场强,信号质量,用户标识,终端标识;以下步骤S1~S6的处理周期为M天,即每M天进行一次;步骤S1:终端数据清洗对上述原始采样数据进行清洗,包括剔除无效数据,然后插入“在网信息采样数据表”,数据项包括:日期,时间,大区编号,基站编号,小区编号,终端经度,终端纬度,定位方式,定位精度,室内外标识,场强,信号质量,用户标识,终端标识,省,地市名称;定位精度字段缺失的样本,根据定位方式将本字段补齐;仅保留最近N天的样本,N大于M,N天之前的样本剔除;对表中数据进行排序:主顺序按小区标识中的大区编号升序排列,次顺序按基站编号升序排列,再次顺序按小区编号升序排列;以下步骤S2~S5以基站编号为单位进行逐个处理;步骤S2:站型判定将从“在网信息采样数据表”中选取的属于同一基站的采样数据放在一起;根据同基站编号下的小区数量、采样数据的空间分布特征和室内外属性判定站型;具体地:如果该基站编号下的小区编号数量大于1,且全部样本中室外样本即室内外标识字段值为室外的样本占比超过预设门限Tio,则判定该基站为“室外定向站”;如果该基站编号下的小区编号数量等于1,且全部样本中室外样本即室内外标识字段值为室外的样本占比超过预设门限Tio,则判定该基站为“室外全向站”;如果该基站编号下的全部样本中室内样本即室内外标识字段值为室内的样本占比超过预设门限Tio,则判定该基站为“室分站”;如果不满足以上条件,则判定为“不确定站型”;步骤S3:小区站址初定位对于站型不是“室外定向站”的基站,设该基站下共有Ns个样本点{Si,i=1~Ns},各样本中的场强值为{Pi,i=1~Ns},则权值wi,i=1~Ns下式计算:Pj{Pj,j=1~Ns}为该基站下各样本中的场强值;以该基站下所有样本点构成一个聚类,则由基于场强加权的质心作为该聚类的聚类中心;该聚类中心的坐标(即基站的站址经纬度)(x0,y0),即由下式求得:如果站型是“室外定向站”,则以该基站下的每个小区分别作为一个聚类,根据上式(2)和(3)分别计算各聚类的基于场强加权的质心作为各小区的初始基站经纬度;步骤S4:同站小区站址聚合对于判定为室外定向站的各小区,将同站各小区的初始站址经纬度的加权质心做为该基站的最终的站址经纬度;即:假设该基站下共有L个小区,各小区初始站址经纬度分别为u=1~L,各小区内的样点数为则该基站最终的站址经纬度为:步骤S5:确定小区张角和方向角根据小区编号是否相邻来判断同站相邻小区,即如果小区编号之差为1则为相邻小区;对同站下的任意两个相邻小区C1和C2,分别有N1和N2个样本,将这N1+N2=m个样本构成一个训练样本集D={(zv,hv),v=1,2,…,m},hv∈{‑1,+1},其中样本的属性字段仅保留经度和纬度,即第v个样本的属性zv=(xv,yv),标记字段取为该样本所属小区,即如果样本来自于小区C1,则标记设为+1,否则设为‑1;假设这两个小区的边界为线性可分,则其边界即为能够正确划分上述训练样本集中正例样本和反例样本的线性超平面方程,gTz+b=0 (6)其中g为列矢量,(·)T表示矩阵的转置;因为样本属性空间维度为2,仅有经度和纬度两个属性项,且小区边界应当为经过站址位置的直线,即位移项b=0,则上式可展开为:g1x+g2y=0 (7)因为无线信号在开放空间中传播的特性,相邻小区的样本会部分落在边界的对侧,即并非所有样本均能满足约束条件:hv(gTzv)≥1,v=1,2,…,m (8)所以小区边界为软间隔边界;寻找最优的软间隔划分超平面的问题即为寻找满足下式的g矢量和ξi最优值:s.t.hv(gTzv)≥1‑ξv,ξv≥0,v=1,2,…,m (9)式中采用了hinge损失函数,其中ξv≥0为松弛变量,每个样本对应一个松弛变量,表征该样本不满足约束的程度,ξv越大越宽容,C>0为常数;求解式(9)得到小区C1和C2的边界矢量g;将每个小区与其两侧相邻小区间的边界矢量间的夹角即作为该小区的张角,取该张角的等分矢量方向和正北方向的夹角即作为该小区的方向角;步骤S6:基站信息表构建与更新基站信息表的字段包括:大区编号,基站编号,小区编号,站型,经度,纬度,方向角,张角,状态,变更日期;当采集样本中的全部基站数据均已处理完毕后,将确定的小区信息更新到基站信息表中;如果表中没有该小区所属基站,则新增一条记录,并将“状态”值设为“新建”,将“变更日期”设为该基站全部样本中的最早日期;如果表中已有该小区,则替换原有记录,并将“状态”值设为“更新”,将“变更日期”设为该小区全部样本中的最晚日期;如果表中小区信息没有做更新,或虽已更新但变更日期距本次的处理时间超过设定门限,则将该小区记录的“状态”值设为“疑似拆除”;对于非“室外定向站”的小区,方向角和张角置为空。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京联合大学,未经北京联合大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710479088.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种插座地线漏电检测电路
- 下一篇:冲击吸收单元及其制造方法和冲击吸收增强件