[发明专利]一种面向网格事件分类分级处置的单维聚类分析方法在审
申请号: | 201911143455.8 | 申请日: | 2019-11-20 |
公开(公告)号: | CN111723136A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 钱华;姜永华;钱建华;王巧荣;房查;张宏斌 | 申请(专利权)人: | 中共南通市委政法委员会;江苏飞搏软件股份有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/28;G06Q10/06;G06Q50/26 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 周新亚 |
地址: | 226000 江苏省南通市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 网格 事件 分类 分级 处置 聚类分析 方法 | ||
本发明涉及一种面向网格事件分类分级处置的单维聚类分析方法,所述方法包括以下步骤:步骤(1)获取网格事件记录;步骤(2)对获取的网格事件记录进行清洗,仅保留网格事件情况文本;步骤(3)利用BERT模型提取网格事件情况文本的语义特征,生成多维特征向量;步骤(4)利用单维聚类算法对网格事件情况文本数据进行聚类;步骤(5)生成K个不同类型的网格事件类型簇,并存入到HBASE中;步骤(6)识别高发的网格事件类型。该方案可以高效的对分散的网格事件记录进行融合分析,准确地对高发的网格事件进行重点监测预警,提升了网格事件分类分级处置的效率。
技术领域
本发明涉及一种分析方法,具体涉及一种面向网格事件分类分级处置的单维聚类分析方法,属于网格事件分析技术领域。
背景技术
目前,面向全社会面的事件类型繁多,为了在网格化社会治理模式下对网格内各类事件、纠纷进行分析,现有技术通常需要基层网格员对所属网格内存在的治安、矛盾纠纷、消防安全、食品卫生安全等各类事件进行记录上报。
然而,单纯依靠人工记录上报的方法,不仅网格事件情况缺乏准确性判定标准,而且缺少对分散的事件记录的融合分析,所以很难对网格区域内高发的网格事件类型进行有针对性的重点监测预警,严重影响了网格事件处置的效率。因此,迫切的需要一种新的方案解决上述技术问题。
发明内容
本发明正是针对现有技术中存在的问题,提供一种面向网格事件分类分级处置的单维聚类分析方法,该方案可以高效的对分散的网格事件记录进行融合分析,准确地对高发的网格事件进行重点监测预警,提升了网格事件分类分级处置的效率。
为了实现上述目的,本发明的技术方案如下,一种提升了网格事件分类分级处置的效率,所述方法包括以下步骤:
步骤(1)获取网格事件记录;
步骤(2)对获取的网格事件记录进行清洗,仅保留网格事件情况文本;
步骤(3)利用BERT模型提取网格事件情况文本的语义特征,生成多维特征向量;
步骤(4)利用单维聚类算法对网格事件情况数据进行聚类;
步骤(5)生成K个不同类型的网格事件类型簇,并存入到HBASE中;
步骤(6)识别高发的网格事件类型。
作为本发明的一种改进,所述步骤(1)具体为:从多源数据库中抽取网格事件记录。
作为本发明的一种改进,所述步骤(2)具体为:利用ETL工具对抽取的网格事件记录进行清洗,去除事件发生地点、事件发生时间等字段,仅保留网格事件情况文本。
作为本发明的一种改进,所述步骤(3)具体为:输入网格事件情况文本,利用BERT模型对文本进行权重值计算,输出文本的多维语义特征向量。
作为本发明的一种改进,所述步骤(4)包括以下子步骤:
(41)计算任意一个预选的网格事件情况文本与剩余各个事件情况文本之间的相似度值simVal;计算过程1)利用计算公式simVal=cX1+dX2
C预设的取值范围:(0.8-0.9)c为权重参数
D预设的取值范围:(0.1-0.2)d为权重参数
X1:向量夹角余弦值;
X2:向量欧氏距离归一值;
(42)根据相似度值计算结果,生成N个包含与任意一个预选的网格事件情况文本相似的所有网格事件情况文本的簇;
(43)选取N个网格事件情况文本簇所对应的N个预选的网格事件情况文本作为中心文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中共南通市委政法委员会;江苏飞搏软件股份有限公司,未经中共南通市委政法委员会;江苏飞搏软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911143455.8/2.html,转载请声明来源钻瓜专利网。