[发明专利]一种融合地理位置和文本相似性的警情自动下发方法有效
申请号: | 201910689245.2 | 申请日: | 2019-07-29 |
公开(公告)号: | CN110532546B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 宋凯磊;韩志卓;司佳;侯位昭;齐幸辉;张世立;董德华 | 申请(专利权)人: | 中国电子科技集团公司第五十四研究所;河北远东通信系统工程有限公司 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/295;G06F40/30;G06F16/29;G06F18/22;G06F18/241 |
代理公司: | 河北东尚律师事务所 13124 | 代理人: | 王文庆 |
地址: | 050081 河*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 地理位置 和文 相似性 自动 下发 方法 | ||
1.一种融合地理位置和文本相似性的警情自动下发方法,其特征在于,包括以下步骤:
(1)当新警情到达时,根据警情中的中文地址,调用地图API,获取地址经纬度和地址理解度;
(2)借助jieba分词将中文地址切分为中文地址分词;
(3)根据中文地址分词,查询基于FastText分类器训练出的词向量库,得到中文地址的向量化表示,即中文地址词向量;
(4)根据地址理解度设置基于位置坐标相似性和中文地址文本语义相似性的自适应权重,其中,位置坐标相似性通过计算两个地址经纬度的余弦值得到,中文地址文本语义相似性通过计算两个中文地址词向量的余弦值得到;具体方式为:
(401)根据地址理解度计算非线性权重w:
w=1/(1+e-(θ-90));
其中,θ为地图API返回的地址理解度,其用于度量地址编码解析服务的准确度,e为自然对数的底;
(402)基于非线性权重w,得到所述自适应权重:
AdaSim=w×LSim+(1-w)×TSim;
其中,AdaSim表示自适应权重,LSim表示位置坐标相似性,TSim表示中文地址文本语义相似性;
(5)将所得到的地址经纬度、中文地址词向量和自适应权重输入给加权K最近邻分类算法,得到分类结果,即派出所id;
(6)根据派出所id将警情下发给对应派出所。
2.根据权利要求1所述的一种融合地理位置和文本相似性的警情自动下发方法,其特征在于,所述步骤(2)的具体方式为:
(201)利用网络爬虫技术获取国家统计局公布的某地的市、县/区、乡/镇、村/社区的地名信息;
(202)结合警情下发历史数据,利用正则表达式提取该地各小区的专有地名;
(203)构建包含该地的市、县/区、乡/镇、村/社区以及小区专有地名的专有地名字典;
(204)利用该地的专有地名字典,辅助jieba分词将中文地址划分成市、区、街道、街道号、小区、楼房号、单元号、房牌号的形式,形成符合FastText分类器输入的样本数据。
3.根据权利要求1所述的一种融合地理位置和文本相似性的警情自动下发方法,其特征在于,所述步骤(3)中词向量库的训练方式为:
(301)将警情下发历史数据中的中文地址切分后作为FastText分类器的输入样本;
(302)设置FastText分类器的参数,所述参数包括学习率lr、样本数据被训练的次数echo、词序列窗口大小n-gram,其中,n-gram、lr和echo的值采用5折交叉验证算法选取;
(303)开始FastText分类器训练,并用警情推送场景下的准确率和耗时评估FastText分类器的训练结果,当样本数据训练次数达到echo时,FastText分类器训练结束,得到警情自动下发领域中文地址的词向量库,该词向量库以矩阵形式存储有中文地址切分所得词汇的词向量;
所述步骤(3)中查询基于FastText分类器训练出的词向量库的具体方式为:
(311)根据警情下发历史数据中分词首次出现的顺序,将所述步骤(2)中切分好的各中文地址分词分别映射为索引,对索引进行one-hot编码,得到索引序列矩阵;
(312)将索引序列矩阵与词向量库矩阵相乘,得到各分词的词向量;
(313)对各分词的词向量进行叠加平均,得到中文地址的词向量。
4.根据权利要求1所述的一种融合地理位置和文本相似性的警情自动下发方法,其特征在于,所述步骤(5)中,加权K最近邻分类算法的K个最近邻样本中的第i个样本的权值为:
其中,AdaSim表示自适应权重。
5.根据权利要求1所述的一种融合地理位置和文本相似性的警情自动下发方法,其特征在于,所述地图API为百度地图API。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第五十四研究所;河北远东通信系统工程有限公司,未经中国电子科技集团公司第五十四研究所;河北远东通信系统工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910689245.2/1.html,转载请声明来源钻瓜专利网。