[发明专利]一种基于挖掘市民投诉文本的公共安全事件事前预警方法有效
申请号: | 201811414512.7 | 申请日: | 2018-11-26 |
公开(公告)号: | CN109635283B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 巫朝星;陈旺明;王金达;岳强;蔡素贤;张林兵;梁耀州;杜超坎 | 申请(专利权)人: | 汉纳森(厦门)数据股份有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/33;G06Q50/26 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 361008 福建省厦门市厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于挖掘市民投诉文本的公共安全事件事前预警方法,主要通过文本分析构建企业名称词库与行业经营范围词库,形成自定义词典;利用自定义词典对市民投诉文本内容进行切分,再进行企业名称的模糊匹配和行业经营范围的二次关联,最终将公共安全事件与企业匹配,并依据企业匹配上的市民投诉记录数进行企业排名,形成高危企业列表,并采取相应预警措施。本发明的数据具体利用市民投诉文本信息,无需特意布置相应的监控设备,信息来源渠道广泛,且能够进行公共安全事件的有效事情预警。 | ||
搜索关键词: | 一种 基于 挖掘 市民 投诉 文本 公共安全 事件 事前 预警 方法 | ||
【主权项】:
1.一种基于挖掘市民投诉文本的公共安全事件事前预警方法,其特征在于,包括如下步骤:S1、获取原始市民投诉文本内容以及企业的基础信息,所述基础信息包括企业全称信息、归属行业信息及经营范围信息;S2、对所获取的所有企业全称信息进行分词;S3、针对步骤S2中得到的分词结果,提取其中的高频词,并根据高频词建立企业全称信息停用词库与企业全称信息自定义词典;S4、对步骤S1中获取的所有企业全称信息再进行分词,并利用步骤S3中建立得到的企业全称信息停用词库与企业全称信息自定义词典进行降噪,构建得到企业名称词库;S5、按照企业的归属行业信息,将每个行业下具有的经营范围信息进行归纳并整理成文档;S6、使用分词包对步骤S5得到的文档中的企业的经营范围信息进行分词,建立企业经营范围停用词库和企业经营范围自定义词典;S7、对步骤S5得到的文档中的企业的经营范围信息再次进行分词,并使用步骤S6中得到的企业经营范围停用词库和企业经营范围自定词典对再次分词的结果进行降噪,得到每个行业的经营范围信息的分词结果;S8、对每个行业的经营范围信息的分词结果提取关键词,并利用提取得到的关键词构建行业经营范围词库;S9、使用步骤S4中构建得到的企业名称词库与步骤S8中构建得到的行业经营范围词库作为分词自定义词典对步骤S1中获取的原始市民投诉文本内容进行分词,得到分词文本;S10、对步骤S9得到的分词文本和步骤S4中构建得到的企业名称词库进行模糊名称匹配;S11、基于步骤S10得到的模糊名称匹配结果,进行行业经营范围的二次关联,确定关联企业;S12、依据关联企业对应的市民投诉文本内容的数量进行企业排名,形成高危企业列表,对高危企业采取相关高位预警措施。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉纳森(厦门)数据股份有限公司,未经汉纳森(厦门)数据股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811414512.7/,转载请声明来源钻瓜专利网。