[发明专利]一种基于AI语义分析的群情报信息研判方法和系统在审
申请号: | 201911300148.6 | 申请日: | 2019-12-16 |
公开(公告)号: | CN112949314A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 李达;杨毅 | 申请(专利权)人: | 武汉烽火众智数字技术有限责任公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/284;G06Q50/26 |
代理公司: | 北京汇泽知识产权代理有限公司 11228 | 代理人: | 郑飞 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ai 语义 分析 群情 信息 研判 方法 系统 | ||
本发明公开了一种基于AI语义分析的群情报信息研判方法,包括:获取并导入群情报信息;利用词频‑逆向文件频率算法对所述群情报信息进行AI语义分析,获取敏感词汇语句;利用余弦相似性算法对所述敏感词汇语句进行分析,对所述敏感词汇语句进行过滤;对过滤后的敏感词汇语句进行判定,根据判定结果采取预防处置和归档操作。本发明利用词频‑逆向文件频率算法和余弦相似性算法对所述敏感词汇语句进行分析,能将群情报信息大部分无用信息进行筛除,解决了现有技术群情报信息研判需要手工操作,工作量大,自动化低的问题。并且对敏感词汇语句判定后,能将历史数据进行汇总和研判处置流程进行归档,对以后的历史数据查阅实现一个闭环的处置流程展示。
技术领域
本发明属于公安行业群情报信息研判领域。尤其涉及一种基于AI语义分析的群情报信息研判方法和系统。
背景技术
现代的公安行业为了管理、检索各类社交软件的聊天记录,如涉及敏感词汇的微信、QQ聊天信息,往往采用了传统的EXCEL,人工逐条的查看。但是随着聊天记录的增多、聊天内容关键字不确定化、以及群情报研判流程不清楚等因素,长期在一线工作的民警越来越疲于重复的工作,这些也展示了群情报研判系统不智能化也越来越明显,主要有以下两点:
1、手工操作,自动化程度低。虽然使用了一些建议的关键字搜索工具,但是大部分一线民警依旧需要:逐条观察涉及敏感词汇的聊天记录,肉眼查看聊天信息,执行下一步操作。而且现在关键字日益更新,一线民警也不能及时的获取关键字,会导致效率较低。对于一些重复繁杂的工作,没有很好的自动化、流程化的进行。
2、信息孤岛,难以建立一个完整的档案,目前工作多用于excel整理,没有将历史数据进行汇总和研判处置流程记录进行归档,对以后的历史数据查阅难以实现一个闭环的处置流程展示。
发明内容
鉴于上述问题,提出了一种克服上述问题或者至少部分地解决上述问题的一种基于AI语义分析的群情报信息研判方法和系统。
一种基于AI语义分析的群情报信息研判方法,其特征在于,包括:
获取并导入群情报信息;
利用词频-逆向文件频率算法对所述群情报信息进行AI语义分析,获取敏感词汇语句;
利用余弦相似性算法对所述敏感词汇语句进行分析,对所述敏感词汇语句进行过滤;
对过滤后的敏感词汇语句进行判定,根据判定结果采取归档操作。
进一步地,利用词频-逆向文件频率算法对所述群情报信息进行AI语义分析,获取敏感词汇语句的方法为:
对所述敏感词汇语句进行分词;
剔除所述敏感词汇语句中的停用词;
采用词频-逆向文件频率算法对分词进行计算。
进一步地,所述词频-逆向文件频率算法公式为:
其中,tfij表示在敏感词汇文本中出现的频率,nij表示敏感词汇在自然语言文本中出现的次数,∑knkj表示自然语言文本中所有词汇出现的次数总和。
进一步地,,所述归档操作为:
根据敏感词汇语句,确定敏感词汇语句发布者身份信息;
根据发布者身份信息,进行事前核处;
产生非法事件预警;
进行事先处置和事后追处;
将所述过程进行预防处置和归档操作。
进一步地,所述余弦相似性算法公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉烽火众智数字技术有限责任公司,未经武汉烽火众智数字技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911300148.6/2.html,转载请声明来源钻瓜专利网。