[发明专利]基于正则表达式的处警警情类别确定方法和装置在审

专利信息
申请号: 202010307896.3 申请日: 2020-04-17
公开(公告)号: CN113111234A 公开(公告)日: 2021-07-13
发明(设计)人: 彭涛;杜晶;高丽青 申请(专利权)人: 北京明亿科技有限公司
主分类号: G06F16/903 分类号: G06F16/903;G06F16/35;G06K9/62;G06Q50/18
代理公司: 北京植德律师事务所 11780 代理人: 唐华东
地址: 100021 北京市朝阳区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 正则 表达式 处警警情 类别 确定 方法 装置
【说明书】:

本公开实施例公开了基于正则表达式的处警警情类别确定方法和装置。该方法的一具体实施方式包括:获取待分类处警文本;对于预设处警警情类别集合中的每个处警警情类别,确定待分类处警文本是否与该处警警情类别对应的正则表达式匹配;用预设处警警情类别集合中的各目标处警警情类别生成待分类处警文本对应的处警警情类别集合,其中,待分类处警文本与目标处警警情类别对应的正则表达式匹配。该实施方式实现了自动对处警文本进行处警警情分类。

技术领域

本公开实施例涉及计算机技术领域,具体涉及基于正则表达式的处警警情类别确定方法和装置。

背景技术

目前,公安机关的处警员在处警结束后会根据处警过程整理相应的处警文本,并人工给出该处警文本所记载警情的警情分类。后续,根据所给出的警情分类可以确定由相应的案情分析人员对不同处警警情分类的处警文本进行统计分析处理。因此,对处警文本进行警情分类在接处警过程中以及后期统计分析中是非常重要的。

发明内容

本公开实施例提出了基于正则表达式的处警警情类别确定方法和装置。

第一方面,本公开实施例提供了一种基于正则表达式的处警警情类别确定方法,该方法包括:获取待分类处警文本;对于预设处警警情类别集合中的每个处警警情类别,确定待分类处警文本是否与该处警警情类别对应的正则表达式匹配;用预设处警警情类别集合中的各目标处警警情类别生成待分类处警文本对应的处警警情类别集合,其中,待分类处警文本与目标处警警情类别对应的正则表达式匹配。

在一些实施例中,预设处警警情类别集合中的每个处警警情类别对应至少一个正则表达式;以及预设处警警情类别集合中每个处警警情类别对应的正则表达式是通过如下第一训练步骤预先训练得到的:获取训练样本集合和测试样本集合,其中,训练样本和测试样本均包括历史处警文本和对应的标注警情类别集合;对于预设处警警情类别集合中的每个处警警情类别,执行以下第一正则表达式确定操作:将训练样本集合中对应的标注警情类别集合包括该处警警情类别的各训练样本中的历史处警文本确定为该处警警情类别对应的正样本集合;对于预设候选正则表达式数目集合中的候选正则表达式数目N,执行N个候选正则表达式生成操作以生成与该处警警情类别对应的N个候选正则表达式,以及基于测试样本集合对所生成的N个候选正则表达式进行测试以确定与候选正则表达式数目N对应的准确率;将所生成的最优正则表达式数目个候选正则表达式确定为与该处警警情类别对应的正则表达式,其中,最优正则表达式数目为候选正则表达式数目集合中对应的准确率最高的候选正则表达式数目,N个候选正则表达式生成操作包括:根据该处警警情类别对应的正样本集合中各正样本的文本长度,将该处警警情类别对应的正样本集合分成N个正样本子集合,以及基于所得到的每个正样本子集合,生成与该正样本子集合对应的候选正则表达式。

在一些实施例中,根据该处警警情类别对应的正样本集合中各正样本的文本长度,将该处警警情类别对应的正样本集合分成N个正样本子集合,包括:将第一长度减去第二长度的差确定为编辑长度,其中,第一长度为该处警警情类别对应的正样本集合中各正样本的文本长度中的最长文本长度,第二长度为该处警警情类别对应的正样本集合中各正样本的文本长度中的最短文本长度;将对编辑长度除以N的商向上取整所得的整数确定为子集合文本长度差;对于该处警警情类别对应的正样本集合中的每个正样本,执行以下分组操作:将该正样本的文本长度减去第二长度的差确定为D;将对D除以子集合文本长度差的商向上取整所得的正整数确定为I;将该正样本分到第I个正样本子集合,其中,I为1到N之间的正整数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明亿科技有限公司,未经北京明亿科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010307896.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top