[发明专利]基于支持向量机的处警警情类别确定方法和装置在审
申请号: | 202010305573.0 | 申请日: | 2020-04-17 |
公开(公告)号: | CN113111895A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 彭涛;赵伟;高丽青 | 申请(专利权)人: | 北京明亿科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/35;G06F40/284;G06F40/289;G06Q50/18 |
代理公司: | 北京植德律师事务所 11780 | 代理人: | 唐华东 |
地址: | 100021 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 支持 向量 处警警情 类别 确定 方法 装置 | ||
本公开实施例公开了基于支持向量机的处警警情类别确定方法和装置。该方法的一具体实施方式包括:将待分类处警文本进行切词得到相应的分词序列;基于所得到的分词序列确定待分类处警文本的文本特征向量;对于预设处警警情类别集合中的每个处警警情类别,将文本特征向量输入与该处警警情类别对应的分类模型,得到用于指示待分类处警文本是否属于该处警警情类别的分类结果,其中,与各处警警情类别对应的分类模型是基于支持向量机训练得到的;用预设处警警情类别集合中的各目标处警警情类别生成待分类处警文本对应的处警警情类别集合,其中,分类结果指示待分类处警文本属于目标处警警情类别。该实施方式实现了自动对处警文本进行处警警情分类。
技术领域
本公开实施例涉及计算机技术领域,具体涉及基于支持向量机的处警警情类别确定方法和装置。
背景技术
目前,公安机关的处警员在处警结束后会根据处警过程整理相应的处警文本,并人工给出该处警文本所记载警情的警情分类。后续,根据所给出的警情分类可以确定由相应的案情分析人员对不同处警警情分类的处警文本进行统计分析处理。因此,对处警文本进行警情分类在接处警过程中是非常重要的。
发明内容
本公开实施例提出了基于支持向量机的处警警情类别确定方法和装置。
第一方面,本公开实施例提供了一种基于支持向量机的处警警情类别确定方法,该方法包括:将待分类处警文本进行切词得到相应的分词序列;基于所得到的分词序列确定待分类处警文本的文本特征向量;对于预设处警警情类别集合中的每个处警警情类别,将文本特征向量输入与该处警警情类别对应的分类模型,得到用于指示待分类处警文本是否属于该处警警情类别的分类结果,其中,与各处警警情类别对应的分类模型是基于支持向量机训练得到的;用预设处警警情类别集合中的各目标处警警情类别生成待分类处警文本对应的处警警情类别集合,其中,分类结果指示待分类处警文本属于目标处警警情类别。
在一些实施例中,预设处警警情类别集合中每个处警警情类别对应的分类模型是通过如下训练步骤预先训练得到的:获取训练样本集合,训练样本包括历史处警文本和对应的标注警情类别集合;对于预设处警警情类别集合中的每个处警警情类别,执行以下分类模型训练操作:将训练样本集合中对应的标注警情类别集合包括该处警警情类别的各训练样本中的历史处警文本对应的文本特征向量确定为该处警警情类别对应的正样本集合;将训练样本集合中对应的标注警情类别集合不包括该处警警情类别的各训练样本中的历史处警文本对应的文本特征向量确定为该处警警情类别对应的负样本集合;基于该处警警情类别对应的正样本集合和负样本集合训练该处警警情类别对应的基于支持向量机的分类模型。
在一些实施例中,基于所得到的分词序列确定待分类处警文本的文本特征向量,包括:对于分词序列中的每个分词,计算该分词的词频-逆文本频率指数TF-IDF,以及将待分类处警文本的文本特征向量中与该分词对应的分量设置为计算得到的该分词的TF-IDF,其中,待分类处警文本的文本特征向量中的各分量分别与预设词典中的各词语一一对应;将待分类处警文本的文本特征向量中的各未赋值分量设置为预设数值,未赋值分量为属于预设词典但不属于分词序列的词语对应的分量。
在一些实施例中,预设处警警情类别集合包括以下至少一项:人员走失类别、火灾类别、精神病人类别。
第二方面,本公开实施例提供了一种基于支持向量机的处警警情类别确定装置,该装置包括:切词单元,被配置成将待分类处警文本进行切词得到相应的分词序列;特征确定单元,被配置成基于所得到的分词序列确定待分类处警文本的文本特征向量;分类单元,被配置成对于预设处警警情类别集合中的每个处警警情类别,将文本特征向量输入与该处警警情类别对应的分类模型,得到用于指示待分类处警文本是否属于该处警警情类别的分类结果,其中,与各处警警情类别对应的分类模型是基于支持向量机训练得到的;生成单元,被配置成用预设处警警情类别集合中的各目标处警警情类别生成待分类处警文本对应的处警警情类别集合,其中,分类结果指示待分类处警文本属于目标处警警情类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明亿科技有限公司,未经北京明亿科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010305573.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:车载显示装置
- 下一篇:基于深度学习模型接处警文本居住地信息提取方法和装置