[发明专利]案件分类方法、装置、计算机设备及存储介质在审
申请号: | 202210373762.0 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114780724A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 陈晓红;胡东滨;付震坤;梁伟;曹文治 | 申请(专利权)人: | 湖南工商大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06N3/04;G06N3/08;G06Q50/18 |
代理公司: | 深圳众鼎汇成知识产权代理有限公司 44566 | 代理人: | 朱业刚 |
地址: | 410205 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 案件 分类 方法 装置 计算机 设备 存储 介质 | ||
1.一种案件分类方法,其特征在于,所述案件分类方法包括:
获取待预测案件数据;
将所述待预测案件数据输入ERNIE-CNN分类模型,其中,所述ERNIE-CNN分类模型是指基于ERNIE算法对案件进行分类的模型,所述ERNIE-CNN分类模型包括CNN层;
基于所述ERNIE-CNN分类模型,对所述待预测案件数据进行文本向量化,得到词向量矩阵;
基于所述CNN层,对所述词向量矩阵进行局部特征提取,得到局部特征矩阵;
基于所述ERNIE-CNN分类模型的全连接层,对所述局部特征矩阵进行全连接和分类处理,得到所述待预测案件数据对应的分类结果。
2.如权利要求1所述的案件分类方法,其特征在于,所述获取待预测案件数据的步骤包括:
获取案件文档和所述案件文档对应的文本模板;
基于预设的要素抽取方式,对所述文本模板进行要素抽取,得到抽取规则;
基于所述抽取规则,对所述案件文档进行字段提取,得到关键字段;
对所述关键字段进行预处理,得到待预测案件数据。
3.如权利要求1所述的案件分类方法,其特征在于,所述基于所述ERNIE-CNN分类模型的全连接层,对所述局部特征矩阵进行全连接和分类处理,得到所述待预测案件数据对应的分类结果的步骤包括:
将所述局部特征矩阵依次输入所述ERNIE-CNN分类模型的dropout层和全连接层;
基于所述ERNIE-CNN分类模型的dropout层和全连接层,对所述局部特征矩阵进行全连接和分类处理,得到所述待预测案件数据对应的分类结果。
4.如权利要求1至3任一项所述的案件分类方法,其特征在于,在所述将所述待预测案件数据输入ERNIE-CNN分类模型之前,所述方法还包括:
基于DiceLoss损失函数,训练ERNIE-CNN分类模型;
按照以下公式计算所述DiceLoss损失函数:
其中,|A|表示样本预测值中元素的个数,|B|表示样本真实值中元素的个数,|A∩B|表示样本预测值和样本真实值之间的共同元素。
5.一种案件分类装置,其特征在于,所述案件分类装置包括:
数据获取模块,用于获取待预测案件数据;
输入模块,用于将所述待预测案件数据输入ERNIE-CNN分类模型,其中,所述ERNIE-CNN分类模型是指基于ERNIE算法对案件进行分类的模型,所述ERNIE-CNN分类模型包括CNN层;
文本向量化模块,用于基于所述ERNIE-CNN分类模型,对所述待预测案件数据进行文本向量化,得到词向量矩阵;
特征提取模块,用于基于所述CNN层,对所述词向量矩阵进行局部特征提取,得到局部特征矩阵;
分类结果获取模块,用于基于所述ERNIE-CNN分类模型的全连接层,对所述局部特征矩阵进行全连接和分类处理,得到所述待预测案件数据对应的分类结果。
6.如权利要求1所述的案件分类装置,其特征在于,所述数据获取模块包括:
案件文档获取单元,用于获取案件文档和所述案件文档对应的文本模板;
抽取规则获取单元,用于基于预设的要素抽取方式,对所述文本模板进行要素抽取,得到抽取规则;
关键字段获取单元,用于基于所述抽取规则,对所述案件文档进行字段提取,得到关键字段;
预处理单元,用于对所述关键字段进行预处理,得到待预测案件数据。
7.如权利要求1所述的案件分类装置,其特征在于,所述分类结果获取模块包括:
输入单元,用于将所述局部特征矩阵依次输入所述ERNIE-CNN分类模型的dropout层和全连接层;
分类单元,用于基于所述ERNIE-CNN分类模型的dropout层和全连接层,对所述局部特征矩阵进行全连接和分类处理,得到所述待预测案件数据对应的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南工商大学,未经湖南工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210373762.0/1.html,转载请声明来源钻瓜专利网。