[发明专利]一种基于自然语言理解的工伤认定研判方法在审
| 申请号: | 202210741705.3 | 申请日: | 2022-06-28 |
| 公开(公告)号: | CN115344595A | 公开(公告)日: | 2022-11-15 |
| 发明(设计)人: | 王龙;韩涛;尹向华;张帅;王保昌;刘鑫;梁永锋;肖培栋;张雯;徐向超 | 申请(专利权)人: | 青岛市人力资源发展研究与促进中心;万达信息股份有限公司 |
| 主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/22;G06F16/25;G06N3/04;G06N3/08 |
| 代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
| 地址: | 266072 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 自然语言 理解 工伤 认定 研判 方法 | ||
1.一种基于自然语言理解的工伤认定研判方法,其特征在于,包括以下步骤:
步骤1、数据信息采集:
采集以往有关工伤认定的相关数据,包括工伤发生情况信息、工伤认定结果信息以及工伤认定法律依据信息;
构建工伤认定信息数据库,将工伤发生情况信息、工伤认定结果信息、工伤认定法律依据信息分别以数据表的形式存入该工伤认定信息数据库中;
同时,通过对伤认定法律依据信息的整理,形成关于相关法律中每个法律条款对应典型案例的法律条款案例库;
步骤2、数据信息处理:针对工伤认定信息数据库中的结构化数据进行数据预处理、无关字段删除和特征选择,具体包括以下内容:
数据预处理:将工伤认定法律依据信息转换为数值型数据,根据数据的统计结果将相关法律中的所有法律条款转化为n个分类,并将其形式转化为one-hot形式;对工伤认定信息数据库中每行数据存在缺失值的数据样本进行删除处理;
无关字段删除:删除工伤发生情况信息中存在的无意义字符;
信息顺序转换:根据文本规律对工伤发生情况信息中的文本信息顺序进行转换,将诊断信息提到工伤发生情况信息的文本开头;
信息文本形式转化为向量形式:将工伤发生情况信息按照字粒度进行分割,之后通过字-标号字典将文本信息从文本形式转换为向量形式;
步骤3、构建工伤认定与工伤法律依据模型,具体包括以下内容:
工伤认定与工伤法律依据模型的输入为工伤发生情况信息,数据对应的的输入尺寸为nmax×m,其中,nmax为非结构化数据中长文本包含的最大词汇个数,m为数据特征种类数;
工伤认定与工伤法律依据模型由两个分类模型和一个检索模型构成,其中,两个分类模型分别为工伤认定模型以及工伤认定法律依据模型,检索模型为基于匹配的检索模型;
分类模型包括信息抽取部分,工伤发生情况信息输入信息抽取部分后,由信息抽取部分提取语句特征信息,两个分类模型的信息抽取部分均采用BERT模型实现;
在工伤认定模型中,通过BERT模型得到的语句特征信息通过一个全连接层得到一个1维的向量之后,再通过sigmoid函数将向量转化为0、1向量,0代表不认定为工伤,1代表认定为工伤;
与此同时,工伤发生情况信息同步输入工伤认定法律依据模型,在工伤认定法律依据模型中,通过BERT模型得到语句特征信息后,该语句特征信息再通过一个全连接层得到一个n维的向量;随后,工伤认定法律依据模型通过softmax激活函数将n维的向量转化n维的概率表示;最后,工伤认定法律依据模型基于所得到的概率获得对应的法律依据条款;
检索模型根据工伤认定法律依据模型得到的法律依据条款,在法律条款案例库中搜索标准案例;
步骤4、模型训练,包括以下步骤:
步骤401、初始化步骤3所构建的工伤认定与工伤法律依据模型的模型参数;
步骤402、采用交叉熵函数作为损失函数,通过随机梯度下降算法,利用经过数据信息处理的工伤认定信息数据库中的样本数据训练整个网络;
训练时,从工伤认定信息数据库中获取样本集,将样本集按照7:3的比例划分为训练集和测试集;利用步骤2所述的数据信息处理方法对训练集和测试集中数据进行处理。使用训练集数据对工伤认定与工伤法律依据模型进行训练,然后使用测试集数据进行模型测试。若测试准确率达到既定准确率P0,则保存该模型;反之,则加大样本集中样本数据的个数,再次对工伤认定与工伤法律依据模型进行训练,直到准确率满足条件,保存模型;
在训练过程中,工伤认定模型和工伤认定法律依据模型相互独立进行训练。
步骤5、模型结果展示:
对新增的工伤发生情况信息,按照步骤2所述的数据信息处理方法进行处理得到与训练样本一致的数据格式后,再输入训练后的工伤认定与工伤法律依据模型,计算获得输出结果。若工伤认定模型输出为1,则认定为结果为工伤,输出工伤认定,同时使用工伤认定法律依据模型得出工伤结果认定法律依据,之后通过检索模型搜索法律条款案例库得到相识案例之后同步输出法律依据和相似案例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛市人力资源发展研究与促进中心;万达信息股份有限公司,未经青岛市人力资源发展研究与促进中心;万达信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210741705.3/1.html,转载请声明来源钻瓜专利网。





