[发明专利]一种基于深度神经模型的档案归档计算方法有效
申请号: | 202210733037.X | 申请日: | 2022-06-27 |
公开(公告)号: | CN115329169B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 李金讯;王庭军;林树鸿;颜清 | 申请(专利权)人: | 海南电网有限责任公司信息通信分公司 |
主分类号: | G06F16/93 | 分类号: | G06F16/93;G06F16/35;G06F16/11;G06F16/172;G06N3/0442;G06N3/045;G06N3/0464;G06N3/047;G06N3/048;G06N3/084 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 颜希文 |
地址: | 570100 海南省海口市美兰区海府路*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 神经 模型 档案 归档 计算方法 | ||
1.一种基于深度神经模型的档案归档计算方法,其特征在于,包括下列步骤:
针对所收到的项目文档集合,依次提取所述项目文档集合中任一文档的名称信息,获得文档名称信息,根据所述文档名称信息进行分类,输出与所述文档名称信息对应的标准名称,将文档名称信息与标准名称进行对比检验,若对比校验通过,使用所述文档名称信息对前述文档进行标记;
若对比检验不通过,提取前述文档中的内容信息,根据所述内容信息进行分类,输出与内容信息对应的标准名称,并使用与内容信息对应的标准名称对前述文档进行标记;
对所述项目文档集合中的所有文档依次进行标记,获得多个标准名称,根据所述标准名称的数量以及含义,对项目文档集合进行完整性检查,对通过完整性检查的项目文档集合进行存储,并生成归档信息。
2.根据权利要求1所述的一种基于深度神经模型的档案归档计算方法,其特征在于,通过第一BiLSTM+CNN组合模型对所述文档名称信息进行分类,通过第二BiLSTM+CNN组合模型对所述内容信息进行分类。
3.根据权利要求2所述的一种基于深度神经模型的档案归档计算方法,其特征在于,在使用第一BiLSTM+CNN组合模型以及第二BiLSTM+CNN组合模型进行分类前,还分别对所述第一BiLSTM+CNN组合模型以及第二BiLSTM+CNN组合模型进行训练,其训练的具体过程为:
随机初始化模型的参数,设置模型批处理数据量batchsize大小和迭代次数epochs;
将字向量表示的句子输入到BiLSTM网络中,获得经BiLSTM提取的句子特征矩阵;
将所述句子特征矩阵输入到TextCNN模型中,进行文本特征的二次提取;
将所述TextCNN模型的文本特征的二次提取结果输入到全连接网络层和SoftMax层中获得文本的分类结果;
经由代价函数计算模型中参数的梯度,进行反向传播,更新参数值,直至满足设定的epochs次数止。
4.根据权利要求3所述的一种基于深度神经模型的档案归档计算方法,其特征在于,将文档名称信息与标准名称进行对比检验,若对比校验通过,使用所述文档名称信息对前述文档进行标记,具体包括:将文档名称信息表示成连续的第一数值向量,将对应的标准名称表示成连续的第二数值向量,计算第一数值向量与所述第二数值向量之间的余弦距离或者欧式距离,根据余弦距离或者欧式距离判断所述文档名称信息是否与对应的标准名称存在差异,若不存在差异,则使用文档名称信息对前述文档进行标记。
5.根据权利要求3所述的一种基于深度神经模型的档案归档计算方法,其特征在于,提取前述文档中的内容信息,根据所述内容信息进行分类,输出与内容信息对应的标准名称,具体包括:提取前述文档中的标题信息,所述标题信息包括主标题、一级标题、二级标题以及三级标题;将所述标题信息输入第二BiLSTM+CNN组合模型,根据标题信息的语义特征进行分类,获得对应的标准名称。
6.根据权利要求5所述的一种基于深度神经模型的档案归档计算方法,其特征在于,将所述主标题表示成连续的第三数值向量,将与内容信息对应的标准名称表示成连续的第四数值向量,计算第三数值向量与所述第四数值向量之间的余弦距离或者欧式距离,若余弦距离或者欧式距离小于阈值,则使用与内容信息对应的标准名称对前述文档进行标记。
7.根据权利要求1-6任一项所述的一种基于深度神经模型的档案归档计算方法,其特征在于,根据所述标准名称的数量以及含义,对项目文档集合进行完整性检查,具体包括:建立校验库,所述校验库中设有科技项目子库、信息化项目子库以及工程项目子库,所述科技项目子库、信息化项目子库以及工程项目子库中均包含多个校验名称,将所述校验库中的校验名称与通过所述项目文档集合获得的标准名称依次与进行字符对比,若校验名称与通过所述项目文档集合获得的所有标准名称均能一一对应,则所述项目文档集合通过完整性校验。
8.根据权利要求1所述的一种基于深度神经模型的档案归档计算方法,其特征在于,所述归档信息包括所述项目文档集合的存储地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南电网有限责任公司信息通信分公司,未经海南电网有限责任公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210733037.X/1.html,转载请声明来源钻瓜专利网。