[发明专利]一种岩土工程命名实体类别序列获得系统在审

专利信息
申请号: 202211241376.2 申请日: 2022-10-11
公开(公告)号: CN115659975A 公开(公告)日: 2023-01-31
发明(设计)人: 王权于;陈冠宇;许志坚;胡君;吕国斌;陈嘉麒 申请(专利权)人: 中国地质大学(武汉)
主分类号: G06F40/295 分类号: G06F40/295;G06F40/253;G06F40/30;G06N3/0442;G06N3/0455;G06N3/048;G06N3/096
代理公司: 北京知联天下知识产权代理事务所(普通合伙) 11594 代理人: 孔凡梅
地址: 430074 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 岩土 工程 命名 实体 类别 序列 获得 系统
【说明书】:

发明公开了一种岩土工程命名实体类别序列获得系统,所述系统包括:所述第一模块,用于获得针对所述岩土工程文本的符号序列,并根据所述符号序列获得字嵌入向量列表;所述第一模块包括:第一单元和第二单元,所述第一单元为岩土工程文本命名实体识别标注语料库,所述第二单元为预训练语言模块;所述第二模块,用于获得所述字嵌入向量列表,并根据所述字嵌入向量列表获得标签向量列表;所述第三模块,用于获得所述标签向量列表,并根据所述标签向量列表获得命名实体类别序列。本发明通过建立岩土工程命名实体识别标注语料库,并结合三个模块中运用的模型特点,生成了一种便于获取岩土工程命名实体类别序列的系统。

技术领域

本发明涉及命名实体识别技术领域,尤其涉及一种岩土工程命名实体类别序列获得系统及方法。

背景技术

目前岩土工程相关数据主要是大量勘察、设计报告等非结构化电子文档,这类数据无法进行数据挖掘、数据融合等深层分析,也难以实时快速检索需要的关键信息,不能满足工程方面的管理、防治、预测、预警等智能管控要求,不能达到当前大数据快速响应的要求。如何从这些海量文本数据中获取信息是数据分析的重要挑战。

信息抽取是从自然语言文本中抽取指定类型的实体、关系、事件等事实信息,并形成结构化数据输出的文本处理技术,命名实体识别是实现岩土工程文本信息抽取的基础。对于特定领域命名实体识别,早期基于词典和规则的命名实体识别方法存在着诸多问题。随着深度学习技术的不断发展,基于深度学习的命名实体识别方法开始得到学界的广泛关注,大量科研成果不断涌现。

由于岩土工程文本在内容、术语和行文等方面具有较强领域特性,且缺乏训练模型所需的领域语料库,目前面向岩土工程文本中文命名实体识别的研究工作还较少。本发明是基于上述问题提出的解决方法,提出了岩土工程命名实体识别标注语料库的构建方法,结合BERT模型(Bidirectional Encoder Representation from Transformers,双向编码器)、BiGRU模型(Bidirectional Gated Recurrent Unit,双向门控循环单元)、CRF模型(conditional random field,条件随机场)基本模型特点,提出了一种基于BERT预训练语言模型的岩土工程文本命名实体识别模型GENER(Geotechnical Engineering NamedEntity Recognition,岩土工程命名实体识别)。

发明内容

本发明目的在于提供一种岩土工程命名实体类别序列获得系统及方法,用于解决由于岩土工程文本在内容、术语和行文等方面具有较强领域特性,且缺乏训练模型所需的领域语料库等问题。

为实现上述目的,本发明提供如下技术方案:一种岩土工程命名实体类别序列获得系统,所述系统包括:

所述第一模块,用于获得针对所述岩土工程文本的符号序列,并根据所述符号序列获得字嵌入向量列表;所述第一模块包括:第一单元和第二单元,所述第一单元为岩土工程文本命名实体识别标注语料库,所述第二单元为预训练语言模块单元;

所述第二模块,用于获得所述字嵌入向量列表,并根据所述字嵌入向量列表获得标签向量列表;

所述第三模块,用于获得所述标签向量列表,并根据所述标签向量列表获得命名实体类别序列。

可选的,获得所述第一单元,包括:

获得针对岩土工程文本的语料,并根据所述语料获得第一语料库;

对所述第一语料库进行预处理,获得第二语料库;

对所述第二语料库进行预标注,获得第三语料库;

对所述第三语料库进行复查,获得第四语料库,并将所述第四语料库作为所述第一单元。

可选的,所述系统还包括:文本预处理模块,所述文本预处理模块用于生成针对所述岩土工程文本的符号序列。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211241376.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top