[发明专利]一种通信领域过程类知识事件抽取方法在审
申请号: | 202111045480.X | 申请日: | 2021-09-07 |
公开(公告)号: | CN113779988A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 李飞;周源;万飞;王德玄;夏献军 | 申请(专利权)人: | 科大国创云网科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 合肥昊晟德专利代理事务所(普通合伙) 34153 | 代理人: | 何梓秋 |
地址: | 230088 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通信 领域 过程 知识 事件 抽取 方法 | ||
本发明公开了一种通信领域过程类知识事件抽取方法,属于信息技术领域,包括以下步骤:S1:对通信领域事件抽取问题进行定义,并选择抽取方法;S2:对通信领域过程类知识的数据预处理;S3:构建分层序列标注任务;S4:使用预训练模型和图卷积神经网络获取增强语义表征;S5:使用门控神经单元获取语义表征的长距离语义依赖信息;S6:使用条件随机场对步骤S5中存在的标签偏差问题进行解决;S7:利用基于模型迁移学习和图卷积神经网络的通信领域过程类知识事件抽取模型对事件进行抽取。本发明使用基于模型迁移学习和图卷积神经网络的融合模型实现语义表征提取,且使用门控神经单元获取语义表征的长距离依赖信息,同时使用条件随机场克服标签偏差问题。
技术领域
本发明涉及信息技术领域,具体涉及一种通信领域过程类知识事件抽取方法。
背景技术
近年来,随着自然语言处理技术的飞速发展以及5G技术在通信领域的广泛应用,如何利用自然语言处理技术对通信领域过程类知识进行抽取成为了一个越来越受到关注的问题。通信领域事件抽取旨在从无结构的过程类知识文本中抽取指定的事件属性,是文本结构化的重要步骤之一,也是知识图谱广泛应用的基础。
当前通信领域事件抽取任务普遍面临标注成本过高、标注样例稀少的问题。因此,在较少标注样本条件下实现高质量的事件抽取,对通信领域事件抽取技术的广泛应用具有重要价值。采用基于规则的事件抽取方法,由于语言结构的不确定性,导致制定统一完整的规则难度较大;而传统机器学习又大多基于有监督学习,难以处理事件元素表述多样化和事件元素缺损(漏抽取、文本描述缺损)的问题。为此,提出一种通信领域过程类知识事件抽取方法。
发明内容
本发明所要解决的技术问题在于:如何解决现有通信领域事件抽取技术中存在的制定统一完整的规则难度较大、难以处理事件元素表述多样化和事件元素缺损等问题,提供了一种通信领域过程类知识事件抽取方法,该方法通过对通信运维过程中的“事件”和“事件关系”进行抽取和梳理,可以更直观地呈现通信运维过程中故障发生的逻辑,是后续故障排查和一线处理现网故障的重要先决条件。
本发明是通过以下技术方案解决上述技术问题的,本发明包括以下步骤:
S1:通信领域过程类知识事件抽取的问题定义和方法选择;
S2:对通信领域过程类知识的数据预处理;
S3:构建分层序列标注任务;
S4:使用预训练模型和图卷积神经网络(GCN)获取增强语义表征;
S5:使用门控神经单元(GRU)获取语义表征的长距离语义依赖信息;
S6:使用条件随机场(CRF)克服步骤S5中存在的标签偏差问题;
S7:基于模型迁移学习和图卷积神经网络的通信领域过程类知识事件抽取模型进行数据抽取流程。
更进一步地,所述的步骤S1中的问题定义是指从通信领域事件文本语料中抽取哪些事件元素;在进行需求分析之后,给出事件抽取的问题定义:首先从文本语料中识别是否存在相关的通信领域事件,其次识别出相关事件的涉及元素,最后确定每个元素所扮演的角色。事件抽取的方法选择管道式抽取方法。
更进一步地,所述的步骤S2中的数据预处理指通过数据清洗、数据去重和文本规范化等操作,解决原始人工标注数据存在的数据不规范、特征遗漏和标注错误问题。
更进一步地,所述的步骤S3中分层序列标注是指按照事件类别,基于数据Schema中的事件类型与事件元素,使用程序化手段,将数据划分为结构化的8类30级地址,采用BIO标注策略进行序列标注的任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大国创云网科技有限公司,未经科大国创云网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111045480.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通用型防低温液体肥料及其制备方法
- 下一篇:重组型DNA聚合酶及其应用