[发明专利]一种通信领域过程类知识事件抽取方法在审
申请号: | 202111045480.X | 申请日: | 2021-09-07 |
公开(公告)号: | CN113779988A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 李飞;周源;万飞;王德玄;夏献军 | 申请(专利权)人: | 科大国创云网科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 合肥昊晟德专利代理事务所(普通合伙) 34153 | 代理人: | 何梓秋 |
地址: | 230088 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通信 领域 过程 知识 事件 抽取 方法 | ||
1.一种通信领域过程类知识事件抽取方法,其特征在于,包括以下步骤:
S1:对通信领域事件抽取问题进行定义,并选择抽取方法;
S2:对通信领域过程类知识的数据预处理;
S3:构建分层序列标注任务;
S4:使用预训练模型和图卷积神经网络获取增强语义表征;
S5:使用门控神经单元获取语义表征的长距离语义依赖信息;
S6:使用条件随机场对步骤S5中存在的标签偏差问题进行解决;
S7:利用基于模型迁移学习和图卷积神经网络的通信领域过程类知识事件抽取模型对事件进行抽取,得到通信领域过程类知识事件抽取的预测结果。
2.根据权利要求1所述的一种通信领域过程类知识事件抽取方法,其特征在于:在所述步骤S1中,对通信领域事件抽取问题进行定义的具体过程如下:
S11:从文本语料中识别是否存在相关的通信领域事件;
S12:识别出相关事件的涉及元素;
S13:确定每个元素所扮演的角色。
3.根据权利要求1所述的一种通信领域过程类知识事件抽取方法,其特征在于:在所述步骤S1中,事件抽取的方法选择管道式抽取方法,采用管道式抽取方法,对事件触发词和事件元素分别单独建模,依次抽取出事件所包含的触发词和事件元素。
4.根据权利要求1所述的一种通信领域过程类知识事件抽取方法,其特征在于:在所述步骤S2中,数据预处理的过程具体如下:
S21:数据清洗
对于标注的通信领域知识抽取语料文本中存在的部分明显标注错误数据,直接弃用这部分数据;
S22:数据去重
对于在一定时间内对同一设备状态进行记录而产生的重复数据,执行去重操作;
S23:文本规范化
对于样本数据中存在的文本和符号全半角不统一的情况,将其处理成统一格式。
5.根据权利要求1所述的一种通信领域过程类知识事件抽取方法,其特征在于:在所述步骤S3中,分层序列标注是指按照事件类别,基于数据Schema中的事件类型与事件元素,将数据划分为结构化的8类30级地址,采用BIO标注策略进行序列标注的任务。
6.根据权利要求5所述的一种通信领域过程类知识事件抽取方法,其特征在于:所述BIO标注策略中的B表示事件元素的开始,I表示事件元素的中间或结尾词,O表示无关词。
7.根据权利要求1所述的一种通信领域过程类知识事件抽取方法,其特征在于:所述步骤S4的具体过程如下:
S41:使用预训练模型获取语料文本的语义表征;
S42:将语料文本中的事件触发词和事件元素视为节点,每条语料中的节点存在相邻边关系,构造动态网络拓扑图;通过消息传递机制将每一个节点自身的特征信息经过变换后发送给邻居节点,实现对节点特征信息的抽取变换,再通过消息接收机制将每个目标节点周围邻居节点的传递信息进行聚合:
其中,A表示目标节点的邻接矩阵,D表示目标节点的度矩阵,H(l)为第l层的节点语义表征,H(l+1)为第l+1层的节点语义表征,W(l)为第l层目标节点的特征权重矩阵,σ为Sigmoid激活函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大国创云网科技有限公司,未经科大国创云网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111045480.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通用型防低温液体肥料及其制备方法
- 下一篇:重组型DNA聚合酶及其应用