[发明专利]融合局部特征与深度学习的事件联合抽取方法有效
申请号: | 201910412962.0 | 申请日: | 2019-05-17 |
公开(公告)号: | CN110134720B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 孔芳;张俊青;周国栋 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06N3/04;G06N3/08 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 曹成俊 |
地址: | 215137 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种融合局部特征与深度学习的事件联合抽取方法。本发明融合局部特征与深度学习的事件联合抽取方法,包括:抽取实体、词性与依存分析,利用PV‑DM模型训练文档向量;学习隐藏特征,进入GCN;再次,识别出事件元素与事件触发之间的记忆单元,帮助识别事件类型与事件论元;最后,使用CRF对最终的事件类型进行标注,全连接层中,用Softmax函数对事件元素进行识别。本发明的有益效果:借助文档向量学习文章中的主旨信息,其次利用图卷积网络挖掘事件之间的联系,最后利用记忆单元与局部特征学习事件类型与事件元素之间的信息,以此完成事件联合抽取,提高其识别性能。 | ||
搜索关键词: | 融合 局部 特征 深度 学习 事件 联合 抽取 方法 | ||
【主权项】:
1.一种融合局部特征与深度学习的事件联合抽取方法,其特征在于,包括:抽取实体、词性与依存分析,利用PV‑DM模型训练文档向量;学习隐藏特征,进入GCN;再次,识别出事件元素与事件触发之间的记忆单元,帮助识别事件类型与事件论元;最后,使用CRF对最终的事件类型进行标注,全连接层中,用Softmax函数对事件元素进行识别;给定语句,W=w1w2...wn,语句中实体E=e1e2...ek,在事件抽取中,对于语句中每个词wi,判断是否为触发词,若是,再对其分配相应的事件类型,并且对候选实体分配相应的语义角色;表示层:输入向量X主要由四部分拼接组成:W中wi词向量、W中wi的词性向量、E中ej的实体向量和W的文档向量;文档向量由公式3.1所得。
Bi‑LSTM层:对于输入向量X,经过双向LSTM模型编码得到隐藏向量h;图卷积网络层:先利用StanfordCoreNLP获取事件间的依存联系,利用GCN(图卷积网络)处理依存数据;依存联系考察成图数据结构G=(V,ε),节点vi为每个词,边(vi,vj)∈ε,为了减少训练参数,定义边总共有三种类型:正向、反向、环;h为GCN的第一层输入向量,则最终的输出向量最终的输出向量
由公式3.2、公式3.3、公式3.4和公式3.5得到。![]()
![]()
![]()
其中,WH、bH、WT、bT、
和
为相应的权重与偏置,Θ为元素积,σ为Sigmoid函数,K(vi,vj)为边的类型;记忆单元:采用的记忆单元为Gi,处理事件子类型与事件元素之间的联系;事件类型预测:对于词wi,预测该词是否为某类事件类型的触发词,最终隐藏层特征表示有以下两部分向量组成:·
GCN的输出向量。·Gi‑1[:][t]T:先前步骤中的记忆事件触发词与事件元素之间联系。通过拼接步骤,得到特征表示
然后进入CRF层,得到其概率
最大化事件类型即为该事件类型,
由公式3.6所得。
其中,
by,by′为相应的权重与偏差。事件元素预测:对于事件元素预测阶段,首先检查该语句是否为事件句,即触发词已被识别出来。如果,不为事件句,跳过,继续下一个语句的事件元素检测;否则,对于事件句中每个实体进行事件元素的预测。最终隐藏层表示有以下三部分组成:·
GCN的输出向量。·
事件元素相关局部特征,如表5所示。·Gi[j]:先前步骤中的记忆事件元素与事件触发词之间联系。通过拼接步骤,得到特征表示
事件元素的预测通过全连接层得到,如公式3.7,公式3.8所示。![]()
其中,Wj、bj为相应的参数和偏置。表5局部特征![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910412962.0/,转载请声明来源钻瓜专利网。