[发明专利]事件信息的抽取方法及装置、存储介质、电子设备在审
| 申请号: | 202011461123.7 | 申请日: | 2020-12-11 |
| 公开(公告)号: | CN112580328A | 公开(公告)日: | 2021-03-30 |
| 发明(设计)人: | 王硕;杨康;徐成国;周星杰 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/211;G06N3/04;G06K9/00 |
| 代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 蔡良伟 |
| 地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 事件 信息 抽取 方法 装置 存储 介质 电子设备 | ||
1.一种事件信息的抽取方法,其特征在于,包括:
获取非结构化文本中事件元素的文本特征,以及获取多个事件元素之间的句法依赖关系,其中,所述事件元素包括事件触发词和事件论元;
以所述文本特征和句法依赖关系为输入信息,采用图注意力网络GAT编码所述非结构化文本的图结构特征;
将所述图结构特征输入全连接层映射到样本空间,并采用Softmax将所述图结构特征映射到所述事件元素的类别标签。
2.根据权利要求1所述的方法,其特征在于,获取非结构化文本中事件元素的文本特征包括:
采用BERT模型的中间M个连续隐藏层提取所述事件元素的特征向量,其中,M为大于1的整数;
采用多尺度卷积神经网络CNN提取所述特征向量的局部特征。
3.根据权利要求2所述的方法,其特征在于,采用多尺度CNN提取所述特征向量的局部特征包括:
采用尺度为1*1,3*3,5*5的CNN卷积核从所述特征向量中提取不同尺度下文本的n-gram特征,其中,所述多尺度CNN的激活函数为线性整流函数ReLU。
4.根据权利要求1所述的方法,其特征在于,获取多个事件元素之间的句法依赖关系特征包括:
采用StandFordNLP进行依存句法分析,解析所述非结构化文本中词语与词语之间的句法依赖关系,其中,所述句法依赖关系用于表征两个事件元素之间的有向依赖关系;
采用有向图的邻接矩阵存储所述两个事件元素之间的句法依赖关系。
5.根据权利要求1所述的方法,其特征在于,采用图注意力网络GAT编码所述非结构化文本的图结构特征包括:
对于句法依存树中每个顶点词,计算与其句法依存关系相邻顶点的注意力因子,其中,所述非结构化文本中句法依赖关系表示为句法依存树;
对注意力因子进行归一化处理,得到注意力系数,采用所述注意力系数对文本特征进行加权求和,得到每个顶点词的注意力向量。
6.根据权利要求1所述的方法,其特征在于,采用图注意力网络GAT编码所述非结构化文本的图结构特征包括:
依据所述非结构化文本的复杂度,将GAT网络堆叠为n层,其中,每层对应一个子GAT网络,层数与所述复杂度呈正相关;
采用前n-1层GAT网络计算所述非结构化文本的中间注意力特征,将n-1个子GAT网络的中间注意力特征的平均值输入最后一层GAT网络,输出所述非结构化文本的图结构特征。
7.根据权利要求1所述的方法,其特征在于,将所述图结构特征映射为所述事件元素的类别标签包括:
将所述图结构特征输入全连接层将其映射到样本空间,并采用softmax将所述图结构特征映射到相应事件元素的类别标签,其中,所述全连接层所在的网络模型采用交叉熵损失函数进行损失计算,并采用L2正则防止过拟合。
8.一种事件信息的抽取装置,其特征在于,包括:
获取模块,用于获取非结构化文本中事件元素的文本特征,以及获取多个事件元素之间的句法依赖关系,其中,所述事件元素包括事件触发词和事件论元;
处理模块,用于以所述文本特征和句法依赖关系为输入信息,采用图注意力网络GAT编码所述非结构化文本的图结构特征;
映射模块,用于将所述图结构特征输入全连接层映射到样本空间,并采用Softmax将所述图结构特征映射到所述事件元素的类别标签。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7中任一项所述的方法步骤。
10.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:
存储器,用于存放计算机程序;
处理器,用于通过运行存储器上所存放的程序来执行权利要求1至7中任一项所述的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011461123.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种医用风湿关节处热敷装置
- 下一篇:一种扣把组装设备
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





