[发明专利]一种基于问答模式的事件抽取方法、装置和设备在审
| 申请号: | 202210323185.4 | 申请日: | 2022-03-30 |
| 公开(公告)号: | CN114661881A | 公开(公告)日: | 2022-06-24 |
| 发明(设计)人: | 李晓宇;孙显;金力;张泽群;李树超;康瀚锟 | 申请(专利权)人: | 中国科学院空天信息创新研究院 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/216;G06F40/289;G06F40/35;G06K9/62 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘翠香 |
| 地址: | 100094*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 问答 模式 事件 抽取 方法 装置 设备 | ||
1.一种基于问答模式的事件抽取方法,其特征在于,包括:
获取目标文本和第一问题模板,其中,所述第一问题模板为对所述目标文本所涉及的目标事件的触发词进行提问的文本;
从所述目标文本中确定与所述目标事件相关的特征词;
根据所述目标文本、所述第一问题模板和所述特征词,确定所述目标事件的触发词和事件类型;
根据所述目标事件的事件类型,从预设的问题模板集合中确定所述目标事件的论元匹配的问题模板,作为第二问题模板,其中,所述第二问题模板为针对所述目标事件的论元进行提问的文本;
根据所述目标文本、所述第二问题模板和所述特征词,确定所述目标事件的论元和论元类型;
根据所述触发词、所述事件类型、所述论元和所述论元类型,确定所述目标文本的事件抽取结果。
2.根据权利要求1所述的基于问答模式的事件抽取方法,其特征在于,所述根据所述目标文本、所述第一问题模板和所述特征词,确定所述目标事件的触发词和事件类型,包括:
将所述特征词转换为向量形式,转换得到的向量作为目标文法特征向量;
利用预先训练得到的触发词抽取模型处理所述第一问题模板、所述目标文本和所述目标文法特征向量,得到所述触发词抽取模型输出的触发词标签序列,其中,所述触发词抽取模型采用所述第一问题模板、训练文本、所述训练文本对应的触发词标注序列,同时辅以对应的文法特征向量训练得到,所述对应的文法特征向量通过将所述训练文本所涉及的事件相关的特征词转换为向量形式得到;
根据所述触发词标签序列,确定所述目标事件的触发词和事件类型。
3.根据权利要求2所述的基于问答模式的事件抽取方法,其特征在于,所述触发词抽取模型包括:第一词嵌入模块、第一特征融合模块、第一分类器模块和第一序列搜索模块;
所述第一词嵌入模块对所述第一问题模板和所述目标文本进行编码,得到编码出的语义特征向量,作为第一语义特征向量;
所述第一特征融合模块对所述第一语义特征向量和所述目标文法特征向量进行非线性融合,得到第一融合特征向量;
所述第一分类器模块根据所述第一融合特征向量和归一化指数函数,确定所述目标文本的每个词在各个触发词标签上的概率值;
所述第一序列搜索模块根据所述目标文本的每个词在各个触发词标签上的概率值和随机初始化的状态转移矩阵,采用维特比算法确定所述触发词标签序列。
4.根据权利要求3所述的基于问答模式的事件抽取方法,其特征在于,所述第一词嵌入模块对所述第一问题模板和所述目标文本进行编码,得到编码出的语义特征向量,包括:
所述第一词嵌入模块将所述第一问题模板和所述目标文本进行拼接,得到第一拼接后文本;
所述第一词嵌入模块对所述第一拼接后文本进行第一分词处理,得到所述第一拼接后文本对应的数字索引序列、分割标记和掩码序列,其中,所述第一拼接后文本对应的数字索引序列中包括所述第一拼接后文本的每个词对应的数字索引和特殊字对应的数字索引,所述特殊字用于将所述拼接后文本补齐为设定长度,所述第一拼接后文本对应的分割标记用于区分所述第一拼接后文本包含的所述第一问题模板和所述目标文本,所述第一拼接后文本对应的掩码序列用于区分所述第一拼接后文本的每个词对应的数字索引和所述特殊字对应的数字索引;
所述第一词嵌入模块通过目标编码器对所述第一拼接后文本对应的数字索引序列、分割标记和掩码序列进行编码,得到所述第一语义特征向量。
5.根据权利要求3所述的基于问答模式的事件抽取方法,其特征在于,所述第一特征融合模块对所述第一语义特征向量和所述目标文法特征向量进行非线性融合,得到第一融合特征向量,包括:
所述第一特征融合模块将所述第一语义特征向量和所述目标文法特征向量进行拼接,得到第一拼接后向量;
所述第一特征融合模块根据目标激活函数和所述第一拼接后向量,得到所述第一融合特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院空天信息创新研究院,未经中国科学院空天信息创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210323185.4/1.html,转载请声明来源钻瓜专利网。





