[发明专利]基于双向交叉注意力机制的汉越新闻事件时序关系识别方法有效
申请号: | 201910613118.4 | 申请日: | 2019-07-09 |
公开(公告)号: | CN110334213B | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 高盛祥;寇梦珂;余正涛;黄于欣;王吉地;王振晗;郭军军 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/951;G06F40/30 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 沈艳尼 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于双向交叉注意力机制的汉越新闻事件时序关系识别方法,属于自然语言处理技术领域。本发明利用双向循环神经网络捕获句子语义信息,通过注意力机制增强事件语义信息中的触发词语义信息,通过交叉注意力机制获得时序逻辑语义信息,将三部分语义信息嵌入为事件编码,最后将事件编码与事件间规则特征融合输入至分类层,输出事件时序关系,进而实现事件时序关系识别。本发明目前事件时序关系识别需要大量人力设计基于时间轴的模板,句中的隐含语义信息难以获取,并且不同语言文本很难表示在同一特征空间下等问题,以及解决了获取跨语言新闻事件时序关系较为困难问题。 | ||
搜索关键词: | 基于 双向 交叉 注意力 机制 新闻 事件 时序 关系 识别 方法 | ||
【主权项】:
1.基于双向交叉注意力机制的汉越新闻事件时序关系识别方法,其特征在于:所述基于双向交叉注意力机制的汉越新闻事件时序关系识别方法的具体步骤如下:Step1、收集用于汉越双语新闻事件时序关系识别的新闻文本,对新闻文本进行去重与筛选;Step2、定制汉越双语新闻事件时序关系识别的标注体系,标记双语新闻文本,将标记好的双语新闻语料进行组对后再分为训练语料、测试语料和验证语料;Step3、获取汉越双语词向量,融合句中汉越双语词向量、位置向量作为双向交叉注意力循环神经网络输入;Step4、采用双向交叉注意力循环神经网络,获取双语新闻的事件编码,训练新闻事件时序关系识别模型。Step5、对需要识别的汉越双语新闻事件句进行编码,之后将提取到事件编码以及事件间规则特征作为分类模型的输入向量,利用softmax分类器获得最终的结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910613118.4/,转载请声明来源钻瓜专利网。