[发明专利]基于可回溯序列生成方法的事件检测方法和系统有效
申请号: | 202210436226.0 | 申请日: | 2022-04-25 |
公开(公告)号: | CN114548101B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 谢睿;张世琨;叶蔚;习翔宇;杨洋 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/35;G06K9/62;G06N3/04 |
代理公司: | 北京华创智道知识产权代理事务所(普通合伙) 11888 | 代理人: | 周倩 |
地址: | 100091*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 回溯 序列 生成 方法 事件 检测 系统 | ||
1.基于可回溯序列生成方法的事件检测方法,其特征在于,包括:
对作为训练文本的输入句子进行编码;
对编码后的输入句子计算Luong注意力,并根据计算出的注意力权重定位出输入句子中权重最大的单词;
对计算Luong注意力后的输入句子计算其中上下文向量;
根据所述上下文向量,对输入句子进行解码,每时刻解码出一个事件类型的名称;
根据解码结果、输入句子中包含的事件触发词、触发词触发的事件类型和预先定义的目标函数训练模型,得到事件监测模型;
将作为待测文本的输入句子输入所述事件监测模型得到事件检测结果;
其中,将作为待测文本的输入句子输入所述事件监测模型得到事件检测结果包括:
将作为待测文本的输入句子输入训练得到的所述事件监测模型中,采用集束搜索算法确定输入句子中排名最高的预测路径;
通过可回溯注意力分数定位预测路径中出现的事件类型对应的触发词在输入句子中的位置;
将构成一个单词的子单词的注意得分之和作为该单词的注意得分;
设置一个阈值,将每个时刻注意力分数大于阈值的单词作为该时刻解码出的事件类型对应的触发词,从而得到事件检测结果。
2.根据权利要求1所述的基于可回溯序列生成方法的事件检测方法,其特征在于,对作为训练文本的输入句子进行编码为:使用基于BERT和双向LSTM的编码器对输入句子进行编码。
3.根据权利要求2所述的基于可回溯序列生成方法的事件检测方法,其特征在于,对编码后的输入句子计算Luong注意力,并根据计算出的注意力权重定位出输入句子中权重最大的单词为:
Luong注意力机制计算出t时刻对输入句子中第i个单词的初始注意力权重:
;
其中,是输入句子中第i个单词经过编码器输出的隐状态,是输入句子中第j个单词经过编码器输出的隐状态,i代表第i个单词,j代表第j个单词,是输入句子中第t个解码时刻的隐状态,t表示解码器输出的第t个时刻,是一个可学习的参数构成的矩阵;
通过遍历输入句子中每个单词的初始注意力权重,得到注意力权重最大的单词,通过掩码操作将这个单词的注意力权重设置为1,对其他单词的权重设置为0,具体计算如下:
;
其中,是初始注意力权重,是最终的注意力权重,是一个独热掩码向量,用于选择权重最大的单词并过滤其余单词,是逐元素乘法。
4.根据权利要求3所述的基于可回溯序列生成方法的事件检测方法,其特征在于,对计算Luong注意力后的输入句子计算其中上下文向量为:
对于解码器的每个时刻,基于伯努利分布采样一个采样结果m∈{0,1},并执行以下计算:
;
其中,表示真实触发词对应的维度为1的独热向量,表示初始注意力权重最大的单词对应的维度为1的独热向量;在时刻t传递给解码器的最终的上下文向量计算为:
;
其中,为解码器在t时刻对输入句子中第i个单词的注意力权重。
5.根据权利要求4所述的基于可回溯序列生成方法的事件检测方法,其特征在于,根据所述上下文向量,对输入句子进行解码,每时刻解码出一个事件类型的名称为:
使用LSTM作为解码器,解码器在时刻t的隐藏状态的计算过程如下:
;
其中,是t-1时刻所有事件类型上的概率分布,是概率分布中具有最大概率的事件类型,是解码器t-1时刻的隐状态,是t-1时刻传递给解码器的上下文向量;在得到t时刻解码器的隐藏状态和上下文向量后,按照如下公式计算时刻t输出的概率分布:
;
;
其中是可学习的参数;是时刻t下各个事件类型的预测评分,评分越大,是该事件类型的可能性越大;是t时刻所有事件类型上的概率分布,在t时刻的解码出的事件类型的名称为概率分布中概率最大的事件类型的名称。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210436226.0/1.html,转载请声明来源钻瓜专利网。