[发明专利]一种事件检测方法、系统、电子设备及存储介质在审

专利信息
申请号: 202111054114.0 申请日: 2021-09-09
公开(公告)号: CN113761132A 公开(公告)日: 2021-12-07
发明(设计)人: 付骁弈;吴信东 申请(专利权)人: 上海明略人工智能(集团)有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F16/36;G06F40/279;G06N3/04;G06N3/08;G06N20/00
代理公司: 青岛清泰联信知识产权代理有限公司 37256 代理人: 魏炜
地址: 200030 上海市徐汇区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 事件 检测 方法 系统 电子设备 存储 介质
【说明书】:

发明提出一种事件检测方法、系统、电子设备及存储介质,其方法技术方案包括对一待检测文本进行分句后得到待检测样本,进一步获取待检测样本的字符嵌入和POS嵌入,并进一步获取待检测样本每隔一个候选跨度的左边界与右边界的字符嵌入,将字符嵌入、POS嵌入和左边界与右边界的字符嵌入拼接形成每个候选跨度的候选跨度嵌入;根据候选跨度嵌入通过共享注意力机制的方法计算待检测样本中候选跨度之间的交互作用的共享注意力机制表征;根据共享注意力机制表征和待检测样本完成打分和模型的训练,并通过训练完的模型进行事件检测。本申请解决了现有方法易错误判断、易抽取不完整的事件简称或难以规模化的问题。

技术领域

本发明属于机器学习技术领域,尤其涉及一种事件检测方法、系统、电子设备及存储介质。

背景技术

事件(触发词)检测和参与事件主客体的识别是金融、工业故障等领域常见并且困难的任务。使用语法规则、统计机器学习等方法在该任务上面临这诸多问题。现有技术包括基于语法规则的模型和基于统计机器学习的模型,但是,现有技术对于同一个事件中存在两个或者以上动词时(例如:“这种机械能量释放破坏了包裹的完整性”),现有的基于语法规则的模型容易错误地判断哪一个是正确的触发词,或者将两者都作为触发词;对于同一个事件中存在两个或者以上参与主体并被连词分隔开时(例如:“使飞机左转,导致前轮和右主起落架支柱坍塌”),现有的基于语法规则的模型容易抽取不完整的事件简称(例如将“前轮”或者“右主起落架”中的后者遗漏);基于统计机器学习的模型,虽然相比较规则模型可以通过精确的标注方法缓解上述缺点中提到的问题,但是往往需要手工设计特征,并且模型效果受制于特征工程的水平,难以规模化地扩展到对不同事件类型检测的任务上。

发明内容

本申请实施例提供了一种事件检测方法、系统、电子设备及存储介质,以至少解决现有方法易错误判断、易抽取不完整的事件简称或难以规模化的问题。

第一方面,本申请实施例提供了一种事件检测方法,包括:跨度嵌入计算步骤,对一待检测文本进行分句后得到待检测样本,进一步获取所述待检测样本的字符嵌入和POS嵌入,并进一步获取所述待检测样本每隔一个候选跨度的左边界与右边界的字符嵌入,将所述字符嵌入、所述POS嵌入和所述左边界与右边界的字符嵌入拼接形成每个所述候选跨度的候选跨度嵌入;注意力机制计算步骤,根据所述候选跨度嵌入通过共享注意力机制的方法计算所述待检测样本中所述候选跨度之间的交互作用的共享注意力机制表征;模型训练实施步骤,根据所述共享注意力机制表征和所述待检测样本完成打分和模型的训练,并通过训练完的所述模型进行事件检测。

优选的,所述注意力机制计算步骤进一步包括:根据所述候选跨度嵌入和跨度嵌入的维度尺寸、训练参数矩阵计算所述共享注意力机制表征。

优选的,所述模型训练实施步骤进一步包括:采用k层标准的前馈神经网络计算得到跨度评分。

优选的,所述模型训练实施步骤进一步包括:使用随机初始化的模型参数进行跨度打分函数的估算,将预测结果与样本集上正负例的交叉熵作为损失函数,通过反向传播迭代地进行模型参数的更新,直到训练误差达到可以接受的范围时停止训练。

第二方面,本申请实施例提供了一种事件检测系统,适用于上述一种事件检测方法,包括:跨度嵌入计算模块,对一待检测文本进行分句后得到待检测样本,进一步获取所述待检测样本的字符嵌入和POS嵌入,并进一步获取所述待检测样本每隔一个候选跨度的左边界与右边界的字符嵌入,将所述字符嵌入、所述POS嵌入和所述左边界与右边界的字符嵌入拼接形成每个所述候选跨度的候选跨度嵌入;注意力机制计算模块,根据所述候选跨度嵌入通过共享注意力机制的系统计算所述待检测样本中所述候选跨度之间的交互作用的共享注意力机制表征;模型训练实施模块,根据所述共享注意力机制表征和所述待检测样本完成打分和模型的训练,并通过训练完的所述模型进行事件检测。

在其中一些实施例中,所述注意力机制计算模块进一步包括:根据所述候选跨度嵌入和跨度嵌入的维度尺寸、训练参数矩阵计算所述共享注意力机制表征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111054114.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top