[发明专利]一种事件检测方法、系统、电子设备及存储介质在审
申请号: | 202111054114.0 | 申请日: | 2021-09-09 |
公开(公告)号: | CN113761132A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 付骁弈;吴信东 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06F40/279;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 魏炜 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事件 检测 方法 系统 电子设备 存储 介质 | ||
本发明提出一种事件检测方法、系统、电子设备及存储介质,其方法技术方案包括对一待检测文本进行分句后得到待检测样本,进一步获取待检测样本的字符嵌入和POS嵌入,并进一步获取待检测样本每隔一个候选跨度的左边界与右边界的字符嵌入,将字符嵌入、POS嵌入和左边界与右边界的字符嵌入拼接形成每个候选跨度的候选跨度嵌入;根据候选跨度嵌入通过共享注意力机制的方法计算待检测样本中候选跨度之间的交互作用的共享注意力机制表征;根据共享注意力机制表征和待检测样本完成打分和模型的训练,并通过训练完的模型进行事件检测。本申请解决了现有方法易错误判断、易抽取不完整的事件简称或难以规模化的问题。
技术领域
本发明属于机器学习技术领域,尤其涉及一种事件检测方法、系统、电子设备及存储介质。
背景技术
事件(触发词)检测和参与事件主客体的识别是金融、工业故障等领域常见并且困难的任务。使用语法规则、统计机器学习等方法在该任务上面临这诸多问题。现有技术包括基于语法规则的模型和基于统计机器学习的模型,但是,现有技术对于同一个事件中存在两个或者以上动词时(例如:“这种机械能量释放破坏了包裹的完整性”),现有的基于语法规则的模型容易错误地判断哪一个是正确的触发词,或者将两者都作为触发词;对于同一个事件中存在两个或者以上参与主体并被连词分隔开时(例如:“使飞机左转,导致前轮和右主起落架支柱坍塌”),现有的基于语法规则的模型容易抽取不完整的事件简称(例如将“前轮”或者“右主起落架”中的后者遗漏);基于统计机器学习的模型,虽然相比较规则模型可以通过精确的标注方法缓解上述缺点中提到的问题,但是往往需要手工设计特征,并且模型效果受制于特征工程的水平,难以规模化地扩展到对不同事件类型检测的任务上。
发明内容
本申请实施例提供了一种事件检测方法、系统、电子设备及存储介质,以至少解决现有方法易错误判断、易抽取不完整的事件简称或难以规模化的问题。
第一方面,本申请实施例提供了一种事件检测方法,包括:跨度嵌入计算步骤,对一待检测文本进行分句后得到待检测样本,进一步获取所述待检测样本的字符嵌入和POS嵌入,并进一步获取所述待检测样本每隔一个候选跨度的左边界与右边界的字符嵌入,将所述字符嵌入、所述POS嵌入和所述左边界与右边界的字符嵌入拼接形成每个所述候选跨度的候选跨度嵌入;注意力机制计算步骤,根据所述候选跨度嵌入通过共享注意力机制的方法计算所述待检测样本中所述候选跨度之间的交互作用的共享注意力机制表征;模型训练实施步骤,根据所述共享注意力机制表征和所述待检测样本完成打分和模型的训练,并通过训练完的所述模型进行事件检测。
优选的,所述注意力机制计算步骤进一步包括:根据所述候选跨度嵌入和跨度嵌入的维度尺寸、训练参数矩阵计算所述共享注意力机制表征。
优选的,所述模型训练实施步骤进一步包括:采用k层标准的前馈神经网络计算得到跨度评分。
优选的,所述模型训练实施步骤进一步包括:使用随机初始化的模型参数进行跨度打分函数的估算,将预测结果与样本集上正负例的交叉熵作为损失函数,通过反向传播迭代地进行模型参数的更新,直到训练误差达到可以接受的范围时停止训练。
第二方面,本申请实施例提供了一种事件检测系统,适用于上述一种事件检测方法,包括:跨度嵌入计算模块,对一待检测文本进行分句后得到待检测样本,进一步获取所述待检测样本的字符嵌入和POS嵌入,并进一步获取所述待检测样本每隔一个候选跨度的左边界与右边界的字符嵌入,将所述字符嵌入、所述POS嵌入和所述左边界与右边界的字符嵌入拼接形成每个所述候选跨度的候选跨度嵌入;注意力机制计算模块,根据所述候选跨度嵌入通过共享注意力机制的系统计算所述待检测样本中所述候选跨度之间的交互作用的共享注意力机制表征;模型训练实施模块,根据所述共享注意力机制表征和所述待检测样本完成打分和模型的训练,并通过训练完的所述模型进行事件检测。
在其中一些实施例中,所述注意力机制计算模块进一步包括:根据所述候选跨度嵌入和跨度嵌入的维度尺寸、训练参数矩阵计算所述共享注意力机制表征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111054114.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:坐标测量机
- 下一篇:一种实体链接方法及系统、设备和存储介质