[发明专利]一种事件识别方法、介质、装置以及计算设备在审
| 申请号: | 201811472932.0 | 申请日: | 2018-12-04 |
| 公开(公告)号: | CN109614541A | 公开(公告)日: | 2019-04-12 |
| 发明(设计)人: | 郭锐;夏宗靓 | 申请(专利权)人: | 北京艾漫数据科技股份有限公司 |
| 主分类号: | G06F16/953 | 分类号: | G06F16/953;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京汉昊知识产权代理事务所(普通合伙) 11370 | 代理人: | 朱海波 |
| 地址: | 100101 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 事件识别 文本数据 计算设备 匹配关系 匹配结果 事件信息 置信 学习 处理压力 可移植性 网络数据 应用场景 预设条件 准确度 实时性 概率 拟合 匹配 输出 拓展 | ||
本发明的实施方式提供一种事件识别方法、介质、装置以及计算设备。该事件识别方法包括:从网络数据中获取文本数据以及与文本数据匹配的事件信息作为初匹配结果,文本数据包含待识别事件;以初匹配结果作为深度学习模型的输入,采用深度学习模型输出用于指示文本数据与事件信息之间的匹配关系准确度的置信概率;若置信概率符合预设条件,则根据匹配关系确定待识别事件。本发明的实施方式有助于提高事件识别方案的可移植性,拓展事件识别方案的应用场景,并且还有助于避免直接使用深度学习模型造成的过拟合现象,减轻深度学习模型的处理压力,提升事件识别的可靠性、实时性以及识别效果。
技术领域
本发明的实施方式涉及软件技术领域,更具体地,本发明的实施方式涉及一种事件识别方法、介质、装置以及计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着大数据技术的发展,从网络数据中识别出例如负面事件、敏感事件等特定事件,并基于对这些特定事件进行分析/评估得到的分析结果/评估结果已成为个人或公司机构的重要决策依据之一。目前,常见的事件识别方案主要有:基于模式匹配的事件识别方案和基于机器学习的事件识别方案。
其一,基于模式匹配的事件识别方案通常是依赖于各种模式算法对某类事件类型或事件元素进行匹配从而实现事件识别,但各种模式算法需要大量的人为设定的领域知识和人工标注的数据,对具体领域的依赖性强,大大降低了事件识别方案的可移植性,限制了事件识别方案的应用场景。
其二,基于机器学习的事件识别方案通常会利用支持向量机、贝叶斯模型、决策树、神经网络等机器学习模型将事件识别问题转换成序列标注问题或分类问题。现有的基于机器学习的事件识别方案虽然可以拟合数据,扩展事件识别方案的应用场景,但容易出现过拟合现象,即事件识别方案识别新数据的性能远低于识别训练过的数据的性能,造成事件识别的可靠性差、实时性弱、效果差。
综上,现有的事件识别方案存在方案可移植性差、方案应用场景较为局限,事件识别的实时性弱、效果差等问题。
发明内容
目前事件识别方案存在方案可移植性差、方案应用场景较为局限,事件识别的实时性弱、效果差等问题。在本上下文中,本发明的实施方式期望提供一种事件识别方法、装置、介质和计算设备。
在本发明实施方式的第一方面中,提供了一种事件识别方法,包括:
从网络数据中获取文本数据以及与文本数据匹配的事件信息作为初匹配结果,文本数据包含待识别事件;
以初匹配结果作为深度学习模型的输入,采用深度学习模型输出用于指示文本数据与事件信息之间的匹配关系准确度的置信概率;
若所述置信概率符合预设条件,则根据所述匹配关系确定待识别事件。
在本发明的一个实施例中,通过如下步骤以初匹配结果作为深度学习模型的输入,具体包括:获取初匹配结果对应的词向量,词向量包括文本数据对应的文本词向量和事件信息对应的事件信息向量;通过时间递归神经网络(Long Short Term Memory,LSTM)模型对文本词向量进行编码,从而将文本词向量转换为隐状态;确定隐状态与事件信息向量作为下一层深度学习模型的输入。
在本发明的一个实施例中,下一层深度学习模型为注意力机制 (Attention)模型。采用深度学习模型输出用于指示文本数据与事件信息之间的匹配关系准确度的置信概率,具体包括:通过Attention模型对隐状态进行加权平均;基于判断加权平均后的隐状态与事件信息向量之间的匹配关系,采用全连接层输出所述置信概率。
在本发明的一个实施例中,通过Attention模型对隐状态进行加权平均,包括:当隐状态的数量为多个时,基于Attention模型为多个隐状态中不同隐状态配置不同权值,并对配置权值后的多个隐状态进行加权平均。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京艾漫数据科技股份有限公司,未经北京艾漫数据科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811472932.0/2.html,转载请声明来源钻瓜专利网。





