[发明专利]一种基于多尺度异构图嵌入算法的事件检测方法有效
申请号: | 202210063961.1 | 申请日: | 2022-01-20 |
公开(公告)号: | CN114528479B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 吕建明;梁锦涛 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06F16/9537;G06F16/901;G06F16/906 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 黄卫萍 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 构图 嵌入 算法 事件 检测 方法 | ||
本发明公开了一种基于多尺度异构图嵌入算法的事件检测方法,该检测方法通过异构随机游走、信息素传播算法以及基于三元组采样的异构图嵌入算法完成跨域的多视图事件检测任务,属于计算机技术领域。首先通过异构随机游走算法结合异构信息素散布算法,游走获取出一系列的路径集合,并根据信息素的浓度进行图的塌缩获取一系列尺度的异构图;然后通过获取到的不同尺度异构图的游走序列,进行三元组的采样优化,从而计算出不同尺度下异构图的节点的嵌入,并将其拼接再降维至合适的维度向量用于事件检测任务。本发明提出的方法可以建模复杂的新闻事件数据,并利用图嵌入的方法得到不同新闻事件的嵌入向量表示,并有效用于下游的事件检测任务。
技术领域
本发明属于计算机技术领域,涉及图嵌入技术,具体涉及一种通过异构随机游走、信息素传播算法以及基于三元组采样的多尺度异构图嵌入算法完成跨域的多视图事件检测任务的方法。
背景技术
事件检测旨在从互联网平台发现现实世界中的事件。事件检测任务是舆情监控、舆情分析、风控检测等任务的重要基础。社会上的新闻事件传播快,范围广,影响大,快速准确对新闻事件划分归类有利于对事件进行全方面的了解评价并且可以及时采取措施遏制不良信息的进一步扩散。基于不同发表者的主观性以及事件的非全面性信息,同一件事情在这两个领域中可能有着不一样的视角甚至表达着完全相反的观点。这给传统的事件检测任务带来了巨大的挑战。于是多域事件检测任务(MED)应运而生,它综合多个域的不同新闻事件,可以提供对事件的全面的描述。多个领域同时观察事件就可以更加贴切地感知到事件的全面,但同时多域的复杂性也给研究带来了挑战。首先,来自不同域的数据是多种形式的,例如来自在线新闻媒体的文本新闻文章,以及类似Flickr的社交媒体上的视觉图像,很多判别模型都很难处理异构的数据。除此之外多模式数据有多个视图,文本文章具有报告时间,数据源(例如,雅虎、谷歌、CNN)以及文本内容,而Flickr帖子拥有时间、用户身份、标签、GPS数据以及视觉图像。多个数据视图对于识别和描述事件也是至关重要的,而多个视图的数据在形式上也构成了异构。其次,数据量大,更新率高,要求方法计算成本低,适用于动态更新的数据流。第三,由于大量的数据变化,例如新闻文章的不同立场和观点,以及不同的观点、分辨率、照明条件、不断变化的背景以及不同的采用时间或标记单词,原始数据通常在判别力方面较低。因此,在MED的背景下学习数据的有效表示是至关重要的。
在事件检测领域,研究人员为了利用异构数据和数据视图,提出了后期融合和早期融合模型,用于在不同层次上进行信息融合。后期融合方法受困于昂贵的学习代价以及容易受单一模态的低分辨力所影响。早期融合模型基于亲和力图但也是计算密集型的。数据表示学习模型从多个低维子空间的联合中近似采样的同时利用了各种假设(例如非负性、稀疏性,低秩、局部不变性等)。多模态数据表示模型单纯地连接单个模态或者分别学习每个模态的表示,这忽略了模态之间的内在结构以及连接关系。
如何找到一种合适的方案既可以学习每个域内的事件特征又可以维护每一个模态之间的内在结构以及连接关系成为解决多模态事件检测问题的关键。而这也正是前面提到的异构网络嵌入技术所要解决的问题。
发明内容
本发明的目的是为了解决现有技术中事件检测跨域事件检测任务的上述缺陷,提供一种基于三元组采样的多尺度异构图嵌入算法的事件检测方法。考虑到现实生活中的新闻事件普遍具有多种不同类型的特征例如文本特征、图像特征、时序特征等等,而这构成了数据的异构性。当涉及到多领域数据的异构性时,图数据结构就可以很好地建模这样的异构数据形式,而事件检测任务它可以被认为是图上的节点分类任务。为此,本发明使用异构图建模异构的数据以解决多视图数据的异构性。此外,异构图嵌入技术来解决MED任务,因为图嵌入方法在获得节点的低维表示方面有比较优秀的能力,所以本发明提出了一种新型的异构图嵌入方法。
本发明的目的可以通过采取如下技术方案达到:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210063961.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高效型计算机用散热机箱
- 下一篇:用于真空吸尘器的表面清洁头