[发明专利]一种基于多层级中介码的图神经网络编译优化方法在审
| 申请号: | 202310227947.5 | 申请日: | 2023-03-10 |
| 公开(公告)号: | CN116225452A | 公开(公告)日: | 2023-06-06 |
| 发明(设计)人: | 卢冶;仪德智;杨航 | 申请(专利权)人: | 南开大学 |
| 主分类号: | G06F8/41 | 分类号: | G06F8/41;G06F8/60;G06N3/045 |
| 代理公司: | 天津睿勤专利代理事务所(普通合伙) 12225 | 代理人: | 张伟凤 |
| 地址: | 300000*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多层 中介 神经网络 编译 优化 方法 | ||
本发明提供了一种基于多层级中介码的图神经网络编译优化方法,属于图神经网络技术领域,包括以下步骤:步骤1:对图神经网络模型进行预处理,然后训练模型;步骤2:将训练后的图神经网络模型转换为ONNX格式;步骤3:使用ONNX‑MLIR前端把ONNX格式的图神经网络模型转换为IR;步骤4:进行IR编译优化;步骤5:生成可执行程序。本发明利用MLIR对GNNs模型在不同层级的中介码进行细粒度优化,并提高GNNs模型代码在不同硬件平台上的可移植性。
技术领域
本发明属于图神经网络技术领域,特别涉及一种基于多层级中介码的图神经网络编译优化方法。
背景技术
近年来,神经网络在各类模式识别和数据挖掘研究中大放异彩。过去,大部分机器学习任务都必须依赖耗时费力且准确率较低的手工特征提取。而现在,特征提取的工作已经被各类深度神经网络(Deep Neural Networks,DNN)模型替代。许多取得成功的深度学习应用大都是基于欧式空间内数据的,例如自然语言处理中的语音序列、计算机视觉中的图像,其特点是数据内部结点都有固定的排列规则和顺序。然而,在实际应用场景下大多数数据却并非源自欧氏空间。因此传统的深度学习将难以对这类场景下的数据进行有效地特征提取。例如:硬件电路设计、交通网络和生物分子结构等数据都不属于欧式空间,而是以图的形式存储。对于图神经网络(Graph Neural Networks,GNNs)的研究就是为了更好地学习和提取图数据的结构特征,并做出更加准确的下游应用预测。
尽管GNNs在解决各种图结构相关的任务上表现出出色的学习能力,但是它和DNNs一样存在可移植性差,推理耗时长,模型体积臃肿等问题。而相对于DNNs,GNNs有以下三个特殊性,导致其优化过程不能完全照搬DNNs的范式:1.GNNs结点之间的消息传递机制;2.稀疏矩阵在GNNs中的广泛使用;3.GNNs的数据存取的相对不规则性。针对这些特性,GNNs的编译优化还有广阔的优化空间亟待探索。
多层级中介码(Multi-Level Intermediate Representation,MLIR)是在底层虚拟机(Low Level Virtual Machine,LLVM)编译器架构系统下的一个子项目。MLIR为编译器前端中介码/中间表示(Intermediate Representation,IR)的代码生成,转换和优化提供了一个可重用的,扩展性强的基础架构。相较于传统编译器的构建方法,使用MLIR有以下几个优势:1.一切皆可定制化。基础架构提供了一个内置功能的最小集,利用这些内置功能,用户可以拥有设计的最大自由度,定制个性化IR。2.多级IR逐步下降。过去的编译器都是从高层语义一步下降到较低级语义,例如C下降到汇编语言,跨越其中的巨大差距不仅是一个困难的过程,也为细粒度的编译优化带来了不便。多层IR逐级下降允许在不同层级做优化,甚至综合高级语义信息和低级语义来进行优化。3.模块可重用。MLIR诞生以前,每次开发新的特定领域语言,从前端到后端,每一个环节都需要重新开发。但是某些语言特性在不同语言之间是通用的。利用MLIR基础架构,能让代码重用变得更加简单和高效。4.更好的可移植性。只要在MLIR基础架构之内,不同IR可以通过不同的方言(dialect)来转换。因此不同前端的代码,经过IR的中转之后,可以更方便在不同后端中运行,这就提升了前端代码的可移植性。以上特性是MLIR能在神经网络编译器这一领域取得广泛关注的重要原因。目前有两大神经网络相关方言:torch-MLIR和ONNX-MLIR,两个方言都仅仅针对传统的DNNs进行有限的支持,也就是说,基于MLIR对GNNs进行转换和优化还是一片空白。
基于此背景,本专利基于多层级中介码编译器基础架构,探究GNNs的编译优化方法。
发明内容
本发明针对现有技术中存在的技术问题,提供一种基于多层级中介码的图神经网络编译优化方法,利用MLIR对GNNs模型在不同层级的中介码进行细粒度优化,并提高GNNs模型代码在不同硬件平台上的可移植性。
本发明采用的技术方案是:一种基于多层级中介码的图神经网络编译优化方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310227947.5/2.html,转载请声明来源钻瓜专利网。





