[发明专利]内核函数传输方法、装置及设备在审
申请号: | 202111655817.9 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114493980A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 陆游游;舒继武;谢旻晖 | 申请(专利权)人: | 清华大学 |
主分类号: | G06T1/20 | 分类号: | G06T1/20 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 董建姣;刘芳 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内核 函数 传输 方法 装置 设备 | ||
本申请实施例提供一种内核函数传输方法、装置及设备。该方法包括:中央处理器根据待发送至图像处理器的多个内核函数确定融合内核函数;中央处理器确定多个内核函数之间的依赖关系、每个内核函数的函数参数、融合内核函数对应的发射参数和融合内核函数对应的处理线程数;中央处理器向图像处理器同步多个内核函数之间的依赖关系、每个内核函数的函数参数、融合内核函数对应的发射参数和融合内核函数对应的处理线程数,以使图像处理器根据依赖关系、每个内核函数的函数参数、融合内核函数对应的发射参数和融合内核函数对应的处理线程数,对多个内核函数进行处理,提高了图像处理器的运行效率。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种内核函数传输方法、装置及设备。
背景技术
电子设备上可以安装应用程序,并通过应用程序显示图像,以满足用户看视频、打游戏等需求。
电子设备中包括中央处理器和图像处理器。在应用程序显示图像时,电子设备中的中央处理器可以向图像处理器发送指令,以使图像处理器根据指令显示图像。然而,在上述过程中,中央处理器向图像处理器发送指令的发送时间通常大于图像处理器根据指令显示图像的执行时间,图像处理器需要等待中央处理器发送指令,存在闲置的时间,导致图像处理器的运行效率低。
发明内容
本申请实施例提供一种内核函数传输方法、装置及设备,用以提高图像处理器的运行效率。
第一方面,本申请实施例提供一种内核函数传输方法,包括:
中央处理器根据待发送至图像处理器的多个内核函数确定融合内核函数;
所述中央处理器确定所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数;
所述中央处理器向所述图像处理器同步所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数,以使所述图像处理器根据所述依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数,对所述多个内核函数进行处理。
在一种可能的实施方式中,所述中央处理器向所述图像处理器同步所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数,包括:
所述中央处理器通过远程直接数据存取RDMA的方式向所述图像处理器同步所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数。
在一种可能的实施方式中,所述中央处理器确定所述融合内核函数对应的发射参数,包括:
所述中央处理器对所述多个内核函数对应的线程块和线程网格进行统一化处理;
所述中央处理器对线程块中离散的线程束进行补齐处理。
在一种可能的实施方式中,中央处理器确定待发送至图像处理器的多个内核函数,包括:
所述中央处理器确定多个待选内核函数;
所述中央处理器确定每个待选内核函数的运行时间和所述多个待选内核函数之间的依赖关系;
所述中央处理器根据每个待选内核函数的运行时间和所述多个待选内核函数之间的依赖关系,在所述多个待选内核函数中确定所述多个内核函数。
第二方面,本申请实施例提供一种内核函数传输方法,包括:
图像处理器从中央处理器获取多个内核函数之间的依赖关系、每个内核函数的函数参数、融合函数对应的发射参数和所述融合函数对应的处理线程数,所述融合内核函数为对所述多个内核函数进行融合后的函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111655817.9/2.html,转载请声明来源钻瓜专利网。