[发明专利]内核函数传输方法、装置及设备在审
申请号: | 202111655817.9 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114493980A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 陆游游;舒继武;谢旻晖 | 申请(专利权)人: | 清华大学 |
主分类号: | G06T1/20 | 分类号: | G06T1/20 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 董建姣;刘芳 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内核 函数 传输 方法 装置 设备 | ||
1.一种内核函数传输方法,其特征在于,包括:
中央处理器根据待发送至图像处理器的多个内核函数确定融合内核函数;
所述中央处理器确定所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数;
所述中央处理器向所述图像处理器同步所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数,以使所述图像处理器根据所述依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数,对所述多个内核函数进行处理。
2.根据权利要求1所述的方法,其特征在于,所述中央处理器向所述图像处理器同步所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数,包括:
所述中央处理器通过远程直接数据存取RDMA的方式向所述图像处理器同步所述多个内核函数之间的依赖关系、每个内核函数的函数参数、所述融合内核函数对应的发射参数和所述融合内核函数对应的处理线程数。
3.根据权利要求1或2所述的方法,其特征在于,所述中央处理器确定所述融合内核函数对应的发射参数,包括:
所述中央处理器对所述多个内核函数对应的线程块和线程网格进行统一化处理;
所述中央处理器对线程块中离散的线程束进行补齐处理。
4.根据权利要求1-3任一项所述的方法,其特征在于,中央处理器确定待发送至图像处理器的多个内核函数,包括:
所述中央处理器确定多个待选内核函数;
所述中央处理器确定每个待选内核函数的运行时间和所述多个待选内核函数之间的依赖关系;
所述中央处理器根据每个待选内核函数的运行时间和所述多个待选内核函数之间的依赖关系,在所述多个待选内核函数中确定所述多个内核函数。
5.一种内核函数传输方法,其特征在于,包括:
图像处理器从中央处理器获取多个内核函数之间的依赖关系、每个内核函数的函数参数、融合函数对应的发射参数和所述融合函数对应的处理线程数,所述融合内核函数为对所述多个内核函数进行融合后的函数;
所述图像处理器确定所述融合内核函数对应的多个线程标识;
所述图像处理器根据所述融合内核函数对应的多个线程标识和所述融合内核函数对应的处理线程数,确定每个处理线程对应的内核函数;
所述图像处理器根据多个内核函数之间的依赖关系、每个内核函数的函数参数、每个处理线程对应的内核函数和所述融合函数对应的发射参数,对所述多个内核函数进行处理。
6.根据权利要求5所述的方法,其特征在于,所述图像处理器根据多个内核函数之间的依赖关系、每个内核函数的函数参数和每个处理线程对应的内核函数,对所述多个内核函数进行处理,包括:
所述图像处理器根据所述多个内核函数之间的依赖关系,确定所述多个内核函数的执行顺序;
所述图像处理器根据每个内核函数的函数参数,按照所述执行顺序,对所述多个内核函数进行处理。
7.根据权利要求6所述的方法,其特征在于,针对任意一个处理线程;所述图像处理器根据所述处理线程对应的内核函数的函数参数,对所述内核函数进行处理,包括:
所述图像处理器根据所述内核函数的函数参数,调用所述处理线程,以实现通过所述处理线程执行所述内核函数。
8.根据权利要求7所述的方法,其特征在于,所述图像处理器根据所述内核函数的函数参数,调用所述处理线程,以实现通过所述处理线程执行所述内核函数之后,还包括:
将处理线程的标识添加至所述内核函数对应的完成数组中,以指示所述处理线程执行完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111655817.9/1.html,转载请声明来源钻瓜专利网。