“管茂林”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果39个，建议您升级VIP下载更多相关专利

[发明专利]支撑异构众核全芯片视角的加速编程和编译方法-CN201910918623.X有效
发明人：王飞;吴伟;肖谦;沈莉;钱宏;管茂林;周文浩;樊行健 -专利权人：无锡江南计算技术研究所
申请日： 2019-09-26 - 公布日： 2022-11-25 - 主分类号： G06F8/41 文献下载
摘要：本发明公开一种支撑异构众核全芯片视角的加速编程和编译方法，包括以下步骤：S1、识别__cross关键字声明的全局变量；S2、初始化操作；S3、全芯片加速模式的选择；S4、启动N个运算核组；S5、进入等待所有线程结束的状态；S6、进入等待S4中线程函数的状态信息的状态；S7、置线程结束的标志；S8、线程回收操作；S9、创建pthread线程；S10、线程绑定操作；S11、每个pthread线程将运算核组编号对应的运算核组启动；S12、进入等待线程结束的状态；S13、启动线程函数执行；S14、置线程结束的标志；S15、进行线程回收操作，更新加速核心的状态信息；S16、控制核心运行结束。本发明支持全芯片视角多模式的并行加速，以应对异构众核处理器的芯片特点和应用需求，为用户提供全片内存视角和全片资源管理方案。
支撑异构众核全芯片视角加速编程编译方法

[发明专利]针对循环内条件转移指令的转移预测优化方法-CN201910794939.2有效
发明人：钱宏;朱琪;王飞;吴伟;肖谦;管茂林;沈莉;周文浩 -专利权人：无锡江南计算技术研究所
申请日： 2019-08-27 - 公布日： 2022-11-15 - 主分类号： G06F9/30 文献下载
摘要：本发明公开一种针对循环内条件转移指令的转移预测优化方法，包括以下步骤：S11、判断一次循环内的指令条数是否能够满足带条件标记的运算指令在带条件转移标志位的条件转移指令之前至少提前N条的条件；S12、如果满足条件，编译器直接生成汇编代码，如果不满足，编译器根据循环体代码量与条件N计算需要循环展开的次数，进行循环展开，生成汇编代码；S13、带条件标记的运算指令提前改变条件转移指令的转移标志位；S14、条件转移指令根据对应的条件标记位进行判断，如果成立，则处理器根据条件转移标记指示跳转取指，否则顺序取指；S15、不论预测为跳转还是不跳转，条件标记位使用后即作废，转移指令条件标记位清0。本发明能够规避循环最后一次转移带来的性能损失。
针对循环条件转移指令预测优化方法

[发明专利]面向容量受限的程序栈空间深度追溯方法-CN201910794946.2有效
发明人：肖谦;王飞;尉红梅;沈莉;钱宏;管茂林;朱琪;周文浩 -专利权人：无锡江南计算技术研究所
申请日： 2019-08-27 - 公布日： 2022-11-15 - 主分类号： G06F8/41 文献下载
摘要：本发明公开一种面向容量受限的程序栈空间深度追溯方法，包括以下步骤：S1、在链接器中建立函数信息的数据结构，形成函数调用关系流程图；S2、获取所有的函数符号信息，建立相应的函数信息数据结构，并将函数的名称、PC值范围、自身栈空间深度信息安装到对应的函数信息结构中；S3、遍历程序所有的重定位信息，根据重定位信息来确定函数调用关系，根据分析结果更新各个函数信息的链表指针；S4、对建立的函数调用关系图做深度优先遍历，通过累加计算获取根节点函数的栈空间深度，对所有根节点栈空间深度做排序后输出。本发明通过静态分析的方法获取栈空间信息，无需重新编译，无需运行插桩，对于程序分析、错误定位以及程序优化有着很好的指导作用。
面向容量受限程序空间深度追溯方法

[发明专利]针对异构众核的快速线程启动方法-CN201910799253.2有效
发明人：吴伟;王飞;沈莉;管茂林;肖谦;钱宏;周文浩;武文浩 -专利权人：无锡江南计算技术研究所
申请日： 2019-08-28 - 公布日： 2022-11-15 - 主分类号： G06F9/48 文献下载
摘要：本发明公开一种针对异构众核的快速线程启动方法，包括以下步骤：S1、控制核心进行线程信息初始化的工作；S2、控制核心获取加速核心上将要运行的线程函数的PC值、参数等信息；S3、控制核心根据异构众核的结构特征选择传输方式；S4、控制核心写入线程信息并置传输标志；S5、控制核心进入等待线程结束的状态；S6、加速核心进入等待传输标志的状态；S7、加速核心启动传输操作；S8、启动线程函数执行；S9、各加速核心的线程函数执行完毕后，进行加速核心间的同步操作；S10、通知控制核心线程函数已执行结束；S11、控制核心进行线程回收操作。本发明实现了快速的线程启动与回收，减少了控制核心和加速核心在线程启动交互过程中的访存和控制开销，为应用程序的高效执行奠定了基础。
针对异构众核快速线程启动方法

[发明专利]基于编译实现的可扩展向量掩码功能的方法和装置-CN201910799256.6有效
发明人：沈莉;王飞;钱宏;管茂林;朱琪;吴伟;肖谦;武文浩 -专利权人：无锡江南计算技术研究所
申请日： 2019-08-28 - 公布日： 2022-11-15 - 主分类号： G06F8/41 文献下载
摘要：本发明公开一种基于编译实现的可扩展向量掩码功能的方法和装置，包括以下步骤：S1、编译器输入用户程序，根据目标平台翻译出正确的掩码向量接口；S2、编译器前端模块对S1中获得的掩码向量接口进行关键字识别，选择对应平台的中端处理入口；S3、编译器中端模块根据目标平台的指令结构对掩码向量接口进行分析，选择合适的处理流程；S4、编译器后端模块将编译器中端模块生成的中间生成代码转换生成最终指令；S5、编译器根据向量宽度的增加，完成对平台向量宽度的识别，选择合适宽度的向量转换和掩码生成。本发明降低了重新开发代码的工作量和复杂度及用户移植的复杂度，更进一步的挖掘了课题的指令级并行性能。
基于编译实现扩展向量掩码功能方法装置

[发明专利]异构平台下宽度非对称向量兼容性的编译处理方法和装置-CN201910831166.0有效
发明人：王飞;钱宏;沈莉;吴伟;管茂林;周文浩;朱琪;武文浩 -专利权人：无锡江南计算技术研究所
申请日： 2019-09-04 - 公布日： 2022-11-15 - 主分类号： G06F8/41 文献下载
摘要：本发明公开一种异构平台下宽度非对称向量兼容性的编译处理方法和装置，包括以下模块：编译器预处理模块，用于对非对称异构向量的统一声明，还用于通过编译选项来控制对应的数据和接口调用的target预处理，转换为对应平台自身适应的接口；编译器前端中端分析模块，用于根据接口的调用方式，进行内部中间表示的转换或者向量降级，生成对应平台的中间表示；编译器后端拆分模块，用于根据中间表示，生成对应的后端指令。本发明实现主从核编译器向量开发的继承性、减少用户程序异构编码限制，无需去关注异构平台对向量支持的差异性。
平台宽度对称向量兼容性编译处理方法装置

[发明专利]面向异构平台的多层次存储结构内存检测方法-CN201910903842.0有效
发明人：武文浩;沈莉;王飞;肖谦;管茂林;周文浩 -专利权人：无锡江南计算技术研究所
申请日： 2019-09-24 - 公布日： 2022-11-15 - 主分类号： G06F11/36 文献下载
摘要：本发明公开一种面向异构平台的多层次存储结构内存检测方法，基于异构众核处理器的编译器和运行时库，包括以下步骤：S1、实现自定义动态运行时库；S2、在自定义动态运行时库中，当从核程序发生段为例异常或终止异常时，从核向主核发送异常中断信号，主核代理从核进行异常处理；S3、主核、从核分别对源程序进行编译分析，将源程序处理为中间代码，并在中间代码上对需要插桩的位置进行插桩处理；S4、编译器将S3中处理过的中间代码，编译、汇编、链接，生成可执行代码，进而生成可执行文件并运行。本发明在拥有多指令集、多层次存储结构的异构众核处理器上实现内存错误的动态检测，检测的错误类型多，且错误信息描述详尽，定位精准，检测效果较好。
面向平台多层次存储结构内存检测方法

[发明专利]面向异构众核后端基于代价模型的多面体优化方法-CN201910910502.0有效
发明人：漆锋滨;周文浩;沈莉;肖谦;黄驻峰;管茂林 -专利权人：无锡江南计算技术研究所
申请日： 2019-09-25 - 公布日： 2022-11-15 - 主分类号： G06F8/41 文献下载
摘要：本发明公开一种面向异构众核后端基于代价模型的多面体优化方法，包括以下步骤：S1、编译器解析位于主核和从核上的用户程序的编译标识，生成对应的主核中间表示和从核中间表示；S2、编译器对S1中生成的主核和从核的中间表示层代码进行分析和优化；S3、对是否实施多面体调度与优化方法进行收益评估；S4、对有收益的静态控制单元实施多面体调度与优化，生成新的中间表示；S5、编译器将新的向量中间表示生成可重定向文件；S6、将中的可重定向文件与库文件链接，生成可执行文件。本发明首次提出并实现了片上异构众核的程序多面体优化自动变换方法，并加入了主核和从核独立的代价模型计算框架，保证了在有收益的前提下进行程序变换以节省程序的编译时间。
面向异构众核后端基于代价模型多面体优化方法

[发明专利]基于C代码生成的神经网络模型推理和训练方法-CN201910799245.8有效
发明人：肖谦;周文浩;钱宏;沈莉;管茂林;武文浩;朱琪;吴伟 -专利权人：无锡江南计算技术研究所
申请日： 2019-08-28 - 公布日： 2022-09-13 - 主分类号： G06F8/30 文献下载
摘要：本发明公开一种基于C代码生成的神经网络模型推理和训练方法，包括以下步骤：S1、以通过各种AI编程框架开发的模型作为输入，AI框架编译器识别各种模型格式并转化为统一的计算图，将输入的模型转化为底层IR；S2、将S1中生成的计算图输入C代码生成模块，输出总控函数；S3、C代码生成模块针对不同的底层IR，生成对应的C代码；S4、将生成的总控函数、各IR对应的C代码以及C‑基础算子库，输入到支持C语言和相应硬件平台的基础编译器，通过基础编译器的优化过程转化为运行程序，并在对应硬件平台上执行推理过程、训练过程。本发明实现了AI框架编译器在LLVM不支持的硬件平台上的快速移植，能够快速实现神经网络模型在LLVM不支持的特定硬件平台上的训练和推理过程。
基于代码生成神经网络模型推理训练方法

[发明专利]基于异构众核处理器的卷积加速方法-CN201910799257.0有效
发明人：王飞;周文浩;肖谦;吴伟;朱琪;钱宏;沈莉;管茂林 -专利权人：无锡江南计算技术研究所
申请日： 2019-08-28 - 公布日： 2022-09-13 - 主分类号： G06N3/063 文献下载
摘要：本发明公开一种基于异构众核处理器的卷积加速方法，包括以下步骤：S1、根据异构众核处理器的核数，确定输入特征图和卷积核的多核划分方法，实现众核并行加速，S2、各计算核心将划分后的数据通过DMA的方式传输至片上存储器，实现片上存储加速，S3、将卷积操作核心计算过程中的标量计算操作优化为向量计算操作，实现SIMD指令加速，S4、结合异构众核处理器流水线特性，对卷积操作核心计算过程的指令流进行优化，以提高执行效率，实现指令并行加速。本发明对卷积操作进行加速，显著提升了卷积神经网络在异构众核处理器上的训练和推理性能。
基于异构众核处理器卷积加速方法

[发明专利]针对片上存储器重用的链接时地址分配方法-CN201910805599.9有效
发明人：吴伟;王飞;沈莉;朱琪;钱宏;管茂林;周文浩;武文浩 -专利权人：无锡江南计算技术研究所
申请日： 2019-08-29 - 公布日： 2022-09-13 - 主分类号： G06F12/0802 文献下载
摘要：本发明公开一种针对片上存储器重用的链接时地址分配方法，包括以下步骤：S1、在编译器上构建片上存储器的重用段类型，生成片上存储器的访存模式；S2、在执行S1中操作的同时，对链接脚本进行配置；S31、链接器对S2中所述的链接脚本进行信息扫描，进入链接器的重用处理函数；S32、从二进制文件格式描述符文件中获取段信息；S33、循环处理S32中获取的段信息，识别并找出重用段；S34、解析出S12中所述的重用段属性的数据结构中所带的重用段名字，对满足同一个重用段名字的段分配相同的虚拟内存地址；S35、从S32中获取的段信息中找出最大的段，用作该重用段空间分配时的空间大小。本发明通过链接时地址分配方法实现空间重用，有效提高片上存储器的空间利用率、提升程序性能。
针对存储器重用链接地址分配方法

[发明专利]面向异构众核处理器的动态链接运行支撑方法-CN201910918622.5有效
发明人：沈莉;肖谦;王飞;管茂林;周文浩;武文浩 -专利权人：无锡江南计算技术研究所
申请日： 2019-09-26 - 公布日： 2022-07-12 - 主分类号： G06F9/445 文献下载
摘要：本发明公开一种面向异构众核处理器的动态链接运行支撑方法，包括以下步骤：S1、将用户的控制核心程序、加速核心程序及加速核心静态库链接到可执行程序中，获得异构混合动态链接的可执行程序；S2、运行异构混合动态链接的可执行程序；S3、提供一动态混合链接选项，实现异构程序的混合链接；S4、程序加载器分析异构混合动态链接的可执行程序的各个段，通过interp段解析标准动态链接器的地址；S5、向操作系统申请页氏空间，用于加载控制核心动态库；S6、实现基于众核空间的动态分配策略；S7、新增接口dlopen_hybrid，支持异构混合动态库中控制核心代码和加速核心代码正确运行。本发明既能保证控制核心代码兼容动态链接功能和动态运行模式，也能通过充分发挥加速核心的加载和运行效率。
面向异构众核处理器动态链接运行支撑方法

[发明专利]一种多线程模式下的快速段式编址配置和访问方法-CN201810929684.1有效
发明人：沈莉;王飞;钱宏;管茂林;肖谦 -专利权人：无锡江南计算技术研究所
申请日： 2018-08-15 - 公布日： 2022-06-14 - 主分类号： G06F8/41 文献下载
摘要：本发明公开一种多线程模式下的快速段式编址配置和访问方法，包括如下步骤：S101、用户程序中使用存储层次关键字；S102、编译器识别并处理用户程序中的关键字；S103、链接器处理重定位信息及多层次数据段；S104、加载器内存加载；S105、程序运行时读取内部寄存器。本发明在编译链接阶段识别和处理多层次存储关键字，程序加载阶段识别和处理多层次存储数据段，程序运行时充分利用CPU提供的内部寄存器获取本线程多层次存储数据段基址，提高了访存效率和灵活性。
一种多线程模式快速段式配置访问方法

[实用新型]一种用于皮带机的带可折叠走道护栏的钢构桁架-CN202220267267.7有效
发明人：王培秀;张太山;管茂林;张承瑞;陈自云;张勤河 -专利权人：山推建友机械股份有限公司
申请日： 2022-02-09 - 公布日： 2022-06-14 - 主分类号： B65G21/14 文献下载
摘要：本实用新型公开了一种用于皮带机的带可折叠走道护栏的钢构桁架，包括桁架主体，桁架主体的左侧设有走道护栏，走道护栏包括多个支撑梁、一个栏杆和一个踏步，多个支撑梁沿着桁架主体的长度方向等间距设置，并且每个支撑梁均通过一个第一铰接件可前后转动的与桁架主体铰接，每个支撑梁远离桁架主体的一侧设有一个安装筒，栏杆底部可转动的插在安装筒内，栏杆靠近桁架主体的一侧至少设有一个第二铰接件，踏步可上下转动的与第二铰接件铰接；通过将支撑梁与桁架主体铰接，以及栏杆与踏步铰接，当出厂运输时，将走道护栏折叠起来，当到现场进行安装时，只需将走道护栏进展开即可，安装简单方便，节约了安装成本。
一种用于皮带机可折叠走道护栏桁架

[发明专利]支持多格式半精度浮点的编译方法-CN202110324723.7在审
发明人：钱宏;管茂林;朱琪;吴伟;杨涛;王飞 -专利权人：无锡江南计算技术研究所
申请日： 2021-03-26 - 公布日： 2022-03-22 - 主分类号： G06F8/41 文献下载
摘要：本发明公开一种支持多格式半精度浮点的编译方法，包括以下步骤：S1、用户代码使用编译器提供的float16关键字来申明半精度浮点数据类型；S2、用户代码根据需要调用半精度浮点数据格式切换接口进行格式切换；S3、用户代码在切换半精度浮点数据格式后，调用编译器提供的半精度浮点数据转换接口进行数据格式转换；S4、在完成半精度浮点数据格式切换与数据转换后，用户程序在当前半精度浮点格式下进行后续的计算，需要再次切换半精度浮点格式时重复S2、S3。本发明可以在不增加代码编写复杂度的前提下发挥FP16和BF16两种半精度浮点格式的优势，满足应用场景使用半精度浮点加速计算的需求。
支持格式精度浮点编译方法

1
2
3
下一页»
尾页
共 39 条