专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果20个,建议您升级VIP下载更多相关专利
  • [发明专利]基于多GPU的分布式深度学习模型训练代价的获取方法-CN202210542619.X有效
  • 曹州;敖玉龙;梁建中;吴志华;于佃海 - 北京百度网讯科技有限公司
  • 2022-05-18 - 2023-05-05 - G06T1/20
  • 本公开提供了一种基于多图像处理器GPU的分布式深度学习模型训练代价的获取方法,涉及人工智能领域,尤其涉及深度学习及云计算技术领域。具体实现方案为:获取并行策略;针对每个并行策略,获取多个GPU对应的每个算子的时间代价,并将所有的算子的时间代价之和作为目标时间代价;获取每个算子的内存消耗,并将所有的内存消耗之和作为目标内存消耗;根据目标内存消耗和目标时间代价,获取训练代价,并根据训练代价,选取最优并行策略。由此,本公开综合考虑算子的时间代价和内存消耗,更加准确地获取并行策略的训练代价,进而为选取最优并行策略奠定了坚实的基础。进一步地,无需考虑模型结构,为平台资源分配和并行策略的选择提供显著的指导意义。
  • 基于gpu分布式深度学习模型训练代价获取方法
  • [发明专利]模型训练方法、装置以及设备-CN202211393891.2在审
  • 梁建中;敖玉龙;于佃海 - 北京百度网讯科技有限公司
  • 2022-11-08 - 2023-01-03 - G06F18/214
  • 本公开提供了一种模型训练方法、装置以及设备,涉及人工智能技术领域,具体涉及深度学习等技术领域。该方法的一具体实施方式包括:将模型的未切分模型状态集合和第i个已切分模型状态集合存储到第i个设备的显存中;获取第i个训练样本集,以及通过设备间通信从其他n‑1个设备获取其他n‑1个已切分模型状态集合,对模型进行训练,得到模型的各个模型状态的第一梯度;基于模型的各个模型状态的第一梯度更新未切分模型状态集合和第i个已切分模型状态集合。该实施方式减少了模型状态切分数量,从而降低了训练过程中模型状态的通信时间,优化训练速度,满足更好更快训练深度学习大模型的需求。
  • 模型训练方法装置以及设备
  • [发明专利]任务调度方法及装置、电子设备和存储-CN202210541962.2有效
  • 梁建中;敖玉龙;赵英利;曹州;吴志华;于佃海 - 北京百度网讯科技有限公司
  • 2022-05-17 - 2022-12-09 - G06F9/48
  • 本公开提供了一种任务调度方法及装置、电子设备和存储,涉及人工智能技术领域,尤其涉及分布式计算和深度学习技术领域。实现方案为:获取目标模型的训练任务,训练任务包括计算图和分布式属性,计算图包括多个顺序处理模块和多个循环处理模块;将计算图拆分为多个目标块,每个目标块对应于多个顺序处理模块或者对应于任一循环处理模块;基于分布式属性,确定用于执行训练任务的多个计算设备的数量,并且将多个目标块中的每个目标块拆分为该数量的多个目标子块;基于多个目标块各自对应的多个目标子块,生成多个训练子任务,每个训练子任务包括多个目标块的相同编号的目标子块;以及将多个训练子任务分配至多个计算设备以并行执行。
  • 任务调度方法装置电子设备存储
  • [发明专利]一种GPU处理器上的K-NN的高性能并行实现装置-CN202011203928.1有效
  • 杨超;李雨芮;敖玉龙;李敏;李克森 - 北京大学
  • 2020-11-02 - 2021-09-17 - G06F9/50
  • 本发明提供了一种GPU处理器上的K‑NN的高性能并行实现装置,用于提高在GPU处理器上分类的并行加速实现。本发明装置包括:数据读入模块将应用场景中的训练数据和测试数据存成矩阵形式;样本距离计算模块计算每个测试样本与所有训练样本的距离;Top‑K选择模块利用预训练好的决策树模型判断执行粒度,包括线程级别优化、线程束级别优化、线程块级别优化、多线程块级别优化以及基于基数排序优化,选取前k个元素;标签选择模块为测试样本设置类别标签。本发明使用基于分治法的Top‑K并行框架,大大减少不必要的操作,能更充分的利用硬件资源,达到在GPU处理器上提高K‑NN并行效率、实现时间性能加速的目的。
  • 一种gpu处理器nn性能并行实现装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top