“敖玉龙”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果20个，建议您升级VIP下载更多相关专利

[发明专利]计算图处理方法、装置、设备、存储介质以及程序产品-CN202211416815.9有效
发明人：梁建中;赵英利;曹州;敖玉龙;于佃海 -专利权人：北京百度网讯科技有限公司
申请日： 2022-11-11 - 公布日： 2023-10-20 - 主分类号： G06N3/08 文献下载
摘要：本公开提供了一种计算图处理方法、装置、设备、存储介质以及程序产品，涉及计算机技术、数据处理技术领域，尤其涉及人工智能、深度学习、芯片技术领域。具体实现方案为：将深度学习模型的计算图划分为多个计算图分段；确定每一个计算图分段在硬件单元上运行的资源占用‑运算比，其中，资源占用‑运算比表征计算图分段相对于硬件单元的资源占用量和运算量之间的比值；根据硬件单元的可用资源量和计算图分段的资源占用‑运算比，确定目标计算图分段；以及根据目标计算图分段，修改计算图，得到更新计算图。
计算处理方法装置设备存储介质以及程序产品

[发明专利]模型运行策略确定方法、装置、电子设备以及存储介质-CN202211512936.3有效
发明人：曹州;敖玉龙;梁建中;赵英利;于佃海 -专利权人：北京百度网讯科技有限公司
申请日： 2022-11-25 - 公布日： 2023-09-19 - 主分类号： G06N20/00 文献下载
摘要：本公开提供了模型运行策略确定方法、装置、电子设备、存储介质和程序产品，涉及人工智能技术领域，尤其涉及深度学习技术领域和计算机技术领域。具体实现方案为：确定深度学习模型按照串行策略运行的实际运行时长，串行策略表征深度学习模型在单一硬件单元上运行的策略；基于实际运行时长，确定关于深度学习模型的单粒度运算时长；针对多个分布式策略中的每个分布式策略，基于深度学习模型的单粒度运算时长，确定深度学习模型按照分布式策略运行的运行代价，分布式策略表征在多个硬件单元上运行深度学习模型的策略；以及基于多个分布式策略各自的运行代价，从多个分布式策略中确定要应用于多个硬件单元的目标分布式策略。
模型运行策略确定方法装置电子设备以及存储介质

[发明专利]执行配置信息的生成方法、模型训练方法和装置-CN202111513923.3有效
发明人：李龙;巩伟宝;吴志华;敖玉龙 -专利权人：北京百度网讯科技有限公司
申请日： 2021-12-10 - 公布日： 2023-05-23 - 主分类号： G06F18/214 文献下载
摘要：本公开提供了一种执行配置信息的生成方法、模型训练方法、装置、设备以及存储介质，涉及人工智能技术领域，尤其涉及图像处理、深度学习等技术领域。具体实现方案为：针对用于训练模型的进程，设置进程的拓扑结构；以及根据拓扑结构，对用于训练模型的张量和算子执行标记操作，得到执行配置信息，其中，执行配置信息包括：张量的切分信息、张量与进程之间的对应关系和算子的变量的切分信息。
执行配置信息生成方法模型训练装置

[发明专利]基于多GPU的分布式深度学习模型训练代价的获取方法-CN202210542619.X有效
发明人：曹州;敖玉龙;梁建中;吴志华;于佃海 -专利权人：北京百度网讯科技有限公司
申请日： 2022-05-18 - 公布日： 2023-05-05 - 主分类号： G06T1/20 文献下载
摘要：本公开提供了一种基于多图像处理器GPU的分布式深度学习模型训练代价的获取方法，涉及人工智能领域，尤其涉及深度学习及云计算技术领域。具体实现方案为：获取并行策略；针对每个并行策略，获取多个GPU对应的每个算子的时间代价，并将所有的算子的时间代价之和作为目标时间代价；获取每个算子的内存消耗，并将所有的内存消耗之和作为目标内存消耗；根据目标内存消耗和目标时间代价，获取训练代价，并根据训练代价，选取最优并行策略。由此，本公开综合考虑算子的时间代价和内存消耗，更加准确地获取并行策略的训练代价，进而为选取最优并行策略奠定了坚实的基础。进一步地，无需考虑模型结构，为平台资源分配和并行策略的选择提供显著的指导意义。
基于 gpu 分布式深度学习模型训练代价获取方法

[发明专利]模型的分布式训练方法、装置、设备以及存储介质-CN202111505374.5有效
发明人：翁珺;曹州;敖玉龙;吴志华;于佃海;马艳军 -专利权人：北京百度网讯科技有限公司
申请日： 2021-12-10 - 公布日： 2023-04-07 - 主分类号： G06F18/214 文献下载
摘要：本公开提供了模型的分布式训练方法、装置、设备以及存储介质，涉及人工智能技术领域，尤其涉及深度学习、云计算等领域。具体实现方案为：基于待训练模型，生成初始切分策略；确定待训练模型在初始切分策略下的第一属性描述信息；第一属性描述信息用于表征待训练模型在初始切分策略下的存储空间占用情况和运行时长中的至少一项；基于第一属性描述信息，对初始切分策略进行优化，得到符合预设条件的目标切分策略；基于目标切分策略对待训练模型进行切分，得到切分结果，切分结果用于对待训练模型进行分布式训练。根据本公开的技术，针对模型的分布式训练场景，缩短了训练时长、提高了训练效率、并且降低了训练成本。
模型分布式训练方法装置设备以及存储介质

[发明专利]分布式模型训练方法、装置、设备、存储介质及程序产品-CN202211496745.2在审
发明人：赵英利;敖玉龙;梁建中;曹州;于佃海 -专利权人：北京百度网讯科技有限公司
申请日： 2022-11-23 - 公布日： 2023-04-04 - 主分类号： G06N3/08 文献下载
摘要：本公开提供了一种分布式模型训练方法、装置、设备、存储介质以及程序产品，涉及数据处理领域，尤其涉及人工智能、深度学习、分布式技术领域。具体实现方案为：接收来自针对目标计算单元的模型数据，其中，模型数据包括模型参数、训练数据以及计算图；根据计算图和分布式策略，确定分布式全局计算图；对模型参数进行初始化，得到初始模型参数；将分布式全局计算图和初始模型参数发送至多个分布式计算单元；以及响应于接收到来自分布式计算单元的目标深度学习模型，将目标深度学习模型发送至目标计算单元；其中，目标深度学习模型，是分布式计算单元根据训练数据和全局计算图对初始模型参数进行更新后得到的。
分布式模型训练方法装置设备存储介质程序产品

[发明专利]基于多GPU的分布式深度学习方法、装置及电子设备-CN202210542618.5有效
发明人：赵英利;曹州;梁建中;敖玉龙;吴志华;于佃海 -专利权人：北京百度网讯科技有限公司
申请日： 2022-05-18 - 公布日： 2023-03-24 - 主分类号： G06T1/20 文献下载
摘要：本公开提供了一种基于多图形处理器GPU的分布式深度学习方法、装置及电子设备，涉及人工智能领域，尤其涉及深度学习及云计算技术领域。具体实现方案为：确定当前阶段满足参数自动转换条件，则获取上一阶段的第一切片参数；对第一切片参数进行拼接，以得到完整模型参数；获取当前阶段对应的分布式属性信息，并对完整模型参数进行切分以得到第二切片参数；将第二切片参数分配至各自对应的GPU，以使GPU进行深度学习模型的深度学习。由此，本公开能够根据切片参数及其分布式属性，自动对模型参数进行转换，以保证模型的可持续性以及正确的推理，进而通过提高参数合并过程中的效率和准确率，确保分布式深度学习模型的深度学习效果。
基于 gpu 分布式深度学习方法装置电子设备

[发明专利]模型训练方法、装置以及设备-CN202211393891.2在审
发明人：梁建中;敖玉龙;于佃海 -专利权人：北京百度网讯科技有限公司
申请日： 2022-11-08 - 公布日： 2023-01-03 - 主分类号： G06F18/214 文献下载
摘要：本公开提供了一种模型训练方法、装置以及设备，涉及人工智能技术领域，具体涉及深度学习等技术领域。该方法的一具体实施方式包括：将模型的未切分模型状态集合和第i个已切分模型状态集合存储到第i个设备的显存中；获取第i个训练样本集，以及通过设备间通信从其他n‑1个设备获取其他n‑1个已切分模型状态集合，对模型进行训练，得到模型的各个模型状态的第一梯度；基于模型的各个模型状态的第一梯度更新未切分模型状态集合和第i个已切分模型状态集合。该实施方式减少了模型状态切分数量，从而降低了训练过程中模型状态的通信时间，优化训练速度，满足更好更快训练深度学习大模型的需求。
模型训练方法装置以及设备

[发明专利]深度学习模型的分布式训练方法、装置、设备及存储介质-CN202111264469.2有效
发明人：吴志华;于佃海;敖玉龙;巩伟宝 -专利权人：北京百度网讯科技有限公司
申请日： 2021-10-28 - 公布日： 2022-12-30 - 主分类号： G06F9/50 文献下载
摘要：本公开提供了一种深度学习模型的分布式训练方法、装置、设备及存储介质，涉及人工智能技术领域，具体为深度学习、云计算技术领域。该方法包括：基于待训练深度学习模型的数据信息生成分布式计算视图；基于待训练深度学习模型对应的集群硬件资源的属性信息生成集群资源视图；基于分布式计算视图和集群资源视图确定分布式训练任务的目标切分策略；基于目标切分策略对待训练深度学习模型进行分布式训练。本公开提供的深度学习模型的分布式训练方法，该方法提升了深度学习模型的分布式训练的效率，并提高了对集群硬件资源的利用率，且该方法具有可扩展性高、可维护性高、鲁棒性高。
深度学习模型分布式训练方法装置设备存储介质

[发明专利]任务调度方法及装置、电子设备和存储-CN202210541962.2有效
发明人：梁建中;敖玉龙;赵英利;曹州;吴志华;于佃海 -专利权人：北京百度网讯科技有限公司
申请日： 2022-05-17 - 公布日： 2022-12-09 - 主分类号： G06F9/48 文献下载
摘要：本公开提供了一种任务调度方法及装置、电子设备和存储，涉及人工智能技术领域，尤其涉及分布式计算和深度学习技术领域。实现方案为：获取目标模型的训练任务，训练任务包括计算图和分布式属性，计算图包括多个顺序处理模块和多个循环处理模块；将计算图拆分为多个目标块，每个目标块对应于多个顺序处理模块或者对应于任一循环处理模块；基于分布式属性，确定用于执行训练任务的多个计算设备的数量，并且将多个目标块中的每个目标块拆分为该数量的多个目标子块；基于多个目标块各自对应的多个目标子块，生成多个训练子任务，每个训练子任务包括多个目标块的相同编号的目标子块；以及将多个训练子任务分配至多个计算设备以并行执行。
任务调度方法装置电子设备存储

[发明专利]数据处理方法、装置、电子设备和存储介质-CN202111336067.9有效
发明人：梁建中;敖玉龙;吴志华;于佃海 -专利权人：北京百度网讯科技有限公司
申请日： 2021-11-11 - 公布日： 2022-10-14 - 主分类号： G06N20/00 文献下载
摘要：本公开提供了一种数据处理方法，涉及人工智能技术领域，尤其涉及分布式计算技术和深度学习技术。具体实现方案为：针对至少一个计算图中每个计算图，执行以下操作：针对该计算图中的多个目标对象，根据每个目标对象的分布式属性，对每个目标对象进行N次切分，得到多个目标子对象，其中，N为大于或等于1的整数；根据所述多个目标子对象，得到N个计算子图；以及根据所述每个计算图的N个计算子图，进行数据处理。本公开还提供了一种数据处理装置、电子设备和存储介质。
数据处理方法装置电子设备存储介质

[发明专利]深度学习框架的张量切分方法、装置、设备和存储介质-CN202111312626.2有效
发明人：曹州;敖玉龙;梁建中;吴志华;于佃海 -专利权人：北京百度网讯科技有限公司
申请日： 2021-11-08 - 公布日： 2022-08-23 - 主分类号： G06N20/00 文献下载
摘要：本公开提供了一种深度学习框架的张量切分方法、装置、设备和存储介质，涉及计算机技术领域，具体涉及深度学习等人工智能领域。深度学习框架的张量切分方法包括：获取原始切片，所述原始切片基于原始分布式属性对张量进行切分后获得；将所述原始切片拼接成待处理切片；基于所述张量的目标分布式属性，将所述待处理切片切分为目标切片。本公开可以提高张量切分的通用性。
深度学习框架张量切分方法装置设备存储介质

[发明专利]基于深度学习的多机集群拓扑映射方法、装置及程序产品-CN202110839429.X有效
发明人：吴志华;姜友和;白扬帆;常韬;于佃海;孙鹏;敖玉龙;巩伟宝 -专利权人：北京百度网讯科技有限公司
申请日： 2021-07-23 - 公布日： 2022-08-19 - 主分类号： G06F15/16 文献下载
摘要：本公开提供了一种基于深度学习的多机集群拓扑映射方法、装置及程序产品，涉及深度学习、网络技术、高性能计算、拓扑探测和分布式系统技术领域。该方法的一实施方式包括：响应于接收到拓扑映射请求，获取多机集群的目标通信拓扑图；以及获取多机集群的目标集群拓扑图，其中，目标集群拓扑图以多机集群中的多个设备为节点和以多个设备之间的物理链路为边，多个设备中的每个设备包括至少一个图形处理器；将目标通信拓扑图映射到目标集群拓扑图。
基于深度学习集群拓扑映射方法装置程序产品

[发明专利]模型训练方法、装置、电子设备及介质-CN202111334192.6有效
发明人： 敖玉龙;吴志华;巩伟宝;于佃海 -专利权人：北京百度网讯科技有限公司
申请日： 2021-11-11 - 公布日： 2022-08-09 - 主分类号： G06K9/62 文献下载
摘要：本公开提供了一种模型训练方法、装置、电子设备及介质，涉及人工智能领域，尤其涉及分布式计算技术领域。实现方案为：将待训练模型划分为多个逻辑分区，以使待训练模型中的多个算子中的每一者被划分至多个逻辑分区中的至少一个逻辑分区之中；响应于确定存在第一数量的可用设备，将多个逻辑分区中的每一者分别映射至第一数量的可用设备中的至少一个可用设备；以及响应于多个逻辑分区中的每一者的映射结果满足预设可执行条件，使能第一数量的可用设备，以使多个算子能够基于待训练模型的执行流程而被执行。
模型训练方法装置电子设备介质

[发明专利]一种GPU处理器上的K-NN的高性能并行实现装置-CN202011203928.1有效
发明人：杨超;李雨芮;敖玉龙;李敏;李克森 -专利权人：北京大学
申请日： 2020-11-02 - 公布日： 2021-09-17 - 主分类号： G06F9/50 文献下载
摘要：本发明提供了一种GPU处理器上的K‑NN的高性能并行实现装置，用于提高在GPU处理器上分类的并行加速实现。本发明装置包括：数据读入模块将应用场景中的训练数据和测试数据存成矩阵形式；样本距离计算模块计算每个测试样本与所有训练样本的距离；Top‑K选择模块利用预训练好的决策树模型判断执行粒度，包括线程级别优化、线程束级别优化、线程块级别优化、多线程块级别优化以及基于基数排序优化，选取前k个元素；标签选择模块为测试样本设置类别标签。本发明使用基于分治法的Top‑K并行框架，大大减少不必要的操作，能更充分的利用硬件资源，达到在GPU处理器上提高K‑NN并行效率、实现时间性能加速的目的。
一种 gpu 处理器 nn 性能并行实现装置

1
2
下一页»
尾页
共 20 条