LLM分布式训练3---并行策略之流水线并行

发表于2025-04-24|更新于2025-04-27|LLM

|阅读量:

作者：@同济大学刘越

Github ID：@miracle-techlink

联系邮箱：miracle.techlink@gmail.com

校内邮箱: 2254018@tongji.edu.cn

本章将介绍分布式机器学习系统的基础概念、分布式训练的并行策略、分布式训练的集群架构，并以 DeepSpeed 为例，介绍如何在集群上训练大语言型。而这篇推送将主要介绍分布式训练的并行策略—-流水线并行。

分布式机器学习系统的基础概念

分布式训练的并行策略

分布式训练的集群架构

实操DDP-以DeepSpeed 为例

文章作者: Liuyue

相关推荐

数据库加载中