笔者之前的文章(万字综述 LLM 训练中的 Overlap 优化:字节 Flux 等 7 种方案)中详细介绍过各种计算与通信 Overlap 的方案,这里进一步介绍字节最近发表的 TileLink,其中提到的大部分工作已经包含在我们之前的综述中,建议优先阅读,比如 CoCoNet、Centauri、Flux 等。