Skip to content

Network 子系统

关注重点

  • RDMA 拓扑与拥塞控制
  • NCCL 集体通信性能
  • 跨机房链路策略与容灾

建议指标

  • AllReduce 吞吐
  • 端到端时延
  • 丢包与重传率

AI-HPC Organization · Contact: openaihpc@gmail.com