Skip to content

Cluster 子系统

核心能力

  • 多租户调度与隔离
  • 作业优先级与配额控制
  • 弹性扩缩容与抢占策略

建议指标

  • 作业等待时长 P95
  • GPU 利用率
  • 失败重试率

AI-HPC Organization · Contact: openaihpc@gmail.com