跳到内容

KubeRay

KubeRay 提供了一种 Kubernetes 原生方式来在 Ray 集群上运行 vLLM 工作负载。Ray 集群可以通过 YAML 进行声明,操作员(Operator)随后负责处理 Pod 调度、网络配置、重启和蓝绿部署——所有这些操作都保持了熟悉的 Kubernetes 体验。

为什么要选择 KubeRay 而不是手动脚本?

功能 手动脚本 KubeRay
集群引导 手动 SSH 到每个节点并运行脚本 使用一条命令创建或更新整个集群:kubectl apply -f cluster.yaml
自动扩缩容 手动 自动修补 CRD 以调整集群大小
升级 手动拆除并重新创建 支持蓝/绿部署更新
声明式配置 Bash 标志位 & 环境变量 GitOps 友好的 YAML CRD (RayCluster/RayService)

使用 KubeRay 可以减少运维负担,并简化 Ray + vLLM 与现有 Kubernetes 工作流(CI/CD、密钥、存储类等)的集成。

了解更多