跳到内容

KubeAI

KubeAI 是一个 Kubernetes 算子,可让您在 Kubernetes 上部署和管理 AI 模型。它提供了一种简单且可扩展的方式,可在生产环境中部署 vLLM。诸如零启动扩展、基于负载的自动伸缩、模型缓存等功能均开箱即用,无需任何外部依赖。

请参阅安装指南以获取特定环境的说明。

安装 KubeAI 后,您可以使用 vLLM 配置文本生成模型