部署概述

目录

部署概述#

vLLM 生产栈提供了三种主要的部署选项,以适应不同的用例和基础设施要求。每个选项都提供独特的功能和优势。

部署选项#

Helm Chart 部署

使用 Helm chart 进行 Kubernetes 的标准部署方法。这提供了一种精简的方式来部署 vLLM,并可配置模型、资源和路由逻辑的参数。

自定义资源定义 (CRD)

使用 Kubernetes CRD 进行部署,以获得更高级的配置和基于操作员的管理。此选项提供了更大的灵活性,并与 Kubernetes 原生工作流集成。

网关推理扩展

高级部署选项,通过网关基础设施实现推理能力,支持单个推理模型和具有复杂路由功能的推理池。

选择最适合您的基础设施要求和用例复杂性的部署选项。