跳到内容

使用 vLLM

首先,必须先在 Python 或 Docker 环境中为您的设备 安装 vLLM。

然后,vLLM 支持以下使用模式: