使用 vLLM¶ 首先,必须先在 Python 或 Docker 环境中为您的设备 安装 vLLM。 然后,vLLM 支持以下使用模式: 推理和部署:运行单个模型实例。 部署:为生产环境扩展模型实例。 训练:训练或微调模型。