跳到内容

使用 vLLM

vLLM 支持以下使用模式

  • 推理与服务:运行模型的单个实例。
  • 部署:扩展模型实例以用于生产环境。
  • 训练:训练或微调模型。