您正在查看最新的开发者预览文档。点击此处查看最新稳定版本的文档。

离线推理

离线推理#

离线推理示例演示了如何在离线设置中使用 vLLM，在这种设置中，模型会批量查询预测。我们建议从基础开始。