Modal# vLLM 可以在云 GPU 上通过 Modal 运行,Modal 是一个为快速自动缩放设计的无服务器计算平台。 有关如何在 Modal 上部署 vLLM 的详细信息,请参阅 Modal 文档中的本教程。