Modal¶ vLLM 可以在雲 GPU 上執行,藉助 Modal——一個專為快速自動擴縮而設計的無伺服器計算平臺。 有關如何在 Modal 上部署 vLLM 的詳細資訊,請參閱 Modal 文件中的此教程。