Serverless

概覽

Atlas Cloud 為 AI 推理、模型訓練、通用運算和 API 服務提供 Serverless 運算，允許使用者按秒付費。平台支援基於請求量的自動擴展。

您可以使用以下方法：

Endpoint：使用自訂映像進行 AI 推理、模型訓練和其他任務
Quick Deploy：使用預建映像快速建立 vLLM / SD 推理服務

為什麼選擇 Atlas Cloud Serverless？

您應該選擇 Atlas Cloud Serverless 實例的原因如下：

成本效益：僅支付實際使用的運算時間，按秒計費
啟動/停止控制：不需要時暫停實例以節省成本，需要時立即恢復
高效能：存取最新的 NVIDIA GPU，包括 A100、H100 和 L4
自動擴展：根據需求自動從 1 擴展到 100 個工作程序
容器支援：支援公開和私有 Docker 映像
快速冷啟動：大多數模型的最佳化冷啟動時間為 2-3 秒
監控與日誌：GPU、CPU、記憶體使用量的即時指標和全面的日誌記錄
儲存整合：將網路儲存掛載到工作程序以在擴展事件中保持資料持久性

快速開始

上一頁

快速開始

下一頁

本頁目錄

為什麼選擇 Atlas Cloud Serverless？