Serverless

管理實例

了解如何啟動、停止和管理您的 serverless 實例

實例狀態和控制

Atlas Cloud Serverless 實例可以管理以最佳化成本和資源使用。您可以完全控制根據需要啟動和停止實例。

實例狀態

您的 serverless 實例可以處於以下狀態之一:

狀態Workers 顯示狀態指示器可用操作描述
執行中1/1 Running✅ Ready(綠色)停止按鈕實例處於活動狀態並接受請求
已停止0/1 RunningIdle啟動按鈕(黑色)實例已暫停,不產生費用

啟動已停止的實例

當您的 serverless 實例停止時,您可以快速恢復它:

何時啟動

  • 您的實例顯示 0/1 Running 狀態
  • 您需要使服務可用於請求
  • 您想要恢復先前暫停的服務

如何啟動

  1. 在儀表板中定位您停止的實例 - 它將顯示 0/1 Running 和黑色的 Start 按鈕
  2. 點擊 Start 按鈕(▶️)
  3. 確認操作 - 當提示「您確定要啟動此端點嗎?」時
  4. 等待啟用 - 實例將轉換為執行狀態

會發生什麼

  • 實例狀態從已停止變更為活動
  • 建立 worker pods(需要 30-60 秒)
  • 狀態指示器變更為 ✅ Ready
  • 執行實例的計費恢復
  • 您的 API 端點可用於請求

停止執行中的實例

您可以停止執行中的實例以在不需要時節省成本:

何時停止

  • 您的實例顯示 1/1 Running 和 ✅ Ready 狀態
  • 您想暫停服務以節省成本
  • 服務目前不需要,但您計劃稍後使用

如何停止

  1. 定位您執行中的實例 - 它將顯示 1/1 Running 和 ✅ Ready 狀態
  2. 點擊 Stop 按鈕(⏹️)
  3. 等待實例停止 - 轉換很快發生

會發生什麼

  • 實例狀態從活動變更為已停止
  • Worker pods 被終止(需要 5-15 秒)
  • 顯示更新為 0/1 Running
  • 計費立即停止 - 停止時不收費
  • 您的 API 端點 URL 保持有效,但不會回應請求

成本管理

活動實例

  • 計費:根據 GPU 類型和 worker 數量按秒收費
  • 成本公式:持續時間 × 單價 × 每個 Worker 的 GPU
  • 自動擴展:可以在 Active Workers 和 Max Workers 之間擴展

已停止實例

  • 計費:不收費 - 100% 成本節省
  • 持久:您的配置和端點 URL 得到保留
  • 快速恢復:可以隨時使用 Start 按鈕重啟

成本最佳化技巧

  1. 在空閒期間停止:不積極使用時停止實例
  2. 監控使用模式:識別停止/啟動的最佳時間
  3. 夜間節省:考慮在營業時間外停止開發實例
  4. 週末最佳化:在週末停止非生產實例
  5. 快速恢復:實例在需要時可在一分鐘內重啟

重要考慮事項

服務可用性

  • 已停止實例:URL 保持有效但不返回回應
  • 啟動延遲:預計 30-60 秒實例才能完全可用
  • 無資料遺失:停止實例不會影響您的配置或掛載的儲存

自動擴展行為

  • 已停止實例:無自動擴展(實際上縮減至零)
  • 活動實例:在 Active Workers 和 Max Workers 之間完全自動擴展
  • 縮減至零:Active Workers 設定為 0 的活動實例可以在空閒期間自動縮減至零

日誌和監控

  • 指標:適用於已停止和活動實例
  • 歷史日誌:在啟動/停止週期中保留
  • 事件:啟動/停止操作記錄在實例的事件歷史記錄中

故障排除

實例無法啟動

  • 確保您有足夠的帳戶餘額
  • 檢查實例是否處於已停止狀態
  • 驗證您有管理實例的權限
  • 如果 UI 未更新,請稍等並重新整理

實例無法停止

  • 確保實例處於活動/執行狀態
  • 允許當前請求完成(優雅關閉)
  • 檢查您有管理實例的權限

狀態不一致

  • 重新整理頁面以查看最新狀態
  • 允許 30-60 秒完成狀態轉換
  • 檢查實例日誌以獲取任何錯誤訊息

最佳實踐

  1. 規劃您的使用:在已知的空閒期間停止實例
  2. 停止前監控:檢查是否有活動請求
  3. 優雅關閉:允許正在進行的請求完成
  4. 開發工作流程:不編碼時停止開發實例
  5. 測試最佳化:啟動進行測試,測試後立即停止
  6. 生產規劃:使用監控資料最佳化啟動/停止排程