Serverless

インスタンスの管理

Serverlessインスタンスの起動、停止、管理方法を学ぶ

インスタンスの状態と制御

Atlas Cloud Serverlessインスタンスは、コストとリソース使用を最適化するために管理できます。必要に応じてインスタンスを起動および停止する完全な制御権があります。

インスタンスの状態

Serverlessインスタンスは、次のいずれかの状態にあります:

状態ワーカー表示ステータスインジケーター利用可能なアクション説明
Running1/1 Running✅ Ready(緑)停止ボタンインスタンスがアクティブでリクエストを受け付けています
Stopped0/1 RunningIdle起動ボタン(黒)インスタンスが一時停止中、課金は発生しません

停止したインスタンスの起動

Serverlessインスタンスが停止している場合、迅速に再開できます:

いつ起動するか

  • インスタンスが0/1 Runningステータスを表示している
  • サービスをリクエストに利用可能にする必要がある
  • 以前に一時停止したサービスを再開したい

起動方法

  1. 停止したインスタンスを見つける - ダッシュボードで0/1 Runningと黒いStartボタンが表示されます
  2. Startボタンをクリック (▶️)
  3. アクションを確認 - 「このEndpointを起動してもよろしいですか?」というプロンプトが表示されたら確認
  4. アクティブ化を待つ - インスタンスが実行状態に移行します

何が起こるか

  • インスタンスの状態がStoppedからActiveに変わります
  • ワーカーPodが作成されます(30〜60秒かかります)
  • ステータスインジケーターが✅ Readyに変わります
  • 実行中のインスタンスの課金が再開されます
  • API Endpointがリクエストに利用可能になります

実行中のインスタンスの停止

不要な時にコストを節約するために、実行中のインスタンスを停止できます:

いつ停止するか

  • インスタンスが1/1 Runningと✅ Readyステータスを表示している
  • コストを節約するためにサービスを一時停止したい
  • サービスが現在必要ないが、後で使用する予定がある

停止方法

  1. 実行中のインスタンスを見つける - 1/1 Runningと✅ Readyステータスが表示されます
  2. Stopボタンをクリック (⏹️)
  3. インスタンスが停止するまで待つ - 移行はすぐに行われます

何が起こるか

  • インスタンスの状態がActiveからStoppedに変わります
  • ワーカーPodが終了されます(5〜15秒かかります)
  • 表示が0/1 Runningを示すように更新されます
  • 課金が即座に停止 - 停止中は課金されません
  • API Endpoint URLは有効なままですが、リクエストに応答しません

コスト管理

アクティブなインスタンス

  • 課金: GPUタイプとワーカー数に基づいて秒単位で課金
  • コスト式: 期間 × 単価 × ワーカーあたりのGPU
  • 自動スケーリング: Active WorkersとMax Workersの間でスケール可能

停止したインスタンス

  • 課金: 課金なし - 100%のコスト削減
  • 永続性: 設定とEndpoint URLが保持されます
  • クイック再開: Startボタンでいつでも再起動可能

コスト最適化のヒント

  1. アイドル期間中に停止: 積極的に使用していない時にインスタンスを停止
  2. 使用パターンを監視: 停止/起動の最適なタイミングを特定
  3. 夜間の節約: 営業時間外に開発インスタンスの停止を検討
  4. 週末の最適化: 週末に非本番インスタンスを停止
  5. クイック再開: 必要な時にインスタンスは1分以内に再起動

重要な考慮事項

サービスの可用性

  • 停止したインスタンス: URLは有効なままですが、応答を返しません
  • 起動待ち時間: インスタンスが完全に利用可能になるまで30〜60秒かかります
  • データ損失なし: インスタンスの停止は、設定やマウントされたストレージに影響しません

自動スケーリングの動作

  • 停止したインスタンス: 自動スケーリングなし(事実上ゼロにスケール)
  • アクティブなインスタンス: Active WorkersとMax Workersの間で完全な自動スケーリング
  • ゼロへのスケール: Active Workersが0に設定されているアクティブなインスタンスは、アイドル期間中にゼロまで自動スケール可能

ログとモニタリング

  • メトリクス: 停止したインスタンスとアクティブなインスタンスの両方で利用可能
  • 履歴ログ: 起動/停止サイクル全体で保持されます
  • イベント: 起動/停止操作はインスタンスのイベント履歴に記録されます

トラブルシューティング

インスタンスが起動しない

  • アカウント残高が十分であることを確認
  • インスタンスがStopped状態であることを確認
  • インスタンスを管理する権限があることを確認
  • UIが更新されていない場合は、しばらく待ってから更新

インスタンスが停止しない

  • インスタンスがActive/Running状態であることを確認
  • 現在のリクエストが完了するまで待つ(グレースフルシャットダウン)
  • インスタンスを管理する権限があることを確認

ステータスの不整合

  • ページを更新して最新のステータスを確認
  • 状態遷移が完了するまで30〜60秒待つ
  • エラーメッセージがないかインスタンスログを確認

ベストプラクティス

  1. 使用を計画: 既知のアイドル期間中にインスタンスを停止
  2. 停止前に監視: アクティブなリクエストがあるか確認
  3. グレースフルシャットダウン: 進行中のリクエストが完了するまで待つ
  4. 開発ワークフロー: コーディングしていない時は開発インスタンスを停止
  5. テストの最適化: テスト用に起動し、テスト後すぐに停止
  6. 本番計画: モニタリングデータを使用して起動/停止スケジュールを最適化