Serverless

Instanzen verwalten

Erfahren Sie, wie Sie Ihre Serverless-Instanzen starten, stoppen und verwalten

Instanzstatus und Steuerung

Atlas Cloud Serverless-Instanzen können verwaltet werden, um Kosten und Ressourcennutzung zu optimieren. Sie haben die volle Kontrolle, um Ihre Instanzen nach Bedarf zu starten und zu stoppen.

Instanzstatus

Ihre Serverless-Instanz kann sich in einem der folgenden Zustände befinden:

StatusWorker-AnzeigeStatusanzeigeVerfügbare AktionenBeschreibung
Running1/1 Running✅ Ready (grün)Stop-SchaltflächeInstanz ist aktiv und akzeptiert Anfragen
Stopped0/1 RunningIdleStart-Schaltfläche (schwarz)Instanz ist pausiert, keine Gebühren anfallen

Eine gestoppte Instanz starten

Wenn Ihre Serverless-Instanz gestoppt ist, können Sie sie schnell fortsetzen:

Wann starten

  • Ihre Instanz zeigt den Status 0/1 Running
  • Sie müssen den Service für Anfragen verfügbar machen
  • Sie möchten einen zuvor pausierten Service fortsetzen

Wie starten

  1. Finden Sie Ihre gestoppte Instanz im Dashboard - sie zeigt 0/1 Running mit einer schwarzen Start-Schaltfläche an
  2. Klicken Sie auf die Start-Schaltfläche (▶️)
  3. Bestätigen Sie die Aktion, wenn Sie gefragt werden "Are you sure to start this endpoint?"
  4. Warten Sie auf die Aktivierung - die Instanz wechselt in den laufenden Zustand

Was passiert

  • Der Instanzstatus ändert sich von Stopped zu Active
  • Worker-Pods werden erstellt (dauert 30-60 Sekunden)
  • Die Statusanzeige ändert sich zu ✅ Ready
  • Die Abrechnung wird für die laufende Instanz fortgesetzt
  • Ihr API-Endpoint wird für Anfragen verfügbar

Eine laufende Instanz stoppen

Sie können laufende Instanzen stoppen, um Kosten zu sparen, wenn sie nicht benötigt werden:

Wann stoppen

  • Ihre Instanz zeigt 1/1 Running mit ✅ Ready-Status
  • Sie möchten den Service pausieren, um Kosten zu sparen
  • Der Service wird derzeit nicht benötigt, aber Sie planen, ihn später zu verwenden

Wie stoppen

  1. Finden Sie Ihre laufende Instanz - sie zeigt 1/1 Running mit ✅ Ready-Status an
  2. Klicken Sie auf die Stop-Schaltfläche (⏹️)
  3. Warten Sie, bis die Instanz stoppt - der Übergang erfolgt schnell

Was passiert

  • Der Instanzstatus ändert sich von Active zu Stopped
  • Worker-Pods werden beendet (dauert 5-15 Sekunden)
  • Die Anzeige aktualisiert sich und zeigt 0/1 Running
  • Abrechnung stoppt sofort - keine Gebühren, während gestoppt
  • Ihre API-Endpoint-URL bleibt gültig, reagiert aber nicht auf Anfragen

Kostenmanagement

Aktive Instanz

  • Abrechnung: Sekundengenau abgerechnet basierend auf GPU-Typ und Worker-Anzahl
  • Kostenformel: Dauer × Einheitspreis × GPUs pro Worker
  • Auto-Scaling: Kann zwischen Active Workers und Max Workers skalieren

Gestoppte Instanz

  • Abrechnung: Keine Gebühren - 100% Kostenersparnis
  • Persistent: Ihre Konfiguration und Endpoint-URL werden beibehalten
  • Schneller Neustart: Kann jederzeit mit der Start-Schaltfläche neu gestartet werden

Tipps zur Kostenoptimierung

  1. Während Leerlaufzeiten stoppen: Stoppen Sie Instanzen, wenn sie nicht aktiv genutzt werden
  2. Nutzungsmuster überwachen: Identifizieren Sie optimale Zeiten zum Stoppen/Starten
  3. Über-Nacht-Einsparungen: Erwägen Sie, Entwicklungsinstanzen außerhalb der Geschäftszeiten zu stoppen
  4. Wochenend-Optimierung: Stoppen Sie Nicht-Produktionsinstanzen an Wochenenden
  5. Schneller Neustart: Instanzen starten in weniger als einer Minute neu, wenn benötigt

Wichtige Überlegungen

Service-Verfügbarkeit

  • Gestoppte Instanzen: Die URL bleibt gültig, gibt aber keine Antwort zurück
  • Start-Latenz: Erwarten Sie 30-60 Sekunden, bis die Instanz vollständig verfügbar ist
  • Kein Datenverlust: Das Stoppen einer Instanz beeinflusst Ihre Konfiguration oder gemounteten Speicher nicht

Auto-Scaling-Verhalten

  • Gestoppte Instanzen: Kein Auto-Scaling (effektiv auf Null skaliert)
  • Aktive Instanzen: Vollständiges Auto-Scaling zwischen Active Workers und Max Workers
  • Auf-Null-Skalieren: Aktive Instanzen mit Active Workers auf 0 gesetzt können während Leerlaufzeiten automatisch auf Null skalieren

Logs und Überwachung

  • Metriken: Verfügbar für sowohl gestoppte als auch aktive Instanzen
  • Historische Logs: Über Start/Stop-Zyklen hinweg erhalten
  • Ereignisse: Start/Stop-Operationen werden im Ereignisverlauf Ihrer Instanz protokolliert

Fehlerbehebung

Instanz startet nicht

  • Stellen Sie sicher, dass Sie ein ausreichendes Kontoguthaben haben
  • Überprüfen Sie, ob die Instanz im Stopped-Zustand ist
  • Verifizieren Sie, dass Sie die Berechtigung haben, die Instanz zu verwalten
  • Warten Sie einen Moment und aktualisieren Sie, falls die UI nicht aktualisiert wurde

Instanz stoppt nicht

  • Stellen Sie sicher, dass die Instanz im Active/Running-Zustand ist
  • Lassen Sie aktuelle Anfragen abschließen (graceful shutdown)
  • Überprüfen Sie, dass Sie die Berechtigung haben, die Instanz zu verwalten

Status-Inkonsistenz

  • Aktualisieren Sie die Seite, um den neuesten Status zu sehen
  • Lassen Sie 30-60 Sekunden für den Abschluss von Zustandsübergängen zu
  • Überprüfen Sie die Instanz-Logs auf Fehlermeldungen

Best Practices

  1. Planen Sie Ihre Nutzung: Stoppen Sie Instanzen während bekannter Leerlaufzeiten
  2. Überwachen Sie vor dem Stoppen: Prüfen Sie, ob es aktive Anfragen gibt
  3. Graceful Shutdown: Lassen Sie laufende Anfragen abschließen
  4. Entwicklungs-Workflow: Stoppen Sie Entwicklungsinstanzen, wenn Sie nicht codieren
  5. Test-Optimierung: Starten Sie zum Testen, stoppen Sie sofort danach
  6. Produktionsplanung: Nutzen Sie Überwachungsdaten, um Start/Stop-Zeitpläne zu optimieren