Gestion des instances

États et contrôles des instances

Les instances Atlas Cloud Serverless peuvent être gérées pour optimiser les coûts et l'utilisation des ressources. Vous avez un contrôle total pour démarrer et arrêter vos instances selon vos besoins.

États des instances

Votre instance serverless peut être dans l'un des états suivants :

État	Affichage Workers	Indicateur d'état	Actions disponibles	Description
Running	`1/1 Running`	✅ Ready (vert)	Bouton Stop	L'instance est active et accepte les requêtes
Stopped	`0/1 Running`	Idle	Bouton Start (noir)	L'instance est en pause, aucun frais encouru

Démarrer une instance arrêtée

Lorsque votre instance serverless est arrêtée, vous pouvez rapidement la reprendre :

Quand démarrer

Votre instance affiche le statut 0/1 Running
Vous devez rendre le service disponible pour les requêtes
Vous souhaitez reprendre un service précédemment mis en pause

Comment démarrer

Localisez votre instance arrêtée dans le tableau de bord - elle affichera 0/1 Running avec un bouton Start noir
Cliquez sur le bouton Start (▶️)
Confirmez l'action lorsque vous êtes invité avec "Are you sure to start this endpoint?"
Attendez l'activation - l'instance passera à l'état en cours d'exécution

Ce qui se passe

L'état de l'instance passe de Stopped à Active
Les pods de workers sont créés (prend 30-60 secondes)
L'indicateur d'état passe à ✅ Ready
La facturation reprend pour l'instance en cours d'exécution
Votre endpoint API devient disponible pour les requêtes

Arrêter une instance en cours d'exécution

Vous pouvez arrêter les instances en cours d'exécution pour économiser des coûts lorsqu'elles ne sont pas nécessaires :

Quand arrêter

Votre instance affiche 1/1 Running avec le statut ✅ Ready
Vous souhaitez mettre en pause le service pour économiser des coûts
Le service n'est pas actuellement nécessaire mais vous prévoyez de l'utiliser plus tard

Comment arrêter

Localisez votre instance en cours d'exécution - elle affichera 1/1 Running avec le statut ✅ Ready
Cliquez sur le bouton Stop (⏹️)
Attendez que l'instance s'arrête - la transition se produit rapidement

Ce qui se passe

L'état de l'instance passe de Active à Stopped
Les pods de workers sont terminés (prend 5-15 secondes)
L'affichage se met à jour pour montrer 0/1 Running
La facturation s'arrête immédiatement - pas de frais pendant l'arrêt
Votre URL d'endpoint API reste valide mais ne répondra pas aux requêtes

Gestion des coûts

Instance active

Facturation : Facturée à la seconde en fonction du type de GPU et du nombre de workers
Formule de coût : Durée × Prix unitaire × GPUs par Worker
Auto-scaling : Peut scale entre Active Workers et Max Workers

Instance arrêtée

Facturation : Pas de frais - 100% d'économies
Persistant : Votre configuration et URL d'endpoint sont préservées
Reprise rapide : Peut être redémarrée à tout moment avec le bouton Start

Conseils d'optimisation des coûts

Arrêter pendant les périodes d'inactivité : Arrêtez les instances lorsqu'elles ne sont pas activement utilisées
Surveiller les modèles d'utilisation : Identifiez les moments optimaux pour arrêter/démarrer
Économies nocturnes : Envisagez d'arrêter les instances de développement en dehors des heures de bureau
Optimisation du week-end : Arrêtez les instances non-production pendant les week-ends
Reprise rapide : Les instances redémarrent en moins d'une minute si nécessaire

Considérations importantes

Disponibilité du service

Instances arrêtées : L'URL reste valide mais ne renvoie aucune réponse
Latence de démarrage : Attendez-vous à 30-60 secondes pour que l'instance devienne pleinement disponible
Pas de perte de données : L'arrêt d'une instance n'affecte pas votre configuration ou stockage monté

Comportement d'auto-scaling

Instances arrêtées : Pas d'auto-scaling (effectivement mis à zéro)
Instances actives : Auto-scaling complet entre Active Workers et Max Workers
Scale-to-zero : Les instances actives avec Active Workers défini sur 0 peuvent auto-scale à zéro pendant les périodes d'inactivité

Journaux et surveillance

Métriques : Disponibles pour les instances arrêtées et actives
Journaux historiques : Préservés à travers les cycles start/stop
Événements : Les opérations start/stop sont enregistrées dans l'historique des événements de votre instance

Dépannage

L'instance ne démarre pas

Assurez-vous d'avoir un solde de compte suffisant
Vérifiez que l'instance est dans l'état Stopped
Vérifiez que vous avez la permission de gérer l'instance
Attendez un moment et actualisez si l'interface utilisateur ne s'est pas mise à jour

L'instance ne s'arrête pas

Assurez-vous que l'instance est dans l'état Active/Running
Autorisez les requêtes actuelles à se terminer (arrêt gracieux)
Vérifiez que vous avez la permission de gérer l'instance

Incohérence d'état

Actualisez la page pour voir le dernier état
Autorisez 30-60 secondes pour que les transitions d'état se terminent
Vérifiez les journaux de l'instance pour tout message d'erreur

Meilleures pratiques

Planifiez votre utilisation : Arrêtez les instances pendant les périodes d'inactivité connues
Surveillez avant d'arrêter : Vérifiez s'il y a des requêtes actives
Arrêt gracieux : Autorisez les requêtes en cours à se terminer
Workflow de développement : Arrêtez les instances de développement lorsque vous ne codez pas
Optimisation des tests : Démarrez pour les tests, arrêtez immédiatement après
Planification de production : Utilisez les données de surveillance pour optimiser les plannings start/stop

Sur cette page