Serverless
Gestion des instances
Apprenez à démarrer, arrêter et gérer vos instances serverless
États et contrôles des instances
Les instances Atlas Cloud Serverless peuvent être gérées pour optimiser les coûts et l'utilisation des ressources. Vous avez un contrôle total pour démarrer et arrêter vos instances selon vos besoins.
États des instances
Votre instance serverless peut être dans l'un des états suivants :
| État | Affichage Workers | Indicateur d'état | Actions disponibles | Description |
|---|---|---|---|---|
| Running | 1/1 Running | ✅ Ready (vert) | Bouton Stop | L'instance est active et accepte les requêtes |
| Stopped | 0/1 Running | Idle | Bouton Start (noir) | L'instance est en pause, aucun frais encouru |
Démarrer une instance arrêtée
Lorsque votre instance serverless est arrêtée, vous pouvez rapidement la reprendre :
Quand démarrer
- Votre instance affiche le statut
0/1 Running - Vous devez rendre le service disponible pour les requêtes
- Vous souhaitez reprendre un service précédemment mis en pause
Comment démarrer
- Localisez votre instance arrêtée dans le tableau de bord - elle affichera
0/1 Runningavec un bouton Start noir - Cliquez sur le bouton Start (▶️)
- Confirmez l'action lorsque vous êtes invité avec "Are you sure to start this endpoint?"
- Attendez l'activation - l'instance passera à l'état en cours d'exécution
Ce qui se passe
- L'état de l'instance passe de Stopped à Active
- Les pods de workers sont créés (prend 30-60 secondes)
- L'indicateur d'état passe à ✅ Ready
- La facturation reprend pour l'instance en cours d'exécution
- Votre endpoint API devient disponible pour les requêtes
Arrêter une instance en cours d'exécution
Vous pouvez arrêter les instances en cours d'exécution pour économiser des coûts lorsqu'elles ne sont pas nécessaires :
Quand arrêter
- Votre instance affiche
1/1 Runningavec le statut ✅ Ready - Vous souhaitez mettre en pause le service pour économiser des coûts
- Le service n'est pas actuellement nécessaire mais vous prévoyez de l'utiliser plus tard
Comment arrêter
- Localisez votre instance en cours d'exécution - elle affichera
1/1 Runningavec le statut ✅ Ready - Cliquez sur le bouton Stop (⏹️)
- Attendez que l'instance s'arrête - la transition se produit rapidement
Ce qui se passe
- L'état de l'instance passe de Active à Stopped
- Les pods de workers sont terminés (prend 5-15 secondes)
- L'affichage se met à jour pour montrer
0/1 Running - La facturation s'arrête immédiatement - pas de frais pendant l'arrêt
- Votre URL d'endpoint API reste valide mais ne répondra pas aux requêtes
Gestion des coûts
Instance active
- Facturation : Facturée à la seconde en fonction du type de GPU et du nombre de workers
- Formule de coût : Durée × Prix unitaire × GPUs par Worker
- Auto-scaling : Peut scale entre Active Workers et Max Workers
Instance arrêtée
- Facturation : Pas de frais - 100% d'économies
- Persistant : Votre configuration et URL d'endpoint sont préservées
- Reprise rapide : Peut être redémarrée à tout moment avec le bouton Start
Conseils d'optimisation des coûts
- Arrêter pendant les périodes d'inactivité : Arrêtez les instances lorsqu'elles ne sont pas activement utilisées
- Surveiller les modèles d'utilisation : Identifiez les moments optimaux pour arrêter/démarrer
- Économies nocturnes : Envisagez d'arrêter les instances de développement en dehors des heures de bureau
- Optimisation du week-end : Arrêtez les instances non-production pendant les week-ends
- Reprise rapide : Les instances redémarrent en moins d'une minute si nécessaire
Considérations importantes
Disponibilité du service
- Instances arrêtées : L'URL reste valide mais ne renvoie aucune réponse
- Latence de démarrage : Attendez-vous à 30-60 secondes pour que l'instance devienne pleinement disponible
- Pas de perte de données : L'arrêt d'une instance n'affecte pas votre configuration ou stockage monté
Comportement d'auto-scaling
- Instances arrêtées : Pas d'auto-scaling (effectivement mis à zéro)
- Instances actives : Auto-scaling complet entre Active Workers et Max Workers
- Scale-to-zero : Les instances actives avec Active Workers défini sur 0 peuvent auto-scale à zéro pendant les périodes d'inactivité
Journaux et surveillance
- Métriques : Disponibles pour les instances arrêtées et actives
- Journaux historiques : Préservés à travers les cycles start/stop
- Événements : Les opérations start/stop sont enregistrées dans l'historique des événements de votre instance
Dépannage
L'instance ne démarre pas
- Assurez-vous d'avoir un solde de compte suffisant
- Vérifiez que l'instance est dans l'état Stopped
- Vérifiez que vous avez la permission de gérer l'instance
- Attendez un moment et actualisez si l'interface utilisateur ne s'est pas mise à jour
L'instance ne s'arrête pas
- Assurez-vous que l'instance est dans l'état Active/Running
- Autorisez les requêtes actuelles à se terminer (arrêt gracieux)
- Vérifiez que vous avez la permission de gérer l'instance
Incohérence d'état
- Actualisez la page pour voir le dernier état
- Autorisez 30-60 secondes pour que les transitions d'état se terminent
- Vérifiez les journaux de l'instance pour tout message d'erreur
Meilleures pratiques
- Planifiez votre utilisation : Arrêtez les instances pendant les périodes d'inactivité connues
- Surveillez avant d'arrêter : Vérifiez s'il y a des requêtes actives
- Arrêt gracieux : Autorisez les requêtes en cours à se terminer
- Workflow de développement : Arrêtez les instances de développement lorsque vous ne codez pas
- Optimisation des tests : Démarrez pour les tests, arrêtez immédiatement après
- Planification de production : Utilisez les données de surveillance pour optimiser les plannings start/stop