Serverless
Gestión de Instancias
Aprenda cómo iniciar, detener y gestionar instancias serverless
Estado y Control de Instancias
Las instancias Atlas Cloud Serverless se pueden gestionar para optimizar costos y uso de recursos. Tiene control total para iniciar y detener instancias según sea necesario.
Estados de Instancia
Una instancia serverless puede estar en uno de los siguientes estados:
| Estado | Visualización de Workers | Indicador de Estado | Acciones Disponibles | Descripción |
|---|---|---|---|---|
| En Ejecución | 1/1 Running | ✅ Listo (verde) | Botón Detener | La instancia está activa y aceptando solicitudes |
| Detenido | 0/1 Running | Inactivo | Botón Iniciar (negro) | La instancia está pausada, sin cargos |
Iniciar una Instancia Detenida
Cuando una instancia serverless está detenida, puede reanudarla rápidamente:
Cuándo Iniciar
- Cuando la instancia muestra el estado
0/1 Running - Cuando necesita que el servicio esté disponible para solicitudes
- Cuando desea reanudar un servicio pausado previamente
Cómo Iniciar
- Localice la instancia detenida en el panel - Mostrará
0/1 Runningcon un botón negro Iniciar - Haga clic en el botón Iniciar (▶️)
- Confirme la acción cuando se le solicite "¿Está seguro de que desea iniciar este Endpoint?"
- Espere la activación - La instancia hará la transición al estado en ejecución
Qué Sucede
- El estado de la instancia cambia de detenido a activo
- Se crean pods de workers (toma 30-60 segundos)
- El indicador de estado cambia a ✅ Listo
- La facturación se reanuda para la instancia en ejecución
- El Endpoint API se vuelve disponible para solicitudes
Detener una Instancia en Ejecución
Puede detener instancias en ejecución para ahorrar costos cuando no las necesite:
Cuándo Detener
- Cuando la instancia muestra
1/1 Runningcon estado ✅ Listo - Cuando desea pausar el servicio para ahorrar costos
- Cuando el servicio no es necesario actualmente pero planea usarlo más tarde
Cómo Detener
- Localice la instancia en ejecución - Mostrará
1/1 Runningcon estado ✅ Listo - Haga clic en el botón Detener (⏹️)
- Espere a que la instancia se detenga - La transición ocurre rápidamente
Qué Sucede
- El estado de la instancia cambia de activo a detenido
- Los pods de workers se terminan (toma 5-15 segundos)
- La visualización se actualiza a
0/1 Running - La facturación se detiene inmediatamente - Sin cargos mientras está detenido
- La URL del Endpoint API sigue siendo válida pero no responderá a solicitudes
Gestión de Costos
Instancias Activas
- Facturación: Se cobra por segundo basándose en el tipo de GPU y número de workers
- Fórmula de Costo: Duración × Precio Unitario × GPUs por Worker
- Escalado Automático: Puede escalar entre workers activos y workers máximos
Instancias Detenidas
- Facturación: Sin cargos - 100% de ahorro de costos
- Permanente: La configuración y la URL del Endpoint se preservan
- Reanudación Rápida: Se puede reiniciar en cualquier momento con el botón Iniciar
Consejos de Optimización de Costos
- Detener Durante Períodos Inactivos: Detenga instancias cuando no estén en uso activo
- Monitorear Patrones de Uso: Identifique los mejores momentos para detener/iniciar
- Ahorro Nocturno: Considere detener instancias de desarrollo fuera del horario laboral
- Optimización de Fin de Semana: Detenga instancias no productivas durante los fines de semana
- Reanudación Rápida: Reinicie instancias en menos de 1 minuto cuando sea necesario
Consideraciones Importantes
Disponibilidad del Servicio
- Instancias Detenidas: La URL es válida pero no devolverá respuestas
- Retraso de Inicio: Espere 30-60 segundos para que la instancia esté completamente disponible
- Sin Pérdida de Datos: Detener la instancia no afecta la configuración o el almacenamiento montado
Comportamiento de Escalado Automático
- Instancias Detenidas: Sin escalado automático (efectivamente escalado a cero)
- Instancias Activas: Escalado automático completo entre workers activos y máximos
- Escalar a Cero: Las instancias activas con workers activos configurados en 0 pueden escalar automáticamente a cero durante períodos inactivos
Registros y Monitoreo
- Métricas: Disponibles tanto para instancias detenidas como activas
- Registros Históricos: Preservados entre ciclos de inicio/detención
- Eventos: Las acciones de inicio/detención se registran en el historial de eventos de la instancia
Solución de Problemas
La Instancia No Se Inicia
- Verifique que el saldo de la cuenta sea suficiente
- Confirme que la instancia esté en estado detenido
- Verifique que tenga permisos para gestionar la instancia
- Espere un momento y actualice si la UI no se actualiza
La Instancia No Se Detiene
- Confirme que la instancia esté en estado activo/en ejecución
- Permita que se completen las solicitudes actuales (apagado elegante)
- Verifique que tenga permisos para gestionar la instancia
Inconsistencia de Estado
- Actualice la página para verificar el último estado
- Permita 30-60 segundos para que se completen las transiciones de estado
- Verifique los registros de la instancia para cualquier mensaje de error
Mejores Prácticas
- Planifique el Uso: Detenga instancias durante períodos inactivos conocidos
- Monitoree Antes de Detener: Verifique que no haya solicitudes activas
- Apagado Elegante: Permita que las solicitudes en curso se completen
- Flujo de Trabajo de Desarrollo: Detenga instancias de desarrollo cuando no esté codificando
- Optimización de Pruebas: Inicie para pruebas, detenga inmediatamente después
- Planificación de Producción: Use datos de monitoreo para optimizar horarios de inicio/detención