Serverless

Gestión de Instancias

Aprenda cómo iniciar, detener y gestionar instancias serverless

Estado y Control de Instancias

Las instancias Atlas Cloud Serverless se pueden gestionar para optimizar costos y uso de recursos. Tiene control total para iniciar y detener instancias según sea necesario.

Estados de Instancia

Una instancia serverless puede estar en uno de los siguientes estados:

EstadoVisualización de WorkersIndicador de EstadoAcciones DisponiblesDescripción
En Ejecución1/1 Running✅ Listo (verde)Botón DetenerLa instancia está activa y aceptando solicitudes
Detenido0/1 RunningInactivoBotón Iniciar (negro)La instancia está pausada, sin cargos

Iniciar una Instancia Detenida

Cuando una instancia serverless está detenida, puede reanudarla rápidamente:

Cuándo Iniciar

  • Cuando la instancia muestra el estado 0/1 Running
  • Cuando necesita que el servicio esté disponible para solicitudes
  • Cuando desea reanudar un servicio pausado previamente

Cómo Iniciar

  1. Localice la instancia detenida en el panel - Mostrará 0/1 Running con un botón negro Iniciar
  2. Haga clic en el botón Iniciar (▶️)
  3. Confirme la acción cuando se le solicite "¿Está seguro de que desea iniciar este Endpoint?"
  4. Espere la activación - La instancia hará la transición al estado en ejecución

Qué Sucede

  • El estado de la instancia cambia de detenido a activo
  • Se crean pods de workers (toma 30-60 segundos)
  • El indicador de estado cambia a ✅ Listo
  • La facturación se reanuda para la instancia en ejecución
  • El Endpoint API se vuelve disponible para solicitudes

Detener una Instancia en Ejecución

Puede detener instancias en ejecución para ahorrar costos cuando no las necesite:

Cuándo Detener

  • Cuando la instancia muestra 1/1 Running con estado ✅ Listo
  • Cuando desea pausar el servicio para ahorrar costos
  • Cuando el servicio no es necesario actualmente pero planea usarlo más tarde

Cómo Detener

  1. Localice la instancia en ejecución - Mostrará 1/1 Running con estado ✅ Listo
  2. Haga clic en el botón Detener (⏹️)
  3. Espere a que la instancia se detenga - La transición ocurre rápidamente

Qué Sucede

  • El estado de la instancia cambia de activo a detenido
  • Los pods de workers se terminan (toma 5-15 segundos)
  • La visualización se actualiza a 0/1 Running
  • La facturación se detiene inmediatamente - Sin cargos mientras está detenido
  • La URL del Endpoint API sigue siendo válida pero no responderá a solicitudes

Gestión de Costos

Instancias Activas

  • Facturación: Se cobra por segundo basándose en el tipo de GPU y número de workers
  • Fórmula de Costo: Duración × Precio Unitario × GPUs por Worker
  • Escalado Automático: Puede escalar entre workers activos y workers máximos

Instancias Detenidas

  • Facturación: Sin cargos - 100% de ahorro de costos
  • Permanente: La configuración y la URL del Endpoint se preservan
  • Reanudación Rápida: Se puede reiniciar en cualquier momento con el botón Iniciar

Consejos de Optimización de Costos

  1. Detener Durante Períodos Inactivos: Detenga instancias cuando no estén en uso activo
  2. Monitorear Patrones de Uso: Identifique los mejores momentos para detener/iniciar
  3. Ahorro Nocturno: Considere detener instancias de desarrollo fuera del horario laboral
  4. Optimización de Fin de Semana: Detenga instancias no productivas durante los fines de semana
  5. Reanudación Rápida: Reinicie instancias en menos de 1 minuto cuando sea necesario

Consideraciones Importantes

Disponibilidad del Servicio

  • Instancias Detenidas: La URL es válida pero no devolverá respuestas
  • Retraso de Inicio: Espere 30-60 segundos para que la instancia esté completamente disponible
  • Sin Pérdida de Datos: Detener la instancia no afecta la configuración o el almacenamiento montado

Comportamiento de Escalado Automático

  • Instancias Detenidas: Sin escalado automático (efectivamente escalado a cero)
  • Instancias Activas: Escalado automático completo entre workers activos y máximos
  • Escalar a Cero: Las instancias activas con workers activos configurados en 0 pueden escalar automáticamente a cero durante períodos inactivos

Registros y Monitoreo

  • Métricas: Disponibles tanto para instancias detenidas como activas
  • Registros Históricos: Preservados entre ciclos de inicio/detención
  • Eventos: Las acciones de inicio/detención se registran en el historial de eventos de la instancia

Solución de Problemas

La Instancia No Se Inicia

  • Verifique que el saldo de la cuenta sea suficiente
  • Confirme que la instancia esté en estado detenido
  • Verifique que tenga permisos para gestionar la instancia
  • Espere un momento y actualice si la UI no se actualiza

La Instancia No Se Detiene

  • Confirme que la instancia esté en estado activo/en ejecución
  • Permita que se completen las solicitudes actuales (apagado elegante)
  • Verifique que tenga permisos para gestionar la instancia

Inconsistencia de Estado

  • Actualice la página para verificar el último estado
  • Permita 30-60 segundos para que se completen las transiciones de estado
  • Verifique los registros de la instancia para cualquier mensaje de error

Mejores Prácticas

  1. Planifique el Uso: Detenga instancias durante períodos inactivos conocidos
  2. Monitoree Antes de Detener: Verifique que no haya solicitudes activas
  3. Apagado Elegante: Permita que las solicitudes en curso se completen
  4. Flujo de Trabajo de Desarrollo: Detenga instancias de desarrollo cuando no esté codificando
  5. Optimización de Pruebas: Inicie para pruebas, detenga inmediatamente después
  6. Planificación de Producción: Use datos de monitoreo para optimizar horarios de inicio/detención