Serverless

Descripción General

Atlas Cloud proporciona computación Serverless para inferencia de IA, entrenamiento de modelos, computación general y servicios API, permitiendo a los usuarios pagar por segundo por el uso de cómputo. La plataforma admite escalado automático basado en el volumen de solicitudes.

Puede utilizar los siguientes métodos:

  1. Endpoint: Use imágenes personalizadas para inferencia de IA, entrenamiento de modelos y otras tareas
  2. Quick Deploy: Cree rápidamente servicios de inferencia vLLM / SD utilizando imágenes preconstruidas

¿Por Qué Elegir Atlas Cloud Serverless?

Debe elegir instancias Atlas Cloud Serverless por las siguientes razones:

  • Rentable: Pague solo por el tiempo de cómputo que realmente use, facturado por segundo
  • Control de Inicio/Detención: Pause instancias cuando no las necesite para ahorrar costos, reanude instantáneamente cuando las necesite
  • Alto Rendimiento: Acceda a las últimas GPU NVIDIA, incluidas A100, H100 y L4
  • Escalado Automático: Escale automáticamente de 1 a 100 workers según la demanda
  • Soporte de Contenedores: Admite imágenes Docker públicas y privadas
  • Arranque en Frío Rápido: Tiempo de arranque en frío optimizado a 2-3 segundos para la mayoría de los modelos
  • Monitoreo y Registros: Métricas en tiempo real y registro completo para uso de GPU, CPU y memoria
  • Integración de Almacenamiento: Monte almacenamiento de red en workers para mantener la persistencia de datos entre eventos de escalado