Serverless
Descripción General
Atlas Cloud proporciona computación Serverless para inferencia de IA, entrenamiento de modelos, computación general y servicios API, permitiendo a los usuarios pagar por segundo por el uso de cómputo. La plataforma admite escalado automático basado en el volumen de solicitudes.
Puede utilizar los siguientes métodos:
- Endpoint: Use imágenes personalizadas para inferencia de IA, entrenamiento de modelos y otras tareas
- Quick Deploy: Cree rápidamente servicios de inferencia vLLM / SD utilizando imágenes preconstruidas
¿Por Qué Elegir Atlas Cloud Serverless?
Debe elegir instancias Atlas Cloud Serverless por las siguientes razones:
- Rentable: Pague solo por el tiempo de cómputo que realmente use, facturado por segundo
- Control de Inicio/Detención: Pause instancias cuando no las necesite para ahorrar costos, reanude instantáneamente cuando las necesite
- Alto Rendimiento: Acceda a las últimas GPU NVIDIA, incluidas A100, H100 y L4
- Escalado Automático: Escale automáticamente de 1 a 100 workers según la demanda
- Soporte de Contenedores: Admite imágenes Docker públicas y privadas
- Arranque en Frío Rápido: Tiempo de arranque en frío optimizado a 2-3 segundos para la mayoría de los modelos
- Monitoreo y Registros: Métricas en tiempo real y registro completo para uso de GPU, CPU y memoria
- Integración de Almacenamiento: Monte almacenamiento de red en workers para mantener la persistencia de datos entre eventos de escalado