Descripción General

Atlas Cloud proporciona computación Serverless para inferencia de IA, entrenamiento de modelos, computación general y servicios API, permitiendo a los usuarios pagar por segundo por el uso de cómputo. La plataforma admite escalado automático basado en el volumen de solicitudes.

Puede utilizar los siguientes métodos:

Endpoint: Use imágenes personalizadas para inferencia de IA, entrenamiento de modelos y otras tareas
Quick Deploy: Cree rápidamente servicios de inferencia vLLM / SD utilizando imágenes preconstruidas

¿Por Qué Elegir Atlas Cloud Serverless?

Debe elegir instancias Atlas Cloud Serverless por las siguientes razones:

Rentable: Pague solo por el tiempo de cómputo que realmente use, facturado por segundo
Control de Inicio/Detención: Pause instancias cuando no las necesite para ahorrar costos, reanude instantáneamente cuando las necesite
Alto Rendimiento: Acceda a las últimas GPU NVIDIA, incluidas A100, H100 y L4
Escalado Automático: Escale automáticamente de 1 a 100 workers según la demanda
Soporte de Contenedores: Admite imágenes Docker públicas y privadas
Arranque en Frío Rápido: Tiempo de arranque en frío optimizado a 2-3 segundos para la mayoría de los modelos
Monitoreo y Registros: Métricas en tiempo real y registro completo para uso de GPU, CPU y memoria
Integración de Almacenamiento: Monte almacenamiento de red en workers para mantener la persistencia de datos entre eventos de escalado

¿Por Qué Elegir Atlas Cloud Serverless?

En esta página