Serverless
Обзор
Atlas Cloud предоставляет бессерверные вычисления для инференса ИИ, обучения моделей, общих вычислений и API-сервисов, позволяя пользователям платить посекундно за использование вычислительных ресурсов. Платформа поддерживает автоматическое масштабирование на основе объёма запросов.
Вы можете использовать следующие методы:
- Endpoint: Используйте пользовательские образы для инференса ИИ, обучения моделей и других задач
- Quick Deploy: Используйте предварительно собранные образы для быстрого создания сервисов инференса vLLM / SD
Почему Atlas Cloud Serverless?
Вам следует выбрать инстансы Atlas Cloud Serverless по следующим причинам:
- Экономичность: Оплата только за фактически использованное вычислительное время, посекундная тарификация
- Контроль запуска/остановки: Приостанавливайте инстансы, когда они не нужны, для экономии средств, мгновенное возобновление при необходимости
- Высокая производительность: Доступ к новейшим GPU NVIDIA, включая A100, H100 и L4
- Автомасштабирование: Автоматическое масштабирование от 1 до 100 воркеров в зависимости от нагрузки
- Поддержка контейнеров: Поддержка как публичных, так и приватных Docker-образов
- Быстрый холодный старт: Оптимизированное время холодного старта 2-3 секунды для большинства моделей
- Мониторинг и логи: Метрики в реальном времени для GPU, CPU, использования памяти и полное логирование
- Интеграция хранилища: Монтирование сетевого хранилища к воркерам для сохранения данных при масштабировании