Serverless

Обзор

Atlas Cloud предоставляет бессерверные вычисления для инференса ИИ, обучения моделей, общих вычислений и API-сервисов, позволяя пользователям платить посекундно за использование вычислительных ресурсов. Платформа поддерживает автоматическое масштабирование на основе объёма запросов.

Вы можете использовать следующие методы:

  1. Endpoint: Используйте пользовательские образы для инференса ИИ, обучения моделей и других задач
  2. Quick Deploy: Используйте предварительно собранные образы для быстрого создания сервисов инференса vLLM / SD

Почему Atlas Cloud Serverless?

Вам следует выбрать инстансы Atlas Cloud Serverless по следующим причинам:

  • Экономичность: Оплата только за фактически использованное вычислительное время, посекундная тарификация
  • Контроль запуска/остановки: Приостанавливайте инстансы, когда они не нужны, для экономии средств, мгновенное возобновление при необходимости
  • Высокая производительность: Доступ к новейшим GPU NVIDIA, включая A100, H100 и L4
  • Автомасштабирование: Автоматическое масштабирование от 1 до 100 воркеров в зависимости от нагрузки
  • Поддержка контейнеров: Поддержка как публичных, так и приватных Docker-образов
  • Быстрый холодный старт: Оптимизированное время холодного старта 2-3 секунды для большинства моделей
  • Мониторинг и логи: Метрики в реальном времени для GPU, CPU, использования памяти и полное логирование
  • Интеграция хранилища: Монтирование сетевого хранилища к воркерам для сохранения данных при масштабировании