Serverless
개요
Atlas Cloud는 AI 추론, 모델 학습, 일반 컴퓨팅 및 API 서비스를 위한 Serverless 컴퓨팅을 제공하여 사용자가 컴퓨팅 사용량에 대해 초 단위로 비용을 지불할 수 있도록 합니다. 플랫폼은 요청 볼륨에 따라 자동 확장을 지원합니다.
다음 방법을 사용할 수 있습니다:
- Endpoint: AI 추론, 모델 학습 및 기타 작업에 사용자 정의 이미지 사용
- Quick Deploy: 사전 구축된 이미지를 사용하여 vLLM / SD 추론 서비스를 빠르게 생성
왜 Atlas Cloud Serverless를 선택해야 하나요?
다음과 같은 이유로 Atlas Cloud Serverless 인스턴스를 선택해야 합니다:
- 비용 효율적: 실제 사용한 컴퓨팅 시간에 대해서만 초 단위로 비용 지불
- 시작/중지 제어: 필요하지 않을 때 인스턴스를 일시 중지하여 비용 절감, 필요할 때 즉시 재개
- 고성능: A100, H100 및 L4를 포함한 최신 NVIDIA GPU에 액세스
- 자동 확장: 수요에 따라 1명에서 100명의 워커로 자동 확장
- 컨테이너 지원: 공개 및 비공개 Docker 이미지 모두 지원
- 빠른 콜드 스타트: 대부분의 모델에 대해 2-3초로 최적화된 콜드 스타트 시간
- 모니터링 및 로그: GPU, CPU, 메모리 사용량에 대한 실시간 메트릭 및 포괄적인 로깅
- 스토리지 통합: 네트워크 스토리지를 워커에 마운트하여 확장 이벤트 간 데이터 지속성 유지