Serverless
인스턴스 관리
serverless 인스턴스를 시작, 중지 및 관리하는 방법 알아보기
인스턴스 상태 및 제어
Atlas Cloud Serverless 인스턴스는 비용 및 리소스 사용을 최적화하기 위해 관리할 수 있습니다. 필요에 따라 인스턴스를 시작하고 중지할 수 있는 완전한 제어 권한이 있습니다.
인스턴스 상태
serverless 인스턴스는 다음 상태 중 하나일 수 있습니다:
| 상태 | 워커 표시 | 상태 표시기 | 사용 가능한 작업 | 설명 |
|---|---|---|---|---|
| 실행 중 | 1/1 Running | ✅ 준비됨(녹색) | 중지 버튼 | 인스턴스가 활성화되어 요청을 수락함 |
| 중지됨 | 0/1 Running | 유휴 | 시작 버튼(검은색) | 인스턴스가 일시 중지됨, 요금 발생 안 함 |
중지된 인스턴스 시작
serverless 인스턴스가 중지되면 빠르게 재개할 수 있습니다:
시작 시점
- 인스턴스가
0/1 Running상태를 표시할 때 - 서비스를 요청에 사용할 수 있도록 해야 할 때
- 이전에 일시 중지한 서비스를 재개하려고 할 때
시작 방법
- 대시보드에서 중지된 인스턴스 찾기 -
0/1 Running과 검은색 시작 버튼이 표시됨 - 시작 버튼 클릭 (▶️)
- "이 Endpoint를 시작하시겠습니까?"라는 메시지가 나타나면 작업 확인
- 활성화 대기 - 인스턴스가 실행 상태로 전환됨
발생하는 일
- 인스턴스 상태가 중지됨에서 활성으로 변경됨
- 워커 pod가 생성됨(30-60초 소요)
- 상태 표시기가 ✅ 준비됨으로 변경됨
- 실행 중인 인스턴스에 대한 청구가 재개됨
- API Endpoint가 요청에 사용 가능해짐
실행 중인 인스턴스 중지
필요하지 않을 때 실행 중인 인스턴스를 중지하여 비용을 절감할 수 있습니다:
중지 시점
- 인스턴스가 ✅ 준비됨 상태로
1/1 Running을 표시할 때 - 서비스를 일시 중지하여 비용을 절감하려고 할 때
- 서비스가 현재 필요하지 않지만 나중에 사용할 계획일 때
중지 방법
- 실행 중인 인스턴스 찾기 - ✅ 준비됨 상태로
1/1 Running이 표시됨 - 중지 버튼 클릭 (⏹️)
- 인스턴스가 중지될 때까지 대기 - 전환이 빠르게 이루어짐
발생하는 일
- 인스턴스 상태가 활성에서 중지됨으로 변경됨
- 워커 pod가 종료됨(5-15초 소요)
- 표시가
0/1 Running으로 업데이트됨 - 청구가 즉시 중지됨 - 중지된 동안 요금 없음
- API Endpoint URL은 유효하지만 요청에 응답하지 않음
비용 관리
활성 인스턴스
- 청구: GPU 유형 및 워커 수를 기준으로 초당 요금 부과
- 비용 공식: 기간 × 단가 × 워커당 GPU
- 자동 확장: 활성 워커와 최대 워커 사이에서 확장 가능
중지된 인스턴스
- 청구: 요금 없음 - 100% 비용 절감
- 영구적: 구성 및 Endpoint URL이 보존됨
- 빠른 재개: 시작 버튼으로 언제든지 재시작 가능
비용 최적화 팁
- 유휴 기간 동안 중지: 활발하게 사용하지 않을 때 인스턴스 중지
- 사용 패턴 모니터링: 중지/시작하기에 최적의 시간 식별
- 야간 절감: 업무 시간 외에 개발 인스턴스 중지 고려
- 주말 최적화: 주말 동안 비프로덕션 인스턴스 중지
- 빠른 재개: 필요할 때 1분 이내에 인스턴스 재시작
중요 고려 사항
서비스 가용성
- 중지된 인스턴스: URL은 유효하지만 응답이 반환되지 않음
- 시작 지연: 인스턴스가 완전히 사용 가능해지기까지 30-60초 예상
- 데이터 손실 없음: 인스턴스 중지가 구성 또는 마운트된 스토리지에 영향을 미치지 않음
자동 확장 동작
- 중지된 인스턴스: 자동 확장 없음(사실상 제로로 확장)
- 활성 인스턴스: 활성 워커와 최대 워커 간 전체 자동 확장
- 제로로 확장: 활성 워커가 0으로 설정된 활성 인스턴스는 유휴 기간 동안 제로로 자동 확장 가능
로그 및 모니터링
- 메트릭: 중지 및 활성 인스턴스 모두에 사용 가능
- 기록 로그: 시작/중지 주기 간 보존됨
- 이벤트: 시작/중지 작업이 인스턴스의 이벤트 기록에 기록됨
문제 해결
인스턴스가 시작되지 않음
- 계정 잔액이 충분한지 확인
- 인스턴스가 중지됨 상태인지 확인
- 인스턴스를 관리할 권한이 있는지 확인
- UI가 업데이트되지 않은 경우 잠시 기다렸다가 새로 고침
인스턴스가 중지되지 않음
- 인스턴스가 활성/실행 중 상태인지 확인
- 현재 요청이 완료되도록 허용(정상적인 종료)
- 인스턴스를 관리할 권한이 있는지 확인
상태 불일치
- 페이지를 새로 고쳐 최신 상태 확인
- 상태 전환이 완료되기까지 30-60초 허용
- 오류 메시지가 있는지 인스턴스 로그 확인
모범 사례
- 사용 계획: 알려진 유휴 기간 동안 인스턴스 중지
- 중지 전 모니터링: 활성 요청이 있는지 확인
- 정상적인 종료: 진행 중인 요청이 완료되도록 허용
- 개발 워크플로: 코딩하지 않을 때 개발 인스턴스 중지
- 테스트 최적화: 테스트를 위해 시작하고 즉시 중지
- 프로덕션 계획: 모니터링 데이터를 사용하여 시작/중지 일정 최적화