고성능 AI 인프라 및 엔터프라이즈급 클라우드 서비스의 선두주자인 Atlas Cloud가 'AI 팩토리 – 미래의 데이터 센터' 시리즈의 일환으로 뉴욕증권거래소(NYSE)에서 진행된 제리 탕(Jerry Tang) CEO의 심층 인터뷰를 통해 글로벌 테크 무대에서 큰 주목을 받았습니다. 탕 CEO는 하이퍼스케일 GPU 컴퓨팅과 네오클라우드 플랫폼을 포함한 AI 인프라가 어떻게 디지털 전환을 재편하고 있는지, 특히 금융 서비스와 같이 보안, 규정 준수 및 확장성이 요구되는 산업에 대해 논의했습니다.
추론을 넘어선 운영 지능을 위한 비전
Atlas Cloud의 미션은 단순히 모델 추론을 가속화하는 것이 아니라, 지능을 엔터프라이즈 규모에서 운영 가능하고 안전하며 관리 가능하게 만드는 것입니다. 이 회사는 모델 불가지론적(Model-agnostic) 추론, 오케스트레이션, 거버넌스 및 자율 에이전트를 하나의 통합 아키텍처로 결합하여 자사의 플랫폼을 에이전틱 AI를 위한 엔터프라이즈 런타임으로 포지셔닝합니다. 이러한 비전을 통해 조직은 실시간 제어와 규정 준수를 유지하면서 복잡한 AI 워크로드를 안전하고 효율적으로 실행할 수 있습니다.
"우리는 단순히 추론 속도를 높이는 데 그치지 않고, 지능을 진정으로 운영 가능하게 만들고자 했습니다." — 제리 탕(Jerry Tang)
이러한 접근 방식은 AI가 단순히 비즈니스 시스템을 지원하는 데 그치지 않고, 데이터 프라이버시와 운영 제어가 가장 중요한 규제 산업에서 의사 결정, 자동화 및 엔터프라이즈 워크플로우의 핵심 기여자가 되는 미래를 목표로 합니다.
최첨단 인프라 및 혁신
Atlas Cloud의 플랫폼은 조직이 고급 AI 솔루션을 구축, 배포 및 확장할 수 있는 포괄적인 기능을 제공합니다.
- 까다로운 AI 워크로드를 지원할 수 있는 클러스터에 대한 안전하고 확장 가능한 액세스를 제공하는 고성능 GPU 클라우드 인프라.
- 간편한 맞춤화와 안전한 배포를 통해 주요 AI 모델에 대한 액세스를 통합하는 엔터프라이즈 AI 모델 서비스.
- 금융 서비스에 맞춤화된 자율 분석, 의사 결정 지원 및 워크플로우 자동화를 위한 금융 AI 에이전트.
- 데이터 보호가 필수적인 고도의 규제 분야 요구 사항을 충족하도록 설계된 보안 거버넌스 및 규정 준수 기능.
이러한 풀스택 접근 방식은 Atlas Cloud를 많은 전통적인 클라우드 제공업체와 차별화하며, 성능과 규정 준수를 모두 추구하는 기업을 위한 신뢰할 수 있는 인프라 파트너로 자리매김하게 합니다.
Atlas Inference: AI 경제성의 혁신
2025년, Atlas Cloud는 SGLang과의 협업을 통해 개발된 차세대 AI 추론 플랫폼인 Atlas Inference를 출시했습니다. 이 플랫폼은 대규모 언어 모델(LLM)을 실행하는 데 필요한 GPU 및 서버 리소스를 획기적으로 줄여, 많은 경쟁 솔루션보다 높은 처리량과 낮은 운영 비용을 제공합니다.
벤치마크 테스트에서 Atlas Inference의 구성은 다른 주요 클라우드 벤더의 더 큰 설정에 비해 최대 2.1배 높은 처리량을 기록하는 동시에, 더 적은 서버를 사용하고 낮은 지연 시간을 유지했습니다. 이는 확장 가능하고 비용 효율적인 AI 배포가 필요한 조직에 있어 획기적인 발전입니다.
"우리 플랫폼이 초당 수만 개의 토큰을 처리할 수 있다는 것은 기업이 대량의 AI 서비스를 단순히 수지타산에 맞추는 수준을 넘어 수익성 있게 운영할 수 있음을 의미합니다." — 제리 탕(Jerry Tang)
전략적 파트너십 및 지속 가능한 성장
Atlas Cloud는 지속 가능하고 확장 가능한 AI 인프라에 대한 약속을 강화하는 전략적 산업 파트너십을 통해 지속적으로 확장하고 있습니다.
- NewYork GreenCloud와의 주요 협력을 통해 재생 에너지 기반의 GPU 클러스터를 배포합니다. 이는 환경적으로 책임 있는 기술에 대한 Atlas의 장기적인 약속을 강조하는 60억 달러 규모의 지속 가능한 AI 컴퓨팅 이니셔티브의 일환입니다.
- Soluna Holdings와의 파트너십을 통해 에너지 효율적인 하드웨어에서 고급 AI 비디오 처리 워크로드를 지원하며, 재생 가능하고 확장 가능한 데이터 센터 솔루션에 대한 Atlas Cloud의 참여를 보여줍니다.
- **수잔 라비코프(Suzanne Rabicoff)를 현장 부문 최고 책임자(Chief of Field)**로 영입하는 등 리더십 채용을 통해 네오클라우드 서비스를 지속적으로 확장하여 기업의 차세대 AI 인프라 도입을 위한 시장 진출 전략을 가속화하고 있습니다.
이러한 협업은 AI 혁신이 지속 가능성 및 운영 우수성과 결합되어야 한다는 Atlas Cloud의 신념과 일치하며, 고객이 환경적 또는 규제적 목표를 타협하지 않고 컴퓨팅 파워를 확장할 수 있도록 지원합니다.
금융 서비스 및 신뢰 경제 역량 강화
NYSE 인터뷰 내내 제리 탕은 금융 기관이 직면한 고유한 과제, 특히 데이터 프라이버시, 규제 준수, 그리고 기존 퍼블릭 클라우드 서비스의 한계에 대한 우려를 강조했습니다. Atlas Cloud의 아키텍처는 이러한 과제를 해결하기 위해 목적에 맞게 구축되어, 민감한 금융 데이터를 안전하게 처리하고 분석할 수 있는 신뢰할 수 있는 컴퓨팅 환경을 제공합니다.
Atlas Cloud는 금융 기관이 완전한 거버넌스와 규정 준수 하에 복잡한 AI 워크로드를 실행할 수 있도록 지원함으로써, 리스크를 엄격하게 통제하면서 생산성을 높이고 노동 집약적인 워크플로우의 전환을 돕습니다.
향후 전망: 비즈니스를 위한 실무형 AI
AI 수요가 계속 가속화됨에 따라 Atlas Cloud는 AI를 실용적이고 효율적이며 기업 환경에 적합하게 만드는 플랫폼 발전에 전념하고 있습니다. NYSE에서 공유된 제리 탕의 비전은 미래의 인텔리전스가 단순히 강력한 모델에 있는 것이 아니라, 실제 비즈니스 영향력을 위해 컴퓨팅, 거버넌스 및 애플리케이션 수준의 기능을 통합하는 시스템에 있다는 회사의 신념을 강화합니다.
Atlas Cloud 플랫폼: 세계 최초의 통합 멀티모달 추론 런타임
인프라와 비전을 넘어, Atlas Cloud는 자사의 플랫폼인 세계 최초의 통합 풀 모달리티(Full-modality) 추론 런타임을 통해 개발자와 기업이 AI 애플리케이션을 구축, 배포 및 확장하는 방식을 재정의하고 있습니다.
현대적인 AI 빌더를 위해 처음부터 설계된 Atlas Cloud 플랫폼은 모든 모달리티에 대해 하나의 API를 제공하여 여러 벤더, SDK 및 배포 환경을 관리해야 하는 파편화와 복잡성을 제거합니다.
Atlas Cloud를 통해 개발자는 다음과 같은 분야에서 원활하게 작업할 수 있습니다.
- 대화형 AI 및 대규모 언어 모델 추론
- 고급 추론 및 에이전틱 워크플로우
- 이미지 이해 및 생성
- 오디오 처리 및 음성 지능
- 비디오 분석 및 멀티모달 인식
이 모든 것이 단일하고 일관된 API 계층 내에서 이루어집니다.
하나의 API. 모든 모달리티. 엔터프라이즈용.
Atlas Cloud의 플랫폼 철학은 간단합니다:
플랫폼을 교체하지 않고도 멀티모달 인텔리전스를 탐색, 테스트 및 확장하는 것.
텍스트, 비전, 오디오 및 비디오를 위해 별도의 서비스를 연결하는 대신, Atlas Cloud는 팀이 다음과 같이 할 수 있도록 하는 통합 추론 패브릭을 제공합니다.
- 멀티모달 애플리케이션의 신속한 프로토타입 제작
- 모달리티 전반에 걸친 모델 테스트 및 벤치마킹
- 일관된 성능과 거버넌스로 프로덕션 워크로드 확장
- 엔터프라이즈급 보안, 관측 가능성 및 규정 준수 유지
이를 통해 개발 마찰을 획기적으로 줄이는 동시에 AI 기반 제품의 출시 기간을 단축합니다.
개발자를 위해 구축되고, 기업이 신뢰하는
Atlas Cloud는 개발자 경험과 엔터프라이즈 요구 사항 사이의 간극을 메웁니다.
- 깔끔한 API, 예측 가능한 성능 및 모델 불가지론적 유연성을 갖춘 개발자 우선 설계
- 액세스 제어, 감사 가능성 및 규정 준수 준비 배포를 포함한 엔터프라이즈급 거버넌스
- 대규모 확장을 위한 비용 효율성에 최적화된 고성능 추론
- 시스템 아키텍처 재설계 없이 실험에서 프로덕션으로의 원활한 전환
차세대 AI 어시스턴트, 멀티모달 에이전트 또는 지능형 자동화 파이프라인을 구축할 때 개발자는 인프라의 복잡성이 아닌 기능과 결과에만 집중할 수 있습니다.
멀티모달 추론에서 에이전틱 인텔리전스로
Atlas Cloud 플랫폼은 단순한 추론 게이트웨이 그 이상입니다. 이는 실시간으로 모달리티 전반에서 추론하고 인식하고 행동하는 지능형 시스템을 가능하게 하는 에이전틱 AI의 런타임 기반 역할을 합니다.
멀티모달 추론을 오케스트레이션 및 거버넌스와 통합함으로써 Atlas Cloud는 조직이 AI를 고립된 기능에서 비즈니스 워크플로우에 직접 내장된 운영 지능으로 전환할 수 있도록 지원합니다.
단순화된 AI 개발의 미래
AI 애플리케이션이 점점 더 멀티모달화되고 자율화됨에 따라, Atlas Cloud 플랫폼은 다음과 같은 명확한 경로를 제시합니다.
- 하나의 플랫폼
- 하나의 API
- 전체 모달리티 인텔리전스
- 확장성, 보안 및 실제 배포를 위해 구축됨
Atlas Cloud는 단순히 모델을 구동하는 것이 아니라, 엔터프라이즈 규모에서 AI가 구축되고, 배포되고, 신뢰받는 방식을 주도하고 있습니다.





