멀티모달 AI 추론의 통합: 왜 AIClient2API인가?

AI 애플리케이션을 구축하거나 에이전트 워크플로우를 프로토타이핑할 때, 최적의 모델을 찾기 위해 여러 대규모 언어 모델(LLM)을 실험해야 하는 경우가 많습니다. 하지만 제공업체마다 API 구조와 프로토콜이 다르기 때문에, 공급자를 전환할 때마다 번거로운 코드 리팩토링과 백엔드 로직의 지속적인 업데이트가 필요합니다.

AIClient2API는 바로 이러한 문제를 해결합니다. 이 도구는 Gemini CLI, Antigravity, Codex, Grok, Kiro와 같은 플랫폼의 클라이언트 요청을 시뮬레이션하여, 이를 단일화된 OpenAI 호환 API 인터페이스로 캡슐화하는 지능형 프록시 계층 역할을 합니다. 프로토콜 통합 외에도, 각 노드의 실시간 상태를 모니터링할 수 있는 웹 UI 대시보드를 제공합니다.

핵심 기능

제로 코스트 모델 교체: 표준 OpenAI SDK 형식으로 통합 코드를 한 번 작성하면, 비즈니스 로직 수정 없이 백엔드 제공업체를 동적으로 전환할 수 있습니다.
시각적 관리 콘솔: 실시간 구성 관리, 상태 모니터링, 내장된 플레이그라운드를 통한 API 테스트, 요청 로그 감사 기능을 갖춘 웹 UI 대시보드를 포함합니다.

기술 아키텍처 및 구현

이 프로젝트는 프로토콜 변환을 처리하고 고가용성을 유지하기 위해 Node.js 기반의 AI 우선 모듈형 아키텍처를 사용합니다:

plaintext
1[ Your Application (Cherry-Studio / Cline / Custom Code) ]
2                           │ (Standard OpenAI / Claude Request)
3                           ▼
4            ┌─────────────────────────────┐
5            │     AIClient2API Gateway    │
6            └──────────────┬──────────────┘
7                           │
8             ┌─────────────┴─────────────┐
9             ▼                           ▼
10     ┌──────────────┐            ┌──────────────┐
11     │  Adapters    │            │ Provider Pool│
12     └───────┬──────┘            └───────┬──────┘
13             │                           │ (Health Check / Cooldown)
14             ▼                           ▼
15     ┌──────────────┐            ┌──────────────┐
16     │ TLS Sidecar  │            │ Failover &   │
17     │ (Go uTLS)    │            │ Fallback     │
18     └───────┬──────┘            └───────┬──────┘
19             │                           │
20             └─────────────┬─────────────┘
21                           ▼
22   [ Backends: Gemini, Grok, Kiro...]

1. 전략 및 어댑터 패턴

요청이 게이트웨이에 도달하면 시스템은 대상 모델 제공업체를 식별하고 특정 서비스 어댑터를 통해 라우팅합니다. 어댑터는 표준 OpenAI 또는 Claude 페이로드를 업스트림 클라이언트가 요구하는 정확한 구조(예: Gemini의 내부 CLI 구조 또는 Grok의 엔드포인트)로 변환하며, 표준 응답과 스트리밍(text/event-stream) 응답을 모두 매끄럽게 처리합니다.

2. 지능형 제공업체 풀 및 폴백(Fallback) 체인

운영 환경 수준의 안정성을 보장하기 위해 프록시는 계정 및 엔드포인트 풀을 관리합니다:

자동 상태 점검 및 쿨다운: 시스템은 주기적으로 하트비트를 수행합니다. 노드에 장애가 발생하거나 429 Too Many Requests 제한이 트리거되면, 해당 노드는 임시 쿨다운 큐로 이동하고 자동으로 우회 경로로 라우팅됩니다.
교차 유형 폴백: 특정 제공업체 유형의 할당량이 모두 소진될 경우, 프로토콜이 일치하는 한 게이트웨이는 미리 구성된 폴백 체인을 따라 요청을 전달할 수 있습니다(예: gemini-cli-oauth에서 gemini-antigravity로 전환).

3. TLS 핑거프린트 모방 (TLS Sidecar)

일부 업스트림 서비스는 엄격한 네트워크 검사를 수행하여 브라우저 TLS 핑거프린트와 일치하지 않는 요청을 차단합니다. 이를 해결하기 위해 이 프로젝트는 Go(uTLS 사용)로 작성된 TLS 사이드카 프록시를 포함합니다. 이는 표준 Chrome TLS 핸드셰이크를 에뮬레이션하고 HTTP/2 협상을 자동으로 처리하여 403 Forbidden 오류를 방지합니다.

생태계 통합: AtlasCloud 네이티브 지원

atlascloud

최신 업데이트에서 AIClient2API는 올인원 멀티모달 AI 추론 플랫폼인 AtlasCloud에 대한 네이티브 제공업체 지원을 도입했습니다.

AtlasCloud는 Qwen 3.6, DeepSeek v4 pro, Kimi k2.6, GLM 5.1 등 비용 효율적인 모델들을 단일 엔드포인트로 통합합니다. AtlasCloud를 AIClient2API 풀에 통합하면 다음과 같은 이점이 있습니다:

매끄러운 전환 및 안정적인 처리량: DeepSeek의 추론 능력, Qwen의 언어 처리, 멀티모달 생성 모델 간에 마찰 없이 전환할 수 있습니다. 기반 엔터프라이즈 인프라가 안정적인 동시 처리율을 보장합니다.
즉시 사용 가능한 템플릿: 리포지토리에는 provider_pools.json.example 내 구성 프리셋과 전용 라우터 경로가 포함되어 있어 즉시 시작할 수 있습니다.

이 설정은 인프라 오버헤드를 최소화하려는 개발자가 AtlasCloud의 경제적인 코딩 플랜 프로모션에 참여할 때 매우 유용합니다.

시작하기

Docker를 통한 배포:
Bash

plaintext
1docker run -d -p 3000:3000 -p 8085-8086:8085-8086 -p 1455:1455 -p 19876-19880:19876-19880 --restart=always -v "your_path/configs:/app/configs" --name aiclient2api justlikemaki/aiclient-2-api

웹 UI를 통한 구성: http://localhost:3000 (기본 비밀번호: admin123)에 접속하여 자격 증명을 추가하고 시각적으로 제공업체를 관리합니다.
트래픽 라우팅: 사용하는 AI 데스크톱 클라이언트나 백엔드 SDK의 주소를 로컬 게이트웨이 인스턴스로 지정하세요.

전체 구현 세부 정보, 문서 및 고급 구성 옵션은 GitHub 리포지토리를 방문하세요.

👉 AIClient2API

목록으로 돌아가기