ERNIE Image API for Readable Text in Images

ERNIE Image API는 Apache 2.0에 따라 ERNIE-Image Team이 공개한 Baidu의 open-weight 8B Diffusion Transformer를 여러분의 스택에 제공합니다. LongTextBench에서 0.9733으로 최고 성능을 기록하며, 포스터 헤드라인과 만화 말풍선 텍스트를 선명하게 읽을 수 있게 유지합니다. 또한 distilled Turbo 변형은 추론 단계를 50단계에서 8단계로 줄입니다. Atlas Cloud는 투명한 종량제 가격으로 하나의 OpenAI-compatible endpoint를 통해 이를 제공합니다. 지금 바로 빌드를 시작하세요.

주요 모델 탐색

Atlas Cloud는 업계 최고의 최신 크리에이티브 모델을 제공합니다.

NEW

텍스트를 이미지로

TURBO

Baidu ERNIE Image Turbo Text-to-image

A fast, low-latency version of ERNIE Image by Baidu, optimized for rapid iteration and scalable image generation.Balances speed and quality, ideal for real-time and high-throughput scenarios.

FREE

무료

ERNIE Image API 엔드포인트 비교: Standard 및 Turbo Text-to-Image

각 Text-to-Image 엔드포인트를 속도와 품질 요구 사항에 맞게 선택하세요.

모달리티	설명
ERNIE Image API (Text To Image)	Turbo 엔드포인트가 처리량을 우선시하는 반면, 표준 ERNIE Image API는 동일한 Text-to-Image 작업에서 최대한 높은 출력 품질에 더 중점을 둡니다. 포스터, 에디토리얼 그래픽, 상업용 레이아웃처럼 작업 완료 시간보다 모든 디테일의 정확성이 더 중요한 최종 프로덕션 작업에 적합합니다.
ERNIE Image Turbo API (Text To Image)	하나의 텍스트 프롬프트를 요청당 최대 10장의 이미지로 변환할 수 있으며, 정사각형 1024 pixels부터 긴 변 기준 1376 pixels까지 7가지 종횡비를 지원합니다. 낮은 지연 시간에 맞게 튜닝되어 기본적으로 8 inference steps를 사용하며, 짧은 프롬프트를 생성 전에 확장해 주는 내장 Prompt Enhancer가 포함되어 있습니다. 빠른 반복 작업, 실시간 미리보기, 대량 배치 실행이 마지막 한 단계의 품질 향상보다 더 중요할 때 선택하세요.

모달리티

설명

ERNIE Image API (Text To Image)

Turbo 엔드포인트가 처리량을 우선시하는 반면, 표준 ERNIE Image API는 동일한 Text-to-Image 작업에서 최대한 높은 출력 품질에 더 중점을 둡니다. 포스터, 에디토리얼 그래픽, 상업용 레이아웃처럼 작업 완료 시간보다 모든 디테일의 정확성이 더 중요한 최종 프로덕션 작업에 적합합니다.

ERNIE Image Turbo API (Text To Image)

하나의 텍스트 프롬프트를 요청당 최대 10장의 이미지로 변환할 수 있으며, 정사각형 1024 pixels부터 긴 변 기준 1376 pixels까지 7가지 종횡비를 지원합니다. 낮은 지연 시간에 맞게 튜닝되어 기본적으로 8 inference steps를 사용하며, 짧은 프롬프트를 생성 전에 확장해 주는 내장 Prompt Enhancer가 포함되어 있습니다. 빠른 반복 작업, 실시간 미리보기, 대량 배치 실행이 마지막 한 단계의 품질 향상보다 더 중요할 때 선택하세요.

텍스트, 레이아웃, 제어를 위해 설계된 ERNIE Image API

업계 최고 수준의 텍스트 렌더링과 구조화된 멀티 패널 레이아웃부터 네이티브 이중 언어 프롬프팅, 기본 Prompt Enhancer, 7가지 출력 크기, 재현 가능한 Turbo 배치까지, ERNIE Image API는 정밀한 지시를 프로덕션에 바로 사용할 수 있는 이미지로 변환합니다.

ERNIE Image API의 읽기 쉬운 텍스트 렌더링

0.9733의 선도적인 LongTextBench 점수를 바탕으로, 모델은 생성 이미지 안에 읽기 쉽고 철자가 정확한 텍스트를 직접 렌더링할 수 있습니다. 만화 말풍선, 포스터 헤드라인, 인포그래픽 라벨, UI 목업 문구까지 모두 선명하고 가독성 있게 유지됩니다.

구조화된 멀티 패널 레이아웃

생성, 편집, 합성, 업스케일 프리미티브가 그리드 기반 공간 관계에 대한 이해와 함께 작동합니다. 이를 통해 디자이너는 하나의 중앙화된 파이프라인에서 일관된 멀티 패널 시퀀스와 형식화된 디자인을 만들 수 있습니다.

ERNIE Image API의 이중 언어 프롬프팅

English와 Chinese 프롬프트가 동일한 인코더 파이프라인에서 네이티브로 처리되어, 어느 언어에서든 관용적인 표현을 포착합니다. 이러한 이중 언어 능력은 글로벌 캠페인과 현지화 콘텐츠 모두에서 진정성 있는 비주얼 스토리텔링을 지원합니다.

기본으로 활성화된 Prompt Enhancer

기본으로 활성화된 경량 Prompt Enhancer는 짧은 입력을 diffusion backbone에 전달하기 전에 더 풍부하고 구조화된 설명으로 재작성합니다. 정확한 문구에 대한 문자 그대로의 제어가 더 중요할 때는 요청별로 끌 수 있습니다.

7가지 네이티브 출력 크기

7가지 네이티브 출력 크기는 정사각형 1024x1024, 최대 1376x768의 가로형 프레이밍, 최소 768x1376의 세로형 비율을 포괄합니다. 각 비율은 직접 생성되므로 모든 형식에서 프레이밍이 그대로 유지됩니다.

Turbo Mode의 ERNIE Image API

대기 없이 대량 처리가 필요하신가요? Turbo mode는 최소 8 inference steps로 실행되며 요청당 최대 10장의 이미지를 반환합니다. 또한 명시적 seed를 사용해 모든 결과를 재현할 수 있습니다.

ERNIE Image 정면 비교: 하나의 프롬프트, 세 가지 모델

완전히 같은 브리프를 플래그십 ERNIE Image 모델, 인기 경쟁 모델, 그리고 더 빠른 형제 모델에 입력한 뒤, 각 모델이 타이포그래피, 레이아웃, 빛을 어떻게 렌더링하는지 나란히 비교해 보세요.

프롬프트

상단에서 완전히 내려다본 플랫레이 정물 사진. 카메라는 전통 중국식 허브차 약재상의 오래되어 빛바랜 옅은 느릅나무 약재 카운터를 정수리 위에서 똑바로 바라보도록 완벽히 고정되어 있다. 늦은 오전의 강한 방향성 창문 빛이 오른쪽 낮은 각도에서 비스듬히 쏟아져 들어오며, 이 빛이 프레임의 진정한 주인공이다. 길고 선명하게 늘어진 그림자를 왼쪽으로 드리워 거친 나뭇결 위를 가로지르게 하고, 그 그림자들이 리딩 라인처럼 작용한다. 밀도 높게 채워진 오른쪽에는 투명한 유리병들이 빽빽하게 모여 있고, 햇빛이 통과하며 말린 국화 꽃봉오리, 붉은 구기자, 말려 말린 호박색 귤껍질(chenpi), 빛을 받는 짙은 진홍색 말린 로젤 꽃잎이 반투명하게 빛난다. 무광 녹청이 오른 작은 산화 황동 손저울, 고운 가루가 묻은 낡은 돌 절구와 절굿공이, 가장자리가 해지고 섬유질이 드러난 거친 섬유감의 손글씨 처방전 종이 쪽지에는 전통 해서체(kaishu)의 단정한 붓글씨 한자("甘草三钱", "桂花蜜")가 적혀 있다. 순간을 포착한 장면: 넘어진 백랍 통이 옆으로 누워 입구가 열려 있고, 몇 알의 구기자가 아직도 굴러 흩어지며 각각 가늘고 바늘처럼 긴 그림자를 드리운다. 구도는 밀도와 여백으로 숨 쉰다. 오른쪽의 빽빽한 군집은 왼쪽의 넓게 비어 있는 맨 나무 네거티브 스페이스와 균형을 이룬다. 전체적으로 단색에 가까운 따뜻한 팔레트—호박색, 귤빛 오렌지, 오래된 황동 금색—를 유지하되, 짙은 로젤 레드 한 점만이 변주를 준다. 확대해도 질감이 살아 있어야 한다. 말린 꽃잎의 부서질 듯 얇은 느낌, 탁하게 산화된 황동, 거칠게 해진 종이 섬유 가장자리, 흩어진 가루의 입자감. 자연스러운 방향광, 인공적인 광채 없음, 깨끗하고 선명한 그림자, 사실적인 재질 렌더링, 절제되고 우아한 분위기, 매크로 디테일의 음식 및 허브 정물 사진, 85mm 렌즈로 촬영, 넓은 가로형 풍경 프레이밍, 넓은 16:9 화면비, full-bleed.

Generated with Baidu ERNIE Image Turbo on Atlas Cloud

Generated with Qwen Image 2.0 on Atlas Cloud

Generated with Baidu ERNIE Image Turbo on Atlas Cloud

프롬프트

어수선한 다락방 작업실에 있는 십대 발명가 소녀를 따라가는 3컷 가로 만화 스트립. 첫 번째 패널에서는 따뜻한 램프 불빛 아래 작은 비행 기계를 스케치하고, 두 번째 패널에서는 그 장치가 덜컹거리며 공중으로 떠올라 볼트가 사방으로 흩어지고, 세 번째 패널에서는 승리감에 활짝 웃으며 두 주먹을 번쩍 치켜든다. 깔끔한 이중 언어 말풍선에는 또렷한 English 및 Japanese 레터링이 들어가며, 자신감 있는 잉크 선화와 스크린톤 음영으로 그려진다. 따뜻한 호박색 램프 빛은 차가운 작업실 그림자와 균형을 이룬다. 세 패널 전체에서 캐릭터 디자인은 일관되게 유지되고, 제스처는 표현력 있게 살아 있으며, 이야기는 왼쪽에서 오른쪽으로 명확한 순차 흐름으로 읽힌다. 굵고 깨끗한 윤곽선의 생동감 있는 셀 셰이딩 애니메이션 일러스트 스타일. 넓은 16:9 화면비, full-bleed.

Generated with Baidu ERNIE Image Turbo on Atlas Cloud

Generated with Qwen Image 2.0 on Atlas Cloud

Generated with Baidu ERNIE Image Turbo on Atlas Cloud

ERNIE Image API가 처리하는 실제 프로덕션 작업

텍스트가 정확한 포스터와 멀티 패널 만화부터 이중 언어 캠페인, 제품 카탈로그, 인터페이스 목업, 라벨이 포함된 인포그래픽까지, ERNIE Image API는 정밀한 프롬프트를 모든 콘텐츠 파이프라인에서 레이아웃이 정확한 비주얼로 변환합니다.

ERNIE Image API를 활용한 마케팅 및 포스터 제작

모델의 뛰어난 텍스트 정확도 덕분에 읽기 쉬운 헤드라인, 가격, 제품 문구가 캠페인 포스터와 배너에 바로 렌더링됩니다. 마케팅 팀은 별도의 조판 단계 없이 인쇄 준비가 완료된 에셋을 바로 출시할 수 있습니다.

만화 및 순차적 스토리텔링

모델이 그리드 기반 레이아웃과 멀티 패널 구조를 이해하므로, 말풍선 안에 대사가 배치된 일관성 있는 만화 페이지를 렌더링합니다. 독립 크리에이터와 스튜디오는 모든 프레임을 손으로 다시 그리지 않고도 전체 스토리보드를 초안으로 만들 수 있습니다.

ERNIE Image API를 활용한 이중 언어 캠페인 현지화

영어와 중국어 프롬프트를 네이티브로 지원하므로, 하나의 워크플로에서 두 시장 모두에 맞는 온브랜드 비주얼을 생성하고 각 문자 체계에 맞게 텍스트를 정확히 렌더링할 수 있습니다. 글로벌 팀은 언어별로 별도의 디자인 파이프라인을 구축하지 않고도 크리에이티브를 현지화할 수 있습니다.

대규모 E-Commerce 제품 비주얼

단일 API 호출로 전체 카탈로그에 걸쳐 라이프스타일 장면, 제품 목업, 프로모션 이미지를 생성합니다. Turbo 변형은 추론을 8단계로 압축하므로, 대량의 스토어도 몇 분 안에 전체 카탈로그를 새로고침할 수 있습니다.

인터페이스 및 제품 목업

피치에 사용할 현실적인 화면이 필요하신가요? 모델은 읽기 쉬운 라벨, 버튼, 본문 문구가 포함된 앱 인터페이스와 웹사이트 목업을 렌더링해, 제품 팀이 단일 컴포넌트를 만들기 전에도 발표용 프로토타입을 확보할 수 있게 합니다.

ERNIE Image API를 활용한 교육용 인포그래픽

강력한 지시 이행 능력으로 이미지와 명확히 라벨링된 다이어그램, 차트, 콜아웃을 한 번의 생성 안에 결합합니다. 교육자와 분석가는 밀도 높은 원본 자료를 어떤 디스플레이 크기에서도 읽기 쉬운 설명용 그래픽으로 바꿀 수 있습니다.

경쟁 Text-to-Image 모델과 비교한 ERNIE Image

ERNIE Image가 개발사, 접근 모델, 이중 언어 텍스트 렌더링, 이미지당 비용 측면에서 다른 오픈 및 독점 생성기와 어떻게 비교되는지 확인하세요.

모델	개발사	접근 모델	이중 언어 텍스트 렌더링 (EN + ZH)	가격 (이미지당)
ERNIE-Image	Baidu (ERNIE-Image 팀)	오픈 가중치, Apache 2.0	업계 최고 수준, LongTextBench 0.9733	사용량 기반 과금
ERNIE-Image Turbo	Baidu (ERNIE-Image 팀)	오픈 가중치, Apache 2.0	DMD 증류 기반 8-step 추론에서도 유지	사용량 기반 과금
Qwen Image 2.0	Alibaba (Tongyi)	오픈 가중치, Apache 2.0	1K-token 타이포그래피 레이아웃 전반에서 강력함	$0.035
Z-Image Turbo	Alibaba (Tongyi Lab)	오픈 가중치, Apache 2.0	영어와 함께 복잡한 중국어 간판도 처리	$0.005
Seedream v4.5	ByteDance	독점	네이티브 4K에서 디자이너 수준 렌더링	$0.04

Atlas Cloud에서 ERNIE Image API for Readable Text in Images 사용하는 방법

몇 분 만에 시작하세요 — 간단한 단계를 따라 Atlas Cloud 플랫폼을 통해 모델을 통합하고 배포하세요.

Atlas Cloud 계정 생성

atlascloud.ai에서 가입하고 인증을 완료하세요. 신규 사용자는 플랫폼 탐색과 모델 테스트를 위한 무료 크레딧을 받습니다.

Atlas Cloud에서 ERNIE Image API for Readable Text in Images을(를) 사용하는 이유

고급 ERNIE Image API for Readable Text in Images 모델과 Atlas Cloud의 GPU 가속 플랫폼을 결합하여 비교할 수 없는 성능, 확장성 및 개발자 경험을 제공합니다.

성능 및 유연성

낮은 지연 시간:
실시간 추론을 위한 GPU 최적화 추론.

통합 API:
하나의 통합으로 ERNIE Image API for Readable Text in Images, GPT, Gemini 및 DeepSeek를 실행합니다.

투명한 가격:
Serverless 옵션을 포함한 예측 가능한 token당 청구.

엔터프라이즈 및 확장

개발자 경험:
SDK, 분석, 파인튜닝 도구 및 템플릿.

신뢰성:
99.99% 가동 시간, RBAC 및 규정 준수 로깅.

보안 및 규정 준수:
SOC 2 Type II, HIPAA 준수, 미국 내 데이터 주권.

ERNIE Image API: 개발자가 가장 자주 묻는 질문

ERNIE Image API는 개발자가 Baidu의 open-weight text-to-image 모델에 프로그래밍 방식으로 접근할 수 있게 해 줍니다. 이 모델은 짧은 프롬프트를 더 풍부하고 구조화된 설명으로 확장하는 Prompt Enhancer와 결합된 8B single-stream Diffusion Transformer입니다. Atlas Cloud에서는 OpenAI-compatible endpoint 하나로 사용할 수 있으며, 사용량 기반 요금제와 Day-0 access를 제공합니다.

가장 두드러진 강점은 이미지 안의 텍스트를 또렷하고 읽기 쉽게 생성한다는 점입니다. 이 모델은 English LongTextBench에서 0.9733점을 기록했으며, open-weight 모델 중 최고 성능입니다. 따라서 모든 문자가 정확히 표기되어야 하는 포스터, 만화 말풍선, 인포그래픽, UI mockup에 안정적으로 사용할 수 있습니다.

두 variant는 동일한 8B 아키텍처를 공유하지만, 품질과 속도에서 차이가 있습니다. Standard 모델은 최종 에셋에서 최대 충실도를 제공하기 위해 guidance scale 4.0으로 50 inference steps를 실행하는 반면, Turbo variant는 빠른 대량 생성을 위해 DMD와 reinforcement learning으로 약 8 steps까지 distilled되었습니다.

네. 동일한 encoder를 통해 영어, 중국어, 일본어 프롬프트를 지원하며, 스크립트가 달라도 텍스트 품질이 안정적으로 유지됩니다. Chinese LongTextBench에서는 0.9661점을 기록했습니다. 여러 경쟁 모델이 중국어 문자에서 성능이 크게 저하되는 반면, 이 모델은 간체, 번체, 혼합 이중 언어 문구까지 깔끔하게 유지합니다.

Turbo endpoint는 단일 size parameter를 통해 7가지 preset size를 지원하며, 1024x1024 정사각형부터 1376x768 landscape 및 768x1376 portrait 형식까지 사용할 수 있습니다. 또한 한 번의 호출로 최대 10개의 이미지를 요청할 수 있고, 재현 가능한 결과를 위해 seed를 고정할 수 있으며, use_pe flag로 내장 Prompt Enhancer를 켜거나 끌 수 있습니다.

시작하는 데 필요한 것은 API key 하나뿐입니다. Atlas Cloud에 가입하고, 기존 OpenAI-compatible client가 해당 endpoint를 가리키도록 설정한 뒤, 선택 사항인 size와 seed를 포함해 prompt를 보내면 response로 image URL을 받을 수 있습니다. 과금은 호출당 사용량 기반이며, 모델에 대한 Day-0 access가 제공됩니다.

공개 benchmark에서 이 모델은 FLUX.2-klein-9B 같은 유사한 open release보다 높은 성능을 보이며, GenEval overall에서 0.8481 대비 0.8856점을 기록했습니다. 가장 큰 격차는 text rendering에서 나타나는데, FLUX.2는 중국어에서 0.2183까지 떨어지는 반면 ERNIE Image는 0.96 이상을 유지합니다. 읽기 쉬운 이미지 내 텍스트와 구조화된 레이아웃을 중심으로 하는 workload라면 현재 가장 강력한 open-weight 선택지입니다.

네. ERNIE Image는 Apache 2.0 license로 공개되어 상업적 사용, 수정, 재배포가 허용됩니다. 생성된 이미지는 광고, merchandise, 출판물 및 기타 상업용 제품에 라이선스 제약 없이 사용할 수 있습니다.

더 많은 패밀리 탐색

Seedance 2.0

Seedance 2.0 API는 쿼드 모달 입력(텍스트, 이미지, 비디오, 오디오) 및 샷 간의 구도, 카메라 움직임, 캐릭터 액션을 고정하는 업계 최고의 "Universal Reference" 시스템을 갖춘 ByteDance의 멀티모달 비디오 모델에 대한 프로덕션 액세스를 제공합니다. 단 한 번의 API 호출로 디렉터급 제어를 통합하고, 초당 $0.09의 고정 요금, 즉각적인 키 발급 및 대기자 명단 없이 이용할 수 있으며, 엔터프라이즈급 가동 시간과 규정 준수를 보장합니다. Seedance 2.0 Native 4K가 이제 출시되었습니다!

패밀리 보기

Grok Imagine

Grok Imagine API는 개발자에게 xAI의 이미지, 비디오 및 오디오 생성 기능을 단일 제품군으로 제공합니다. 다국어 텍스트 렌더링이 포함된 최대 2K 해상도의 이미지를 생성하며, 기본 동기화된 오디오 및 참조 기반 편집 기능이 포함된 최대 15초 길이의 비디오를 생성합니다. Atlas Cloud에서는 단일 키로 모든 Grok Imagine 모드를 실행할 수 있으므로 별도의 설정 없이 이미지, 비디오, 오디오 간에 이동할 수 있으며, 요금은 이미지당 $0.02, 초당 $0.05부터 시작합니다.

패밀리 보기

Gemini Omni Flash

Gemini Omni API는 Google I/O 2026에서 공개된 Google DeepMind의 멀티모달 비디오 생성·편집 모델을 여러분의 스택으로 가져옵니다. Gemini Omni는 Gemini의 추론 엔진과 생성형 미디어를 결합해 텍스트, 이미지, 비디오, 오디오를 자유롭게 조합한 입력을 받아 일관되고 지식에 기반한 결과물을 만들어 냅니다. 자연스러운 대화로 결과를 다듬어 보세요. 물리 법칙과 캐릭터, 연속성은 그대로 유지한 채 오브젝트를 교체하고 장면을 다시 쓰고 스타일을 바꿀 수 있습니다. Atlas Cloud는 텍스트-투-비디오, 최대 7장의 참조 이미지를 지원하는 이미지-투-비디오, 참조-투-비디오까지 Gemini Omni Flash 전체 라인업을 하나의 통합 API로 제공하며, $0.112부터 시작하는 투명한 초당 과금에 구독도 필요 없습니다. 지금 바로 개발을 시작하세요.

패밀리 보기

GPT Image 2

GPT Image 2 API는 개발자들에게 GPT Image 1.5의 후속 모델인 OpenAI의 최신 이미지 모델에 대한 액세스를 제공합니다. 이 모델은 라틴 및 CJK 스크립트 전반에 걸쳐 정확한 텍스트 렌더링으로 이미지를 생성 및 편집하며, 포스터, 목업, 인포그래픽을 위한 강력한 구도를 지원합니다. Atlas Cloud에서는 300개 이상의 모델과 함께 하나의 통합된 API를 통해 이에 접근할 수 있으며, 무료 크레딧, 99.99%의 가동 시간을 제공하고 OpenAI 조직 인증이 필요하지 않습니다.

패밀리 보기

Google

Google의 가장 강력한 크리에이티브 모델은 모두 Atlas Cloud에서 사용할 수 있습니다. Veo 3.1은 영화 수준의 비디오 생성을 제공하고, Nano Banana 2는 고충실도 이미지 생성을 지원하며, Gemini는 모든 워크플로우에 멀티모달 인텔리전스를 제공합니다. Day-0 가용성과 종량제(pay-as-you-go) 요금제로 단일 API key를 통해 전체 Google 모델 제품군에 액세스하세요.

패밀리 보기

Seedance 2.0 Mini

Seedance 2.0 Mini는 속도와 비용이 가장 중요한 워크플로우에 ByteDance의 멀티모달 비디오 생성 기능을 제공합니다. 더 빠른 생성, 비디오당 더 낮은 비용, 그리고 이미 사용 중인 것과 동일한 API 통합 등 더 가벼운 풋프린트로 Seedance 2.0의 핵심 기능을 제공합니다. 대규모 파이프라인을 운영하거나 대규모 프로토타이핑을 수행하는 팀에게 Mini는 실용적인 기본 선택입니다.

패밀리 보기

ByteDance

시네마틱 비디오 생성부터 고해상도 이미지 제작까지, ByteDance의 가장 강력한 모델들이 현재 Atlas Cloud에 라이브로 제공됩니다. 가장 낮은 추론 가격과 인프라 오버헤드 없이 대규모로 Seedance와 Seedream을 실행해 보세요.

패밀리 보기

Alibaba

Atlas Cloud는 Alibaba의 전체 모델 라인업을 단일 API로 통합합니다. 언어 및 이미지 작업을 위한 Qwen, 최대 1080p 비디오 생성을 위한 Wan을 제공합니다. 구독 없이 사용한 만큼만 지불하는(pay-as-you-go) 방식으로 모든 모델에 액세스하세요. Alibaba API는 기존의 OpenAI 호환 클라이언트를 사용하여 단일 기본 URL(base URL)을 통해 사용할 수 있습니다.

패밀리 보기

OpenAI

Atlas Cloud는 이미지 생성을 위한 GPT Image 2부터 비디오를 위한 Sora 2까지 전체 OpenAI API 라인업에 대한 액세스를 제공합니다. 모든 모델은 월간 약정 없이 종량제로 이용할 수 있습니다. OpenAI 호환 API를 사용하여 기본 URL 하나만 변경하면 쉽게 연동할 수 있습니다.

패밀리 보기

xAI

Atlas Cloud에서 xAI API를 사용하여 완벽한 이미지 및 비디오 파이프라인을 구축하십시오. 2K 해상도로 생성하고, 참조 이미지로 편집하며, 이미지를 오디오와 동기화된 클립으로 애니메이션화할 수 있습니다.

패밀리 보기

Kwaivgi

표준 가격보다 15% 저렴한 Kwaivgi API. Atlas Cloud는 종량제 요금과 사용자 수 제한 없이 새로운 Kling 릴리스에 대한 Day-0 액세스를 제공합니다. 단일 계정, 단일 키로 표준에서 마스터 티어에 이르는 모든 Kling 모델을 이용하세요.

패밀리 보기

Seedream 5.0 Pro

Seedream 5.0 Pro API는 개발자에게 Atlas Cloud에서 ByteDance의 제어 가능한 이미지 편집 모델을 제공합니다. 앵커와 좌표로 편집을 정확하게 배치하고, 이미지를 편집 가능한 레이어로 분리하고, 여러 참조를 융합하며, 정확한 색상과 재질을 일치시키고, 2K 및 3K에서 다국어 텍스트를 지원합니다. Atlas Cloud에서는 단일 키로 액세스할 수 있습니다!

패밀리 보기

하나의 API로 모든 미디어 AI를.

모든 모델 탐색

ERNIE Image API for Readable Text in Images

주요 모델 탐색

Baidu ERNIE Image Turbo Text-to-image

ERNIE Image API 엔드포인트 비교: Standard 및 Turbo Text-to-Image

텍스트, 레이아웃, 제어를 위해 설계된 ERNIE Image API

ERNIE Image API의 읽기 쉬운 텍스트 렌더링

구조화된 멀티 패널 레이아웃

ERNIE Image API의 이중 언어 프롬프팅

기본으로 활성화된 Prompt Enhancer

7가지 네이티브 출력 크기

Turbo Mode의 ERNIE Image API

ERNIE Image 정면 비교: 하나의 프롬프트, 세 가지 모델

ERNIE Image API가 처리하는 실제 프로덕션 작업

ERNIE Image API를 활용한 마케팅 및 포스터 제작

만화 및 순차적 스토리텔링

ERNIE Image API를 활용한 이중 언어 캠페인 현지화

대규모 E-Commerce 제품 비주얼

인터페이스 및 제품 목업

ERNIE Image API를 활용한 교육용 인포그래픽

경쟁 Text-to-Image 모델과 비교한 ERNIE Image

Atlas Cloud에서 ERNIE Image API for Readable Text in Images 사용하는 방법

Atlas Cloud 계정 생성

Atlas Cloud에서 ERNIE Image API for Readable Text in Images을(를) 사용하는 이유

성능 및 유연성

엔터프라이즈 및 확장

ERNIE Image API: 개발자가 가장 자주 묻는 질문

더 많은 패밀리 탐색

Seedance 2.0

Grok Imagine

Gemini Omni Flash

GPT Image 2

Google

Seedance 2.0 Mini

ByteDance

Alibaba

OpenAI

xAI

Kwaivgi

Seedream 5.0 Pro

하나의 API로 모든 미디어 AI를.

Join our Discord community