
Atlas Cloud는 Baidu API를 통해 ERNIE Image 및 ERNIE Image Turbo를 호스팅하며, 둘 다 종량제 방식입니다. 각 모델은 영어 및 중국어 텍스트 렌더링을 위한 오픈 소스 분야를 선도하고 있습니다.
Atlas Cloud의 최첨단 AI 이미지 생성 모델로 프롬프트와 참고 이미지를 바로 활용 가능한 놀라운 비주얼로 완성하세요.
Compare standard vs. our pricing across every Baidu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Baidu ERNIE Image Turbo Text-to-image | — | Start fromFree | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
ERNIE Image는 생성된 이미지 내의 텍스트를 읽을 수 있어야 하는 워크플로우를 위해 구축되었습니다. 팀은 디자인 팀 없이도 이 모델을 사용하여 이중 언어 에셋, 구조화된 레이아웃 및 텍스트가 많은 크리에이티브를 대규모로 제작할 수 있습니다.
마케팅 팀은 ERNIE Image를 사용하여 단일 API 호출로 읽기 쉬운 영어 및 중국어 텍스트가 포함된 캠페인 포스터를 생성하며, 동일한 프롬프트 구조로 두 시장을 모두 타겟팅합니다. 이 모델은 두 언어를 0.96 이상의 정확도로 렌더링하므로, 포스트 프로덕션 수정 없이도 헤드라인과 본문이 깔끔하게 출력됩니다. Atlas Cloud의 종량제 요금제 덕분에 에셋당 디자인 비용 없이 캠페인당 수십 개의 변형을 실용적으로 생성할 수 있습니다.
중국 시장에 진출하는 브랜드는 인쇄 생산에 들어가기 전에 ERNIE Image를 사용하여 정확한 이중 언어 텍스트가 포함된 제품 라벨 및 패키징 목업을 생성합니다. 이 모델은 라벨 및 성분표의 작은 텍스트를 포함하여 동일한 레이아웃에서 중국어 간체, 중국어 번체 및 영어를 처리합니다. 1024×1024 출력 해상도에서 목업은 고객 승인 및 규제 제출에 사용할 수 있을 만큼 프로덕션 품질을 갖추고 있습니다.
출판사와 콘텐츠 스튜디오는 ERNIE Image를 사용하여 정확한 중국어 또는 영어 말풍선, 캡션 상자 및 패널 텍스트가 포함된 만화 패널을 생성합니다. 이 모델은 이러한 유형의 구조화된 이미지 내 텍스트 출력에 대해 특히 LongTextBench에서 0.96 이상의 점수를 받았습니다. Atlas Cloud의 ERNIE Image Turbo는 무료이므로 반복 단계에서 대량의 패널 초안을 비용 없이 작성할 수 있습니다.
데이터 팀은 ERNIE Image의 텍스트 렌더링 정확도를 사용하여 구조화된 데이터를 레이블이 지정된 인포그래픽 이미지로 변환하는 파이프라인을 구축합니다. 차트 레이블, 콜아웃 상자 및 섹션 헤더는 단일 프롬프트에서 두 언어로 정확하게 렌더링되어 데이터 출력과 시각화 사이의 수동 디자인 단계를 제거합니다. 내장된 Prompt Enhancer는 짧은 데이터 설명을 상세한 레이아웃 지침으로 자동 재작성합니다.
퍼포먼스 마케팅 팀은 동일한 캠페인 브리프를 바탕으로 중국어 및 영어권 시장을 위한 현지화된 광고 크리에이티브를 생성하며, ERNIE Image의 이중 언어 지원을 사용하여 단일 파이프라인에서 두 가지 언어 변형을 모두 제작합니다. 각 크리에이티브에는 정확한 이미지 내 텍스트가 포함되어 있어 생성된 이미지를 편집하거나 재조판할 필요가 없습니다. Atlas Cloud의 무료 Turbo 티어는 팀이 확장할 크리에이티브 변형을 평가하는 동안 테스트 비용을 제로로 유지합니다.
제품 및 디자인 팀은 ERNIE Image를 사용하여 영어 또는 중국어로 정확하게 렌더링된 사실적인 자리 표시자 텍스트가 포함된 UI 모형 스크린샷을 생성합니다. 이 모델은 버튼 레이블, 탐색 텍스트, 양식 필드 및 모달 텍스트를 충실도 높게 처리하여 수동 텍스트 레이어 편집 없이도 모형을 프레젠테이션에 바로 사용할 수 있게 해줍니다. 이를 통해 와이어프레임 개념에서 이해관계자를 위한 시각 자료가 준비되기까지의 시간이 수시간에서 수분으로 단축됩니다.
ERNIE Image는 중국어 텍스트 렌더링에 대한 LongTextBench에서 0.96 이상의 점수를 기록하여, 오픈 가중치 텍스트-이미지 생성 모델 중 가장 높은 점수를 달성했습니다. 대부분의 경쟁 오픈 소스 모델들은 중국어 텍스트 시나리오에서 0.3에 훨씬 못 미치는 점수를 받아, 생성된 이미지 내에 읽을 수 있는 중국어가 필요한 워크플로에서는 신뢰할 수 없습니다. 출력물에 정확한 중국어 텍스트가 필수적인 요구 사항이라면 ERNIE Image가 실용적인 선택입니다.
네. ERNIE Image는 단일 생성 호출에서 두 문자를 모두 처리하며, 각각에 대해 독립적으로 높은 정확도를 유지합니다. 이는 동일한 레이아웃에서 두 언어를 모두 읽을 수 있어야 하는 이중 언어 포스터, 포장 및 마케팅 자산에 유용합니다. 영어와 중국어 모두 LongTextBench 점수가 0.96을 상회합니다.
ERNIE Image에는 확산 모델에 전달하기 전에 짧은 입력 프롬프트를 더 풍부하고 구조화된 설명으로 자동 재작성하는 경량 Prompt Enhancer가 포함되어 있습니다. 즉, 광범위한 프롬프트 엔지니어링 없이도 짧은 프롬프트를 전송하여 더 상세하고 정확한 출력 결과를 얻을 수 있습니다. Prompt Enhancer는 모든 API 호출 시 생성 파이프라인의 일부로 실행됩니다.
ERNIE Image Turbo는 DMD(Diffusion Model Distillation, 확산 모델 증류)와 강화 학습을 사용하여 추론을 50단계에서 8단계로 압축하여 6배 이상의 속도 향상을 제공합니다. Turbo는 Atlas Cloud에서 무료로 제공되며 빠른 반복 및 초안 생성에 적합합니다. 표준 모델은 상업용 포스터 및 편집 그래픽과 같은 최종 생산 자산을 위해 최고 품질로 실행됩니다.
네. ERNIE Image는 상업적 사용, 수정 및 배포를 허용하는 Apache 2.0 라이선스에 따라 배포됩니다. 생성된 이미지는 광고, 포장, 출판물 및 기타 상업적 애플리케이션에 사용할 수 있습니다. 특정 조건에 대해서는 ERNIE Image GitHub 리포지토리에서 전체 라이선스 약관을 검토하십시오.
Atlas Cloud를 최대한 활용할 수 있는 가이드, 튜토리얼, 제품 업데이트.
Join the Discord community for the latest model updates, prompts, and support.