
Atlas Cloud hostet ERNIE Image und ERNIE Image Turbo unter der Baidu API, beide im Pay-as-you-go-Modell. Jedes Modell ist führend im Open-Source-Bereich für das Text-Rendering in Englisch und Chinesisch.
Erstellen Sie atemberaubende, produktionsreife Visuals aus Prompts und Referenzen mit den modernsten KI-Modellen zur Bildgenerierung auf Atlas Cloud.
Compare standard vs. our pricing across every Baidu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Baidu ERNIE Image Turbo Text-to-image | — | Start fromFree | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
ERNIE Image wurde für Workflows entwickelt, bei denen Text innerhalb des generierten Bildes lesbar sein muss. Teams nutzen es, um ohne Designteam in großem Maßstab zweisprachige Assets, strukturierte Layouts und textlastige Creatives zu erstellen.
Marketingteams nutzen ERNIE Image, um Kampagnenplakate mit lesbarem englischem und chinesischem Text in einem einzigen API-Aufruf zu generieren und so beide Märkte mit derselben Prompt-Struktur anzusprechen. Das Modell rendert beide Schriften mit einer Genauigkeit von über 0,96, sodass Überschriften und Fließtext ohne Postproduktion-Korrekturen fehlerfrei ausgegeben werden. Die nutzungsabhängige Preisgestaltung von Atlas Cloud macht es praktikabel, Dutzende von Varianten pro Kampagne ohne Designkosten pro Asset zu erstellen.
Marken, die in den chinesischen Markt eintreten, verwenden ERNIE Image, um vor der Druckproduktion Mockups für Produktetiketten und Verpackungen mit präzisem zweisprachigem Text zu erstellen. Das Modell verarbeitet vereinfachtes Chinesisch, traditionelles Chinesisch und Englisch im selben Layout, einschließlich kleiner Texte auf Etiketten und Zutatenlisten. Bei einer Ausgabeauflösung von 1024×1024 haben die Mockups eine ausreichende Produktionsqualität für die Verwendung bei Kundenfreigaben und behördlichen Einreichungen.
Verlage und Content-Studios verwenden ERNIE Image, um Comic-Panels mit präzisen Sprechblasen, Beschriftungsboxen und Panel-Texten auf Chinesisch oder Englisch zu generieren. Das Modell erzielt auf LongTextBench speziell für diese Art der strukturierten Text-in-Bild-Ausgabe eine Punktzahl von über 0,96. ERNIE Image Turbo auf Atlas Cloud ist kostenlos, wodurch das Entwerfen von Panels in großen Mengen während der Iterationsphase kostengfrei ist.
Datenteams erstellen Pipelines, die strukturierte Daten unter Verwendung der Text-Rendering-Genauigkeit von ERNIE Image in beschriftete Infografik-Bilder umwandeln. Diagrammbeschriftungen, Callout-Boxen und Abschnittsüberschriften werden mit einem einzigen Prompt in beiden Sprachen präzise gerendert, wodurch der manuelle Designschritt zwischen Datenausgabe und Visualisierung entfällt. Der integrierte Prompt Enhancer schreibt kurze Datenbeschreibungen automatisch in detaillierte Layout-Anweisungen um.
Performance-Marketing-Teams erstellen aus demselben Kampagnen-Briefing lokalisierte Werbemittel für chinesisch- und englischsprachige Märkte und nutzen die zweisprachige Unterstützung von ERNIE Image, um beide Sprachvarianten in einer einzigen Pipeline zu produzieren. Jedes Werbemittel enthält präzisen Text im Bild, wodurch die Notwendigkeit entfällt, generierte Bilder zu bearbeiten oder neu zu setzen. Der kostenlose Turbo-Tarif auf Atlas Cloud hält die Testkosten bei null, während die Teams evaluieren, welche Werbemittelvarianten skaliert werden sollen.
Produkt- und Designteams verwenden ERNIE Image, um UI-Mockup-Screenshots mit realistischen Platzhaltertexten zu generieren, die präzise auf Englisch oder Chinesisch gerendert werden. Das Modell verarbeitet Button-Labels, Navigationstexte, Formularfelder und modale Texte mit hoher Wiedergabetreue, sodass die Mockups ohne manuelle Bearbeitung der Textebenen in Präsentationen verwendet werden können. Dies verkürzt die Zeit zwischen dem Wireframe-Konzept und dem für Stakeholder präsentationsreifen visuellen Entwurf von Stunden auf Minuten.
ERNIE Image erzielt bei LongTextBench für das Rendern chinesischer Texte eine Punktzahl von über 0,96, die höchste unter den Open-Weight-Text-zu-Bild-Modellen. Die meisten konkurrierenden Open-Source-Modelle erreichen in Szenarien mit chinesischem Text Werte von weit unter 0,3, was sie für jeden Workflow unzuverlässig macht, der lesbares Chinesisch in generierten Bildern erfordert. ERNIE Image ist die praktische Wahl, wenn präziser chinesischer Text in der Ausgabe eine zwingende Voraussetzung ist.
Ja. ERNIE Image verarbeitet beide Schriften in einem einzigen Generierungsaufruf und behält dabei für jede unabhängig eine hohe Genauigkeit bei. Dies ist nützlich für zweisprachige Poster, Verpackungen und Marketingmaterialien, bei denen beide Sprachen im selben Layout lesbar sein müssen. Die LongTextBench-Werte für Englisch und Chinesisch liegen beide über 0,96.
ERNIE Image enthält einen leichtgewichtigen Prompt Enhancer, der kurze Eingabe-Prompts automatisch in reichhaltigere, strukturiertere Beschreibungen umschreibt, bevor sie an das Diffusionsmodell weitergegeben werden. Das bedeutet, dass Sie kurze Prompts senden und detailliertere, genauere Ergebnisse erhalten können, ohne umfangreiches Prompt-Engineering betreiben zu müssen. Der Prompt Enhancer läuft als Teil der Generierungspipeline bei jedem API-Aufruf.
ERNIE Image Turbo verwendet DMD (Diffusion Model Distillation) und Reinforcement Learning, um die Inferenz von 50 Schritten auf 8 zu komprimieren, was eine mehr als 6-fache Geschwindigkeitsverbesserung bringt. Turbo ist auf Atlas Cloud kostenlos und eignet sich für schnelle Iterationen und die Generierung von Entwürfen. Das Standardmodell läuft in voller Qualität für endgültige Produktions-Assets wie kommerzielle Poster und redaktionelle Grafiken.
Ja. ERNIE Image wird unter der Apache 2.0-Lizenz veröffentlicht, die kommerzielle Nutzung, Änderung und Verbreitung erlaubt. Generierte Bilder können in Werbung, Verpackungen, Publikationen und anderen kommerziellen Anwendungen verwendet werden. Lesen Sie die vollständigen Lizenzbedingungen im GitHub-Repository von ERNIE Image für spezifische Bedingungen.
Anleitungen, Tutorials und Produkt-Updates, mit denen Sie das Beste aus Atlas Cloud herausholen.
Join the Discord community for the latest model updates, prompts, and support.