
Atlas Cloud driftar ERNIE Image och ERNIE Image Turbo under Baidu API, båda med betalning per användning. Varje modell är ledande inom öppen källkod för textrendering på engelska och kinesiska.
Skapa hänförande, produktionsklara bilder från prompts och referenser med de mest avancerade AI-modellerna för bildgenerering på Atlas Cloud.
Compare standard vs. our pricing across every Baidu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Baidu ERNIE Image Turbo Text-to-image | — | Start fromFree | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
ERNIE Image är byggt för arbetsflöden där text måste vara läsbar inuti den genererade bilden. Team använder det för att producera tvåspråkiga tillgångar, strukturerade layouter och texttunga kreativa enheter i stor skala utan ett designteam.
Marknadsföringsteam använder ERNIE Image för att generera kampanjaffischer med läsbar engelsk och kinesisk text i ett enda API-anrop, vilket riktar sig till båda marknaderna från samma promptstruktur. Modellen renderar båda skriftspråken med en noggrannhet på över 0,96, så rubriker och brödtext blir rena utan behov av korrigeringar i efterbearbetningen. Atlas Clouds betala-för-användning-prissättning gör det praktiskt att generera dussintals varianter per kampanj utan någon designkostnad per tillgång.
Varumärken som går in på den kinesiska marknaden använder ERNIE Image för att generera mockups av produktetiketter och förpackningar med exakt tvåspråkig text innan de påbörjar tryckproduktion. Modellen hanterar förenklad kinesiska, traditionell kinesiska och engelska i samma layout, inklusive små texter på etiketter och ingrediensförteckningar. Vid en utdataupplösning på 1024×1024 har dessa mockups tillräcklig produktionskvalitet för att användas vid kundgodkännanden och regulatoriska inlämningar.
Förlag och innehållsstudior använder ERNIE Image för att generera serierutor med exakta pratbubblor, bildtextrutor och ruttexter på kinesiska eller engelska. Modellen får poäng över 0,96 på LongTextBench specifikt för den här typen av strukturerad text-i-bild-utmatning. ERNIE Image Turbo på Atlas Cloud är gratis, vilket gör att stora volymer av panelutkast är kostnadsfria under iterationsfasen.
Datateam bygger pipelines som konverterar strukturerad data till märkta infografikbilder med hjälp av textrenderingsnoggrannheten hos ERNIE Image. Diagrametiketter, pratbubblor och avsnittsrubriker renderas exakt på båda språken från en enda prompt, vilket eliminerar det manuella designsteget mellan datautmatning och visualisering. Den inbyggda Prompt Enhancer skriver automatiskt om korta databeskrivningar till detaljerade layoutinstruktioner.
Prestationsmarknadsföringsteam skapar lokaliserat annonsmaterial för kinesisk- och engelskspråkiga marknader från samma kampanjbrief genom att använda ERNIE Images flerspråkiga stöd för att producera båda språkvarianterna i en och samma pipeline. Varje kreativt material kommer med exakt text i bilden, vilket eliminerar behovet av att redigera eller sätta om genererade bilder. Den kostnadsfria Turbo-nivån på Atlas Cloud håller testkostnaderna på noll medan teamen utvärderar vilka kreativa varianter som ska skalas upp.
Produkt- och designteam använder ERNIE Image för att generera skärmdumpar av UI-mockups med realistisk platshållartext som återges korrekt på engelska eller kinesiska. Modellen hanterar knappetiketter, navigeringstext, formulärfält och modaltext med hög återgivning, vilket gör att mockups kan användas i presentationer utan manuell redigering av textlager. Detta minskar tiden mellan wireframe-koncept och intressentredo visuell design från timmar till minuter.
ERNIE Image får över 0,96 i poäng på LongTextBench för rendering av kinesisk text, vilket är det högsta bland open-weight text-till-bild-modeller. De flesta konkurrerande open-source-modeller får poäng långt under 0,3 i scenarier med kinesisk text, vilket gör dem opålitliga för alla arbetsflöden som kräver läslig kinesiska i genererade bilder. ERNIE Image är det praktiska valet om korrekt kinesisk text i resultatet är ett strikt krav.
Ja. ERNIE Image hanterar båda skriftsystemen i ett enda genereringsanrop och bibehåller hög noggrannhet för vart och ett oberoende av varandra. Detta är användbart för tvåspråkiga affischer, förpackningar och marknadsföringsmaterial som kräver att båda språken är läsbara i samma layout. LongTextBench-poängen för både engelska och kinesiska ligger över 0,96.
ERNIE Image inkluderar en lättviktig Prompt Enhancer som automatiskt skriver om korta inmatningsprompter till rikare, mer strukturerade beskrivningar innan de skickas vidare till diffusionsmodellen. Detta innebär att du kan skicka korta prompter och få mer detaljerade, exakta utdata utan omfattande prompt engineering. Prompt Enhancer körs som en del av genereringspipelinen vid varje API-anrop.
ERNIE Image Turbo använder DMD (Diffusion Model Distillation) och förstärkningsinlärning för att komprimera inferensen från 50 steg ner till 8, vilket ger en mer än sexfaldig hastighetsökning. Turbo är gratis på Atlas Cloud och passar för snabb iterering och generering av utkast. Standardmodellen körs med full kvalitet för slutgiltiga produktionstillgångar som kommersiella affischer och redaktionell grafik.
Ja. ERNIE Image är släppt under Apache 2.0-licensen, vilket tillåter kommersiell användning, modifiering och distribution. Genererade bilder kan användas i reklam, förpackningar, publikationer och andra kommersiella tillämpningar. Läs igenom de fullständiga licensvillkoren i ERNIE Images GitHub-arkiv för eventuella specifika villkor.
Guider, handledningar och produktnyheter som hjälper dig att få ut mesta möjliga av Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.