
Atlas Cloud ospita ERNIE Image ed ERNIE Image Turbo sotto la Baidu API, entrambi con pagamento in base al consumo. Ogni modello è leader open source per il rendering del testo in inglese e cinese.
Crea immagini straordinarie e pronte per la produzione a partire da prompt e riferimenti con i più avanzati modelli di IA per la generazione di immagini su Atlas Cloud.
Compare standard vs. our pricing across every Baidu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Baidu ERNIE Image Turbo Text-to-image | — | Start fromFree | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
ERNIE Image è progettato per flussi di lavoro in cui il testo deve essere leggibile all'interno dell'immagine generata. I team lo utilizzano per produrre risorse bilingui, layout strutturati e creatività ricche di testo su larga scala senza bisogno di un team di progettazione.
I team di marketing utilizzano ERNIE Image per generare poster di campagne con testo leggibile in inglese e cinese in una singola chiamata API, rivolgendosi a entrambi i mercati dalla stessa struttura di prompt. Il modello esegue il rendering di entrambe le scritture con una precisione superiore allo 0,96, in modo che i titoli e il corpo del testo risultino nitidi senza correzioni di post-produzione. Il modello di prezzo con pagamento a consumo di Atlas Cloud rende pratico generare dozzine di varianti per campagna senza alcun costo di progettazione per singola risorsa.
I marchi che entrano nel mercato cinese utilizzano ERNIE Image per generare mockup di etichette di prodotti e imballaggi con un testo bilingue accurato prima di procedere alla produzione di stampa. Il modello gestisce cinese semplificato, cinese tradizionale e inglese nello stesso layout, inclusi i testi piccoli sulle etichette e nelle liste degli ingredienti. Con una risoluzione di output di 1024×1024, i mockup sono di qualità di produzione sufficiente per l'uso nelle approvazioni dei clienti e nelle presentazioni normative.
Gli editori e gli studi di contenuti utilizzano ERNIE Image per generare vignette di fumetti con accurati baloon, riquadri di didascalie e testi in cinese o inglese. Il modello ottiene un punteggio superiore a 0,96 su LongTextBench in modo specifico per questo tipo di output strutturato di testo nell'immagine. ERNIE Image Turbo su Atlas Cloud è gratuito, il che rende la creazione di bozze di vignette in grandi volumi priva di costi durante la fase di iterazione.
I team di dati creano pipeline che convertono i dati strutturati in immagini di infografiche etichettate utilizzando la precisione di rendering del testo di ERNIE Image. Le etichette dei grafici, le caselle di richiamo e le intestazioni di sezione vengono renderizzate con precisione in entrambe le lingue da un singolo prompt, eliminando il passaggio di progettazione manuale tra l'output dei dati e l'elemento visivo. Il Prompt Enhancer integrato riscrive automaticamente le brevi descrizioni dei dati in istruzioni di layout dettagliate.
I team di performance marketing generano creatività pubblicitarie localizzate per i mercati di lingua cinese e inglese a partire dallo stesso brief di campagna, utilizzando il supporto bilingue di ERNIE Image per produrre entrambe le varianti linguistiche in un'unica pipeline. Ogni creatività è dotata di testo preciso all'interno dell'immagine, eliminando la necessità di modificare o rimpaginare le immagini generate. Il livello Turbo gratuito su Atlas Cloud mantiene a zero i costi di test mentre i team valutano quali varianti creative scalare.
I team di prodotto e design utilizzano ERNIE Image per generare screenshot di mockup dell'interfaccia utente con testi segnaposto realistici resi in modo accurato in inglese o cinese. Il modello gestisce le etichette dei pulsanti, il testo di navigazione, i campi dei moduli e il testo delle finestre modali con alta fedeltà, rendendo i mockup utilizzabili nelle presentazioni senza la modifica manuale dei livelli di testo. Questo riduce il tempo tra il concetto di wireframe e il layout visivo pronto per gli stakeholder da ore a minuti.
ERNIE Image ottiene un punteggio superiore a 0,96 su LongTextBench per il rendering del testo in cinese, il più alto tra i modelli text-to-image a pesi aperti. La maggior parte dei modelli open source concorrenti ottiene punteggi ben al di sotto di 0,3 negli scenari di testo in cinese, rendendoli inaffidabili per qualsiasi flusso di lavoro che richieda del cinese leggibile all'interno delle immagini generate. ERNIE Image è la scelta pratica se un testo in cinese accurato nell'output è un requisito fondamentale.
Sì. ERNIE Image gestisce entrambi gli script in una singola chiamata di generazione, mantenendo un'elevata precisione per ciascuno in modo indipendente. Questo è utile per poster bilingue, imballaggi e risorse di marketing che richiedono che entrambe le lingue siano leggibili nello stesso layout. I punteggi LongTextBench sia per l'inglese che per il cinese superano lo 0,96.
ERNIE Image include un Prompt Enhancer leggero che riscrive automaticamente i prompt di input brevi in descrizioni più ricche e strutturate prima di passarli al modello di diffusione. Ciò significa che è possibile inviare prompt concisi e ottenere output più dettagliati e accurati senza un'estesa attività di prompt engineering. Il Prompt Enhancer viene eseguito come parte della pipeline di generazione a ogni chiamata API.
ERNIE Image Turbo utilizza DMD (Diffusion Model Distillation) e l'apprendimento per rinforzo per comprimere l'inferenza da 50 passaggi a 8, offrendo un miglioramento della velocità di oltre 6 volte. Turbo è gratuito su Atlas Cloud ed è adatto per l'iterazione rapida e la generazione di bozze. Il modello standard funziona alla massima qualità per le risorse di produzione finali come poster commerciali e grafiche editoriali.
Sì. ERNIE Image è rilasciato sotto la licenza Apache 2.0, che consente l'uso commerciale, la modifica e la distribuzione. Le immagini generate possono essere utilizzate in pubblicità, imballaggi, pubblicazioni e altre applicazioni commerciali. Si prega di prendere visione dei termini completi della licenza nel repository GitHub di ERNIE Image per eventuali condizioni specifiche.
Guide, tutorial e novità di prodotto per sfruttare al meglio Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.