
Atlas Cloud héberge ERNIE Image et ERNIE Image Turbo sous la Baidu API, tous deux avec un paiement à l'usage. Chaque modèle est un leader open source pour le rendu de texte en anglais et en chinois.
Créez des visuels époustouflants, prêts pour la production, à partir de prompts et de références avec les modèles d'IA de génération d'images les plus avancés sur Atlas Cloud.
Compare standard vs. our pricing across every Baidu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Baidu ERNIE Image Turbo Text-to-image | — | Start fromFree | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
ERNIE Image est conçu pour les flux de travail où le texte doit être lisible à l'intérieur de l'image générée. Les équipes l'utilisent pour produire des ressources bilingues, des mises en page structurées et des créations riches en texte à grande échelle, sans avoir besoin d'une équipe de conception.
Les équipes marketing utilisent ERNIE Image pour générer des affiches de campagne avec un texte lisible en anglais et en chinois en un seul appel API, ciblant les deux marchés à partir de la même structure de prompt. Le modèle restitue les deux écritures avec une précision supérieure à 0,96, de sorte que les titres et le corps du texte ressortent de manière nette sans corrections de post-production. La tarification à l'usage d'Atlas Cloud permet de générer des dizaines de variantes par campagne de manière pratique, sans coût de conception par actif.
Les marques entrant sur le marché chinois utilisent ERNIE Image pour générer des maquettes d'étiquettes de produits et d'emballages avec un texte bilingue précis avant de s'engager dans la production d'impression. Le modèle gère le chinois simplifié, le chinois traditionnel et l'anglais dans la même mise en page, y compris les petits textes sur les étiquettes et les listes d'ingrédients. À une résolution de sortie de 1024×1024, les maquettes sont d'une qualité de production suffisante pour être utilisées lors des approbations des clients et des soumissions réglementaires.
Les éditeurs et les studios de contenu utilisent ERNIE Image pour générer des cases de bande dessinée avec des bulles de dialogue, des boîtes de légende et des textes de case précis en chinois ou en anglais. Le modèle obtient un score supérieur à 0,96 sur LongTextBench spécifiquement pour ce type de sortie structurée de texte dans l'image. ERNIE Image Turbo sur Atlas Cloud est gratuit, ce qui rend la conception de cases à grand volume sans frais pendant la phase d'itération.
Les équipes de données construisent des pipelines qui convertissent des données structurées en images infographiques étiquetées en utilisant la précision de rendu de texte d'ERNIE Image. Les étiquettes de graphiques, les boîtes de légende et les en-têtes de section sont rendus avec précision dans les deux langues à partir d'un seul prompt, éliminant ainsi l'étape de conception manuelle entre la sortie des données et le visuel. Le Prompt Enhancer intégré réécrit automatiquement de brèves descriptions de données en instructions de mise en page détaillées.
Les équipes de marketing à la performance génèrent des créations publicitaires localisées pour les marchés sinophones et anglophones à partir du même brief de campagne, en utilisant la prise en charge bilingue d'ERNIE Image pour produire les deux variantes linguistiques dans un seul pipeline. Chaque création est fournie avec un texte intégré précis, supprimant le besoin d'éditer ou de recomposer les images générées. Le niveau Turbo gratuit sur Atlas Cloud maintient les coûts de test à zéro pendant que les équipes évaluent quelles variantes créatives déployer à grande échelle.
Les équipes produit et design utilisent ERNIE Image pour générer des captures d'écran de maquettes d'interface utilisateur avec du texte de remplacement réaliste rendu avec précision en anglais ou en chinois. Le modèle gère les étiquettes de boutons, le texte de navigation, les champs de formulaire et le texte des fenêtres modales avec une grande fidélité, rendant les maquettes utilisables dans les présentations sans modification manuelle des calques de texte. Cela réduit le temps entre le concept de wireframe et le visuel prêt pour les parties prenantes de plusieurs heures à quelques minutes.
ERNIE Image obtient un score supérieur à 0,96 sur LongTextBench pour le rendu de texte en chinois, le plus élevé parmi les modèles texte-image à poids ouverts. La plupart des modèles open source concurrents obtiennent des scores bien inférieurs à 0,3 dans les scénarios de texte en chinois, ce qui les rend peu fiables pour tout flux de travail nécessitant du chinois lisible dans les images générées. ERNIE Image est le choix pratique si un texte chinois précis dans la sortie est une exigence absolue.
Oui. ERNIE Image traite les deux écritures en un seul appel de génération, en maintenant une grande précision pour chacune de manière indépendante. Cela est utile pour les affiches bilingues, les emballages et les ressources marketing qui nécessitent que les deux langues soient lisibles dans la même mise en page. Les scores LongTextBench pour l'anglais et le chinois sont tous deux supérieurs à 0,96.
ERNIE Image inclut un Prompt Enhancer léger qui réécrit automatiquement les prompts d'entrée courts en descriptions plus riches et plus structurées avant de les transmettre au modèle de diffusion. Cela signifie que vous pouvez envoyer des prompts brefs et obtenir des résultats plus détaillés et précis sans avoir recours à une ingénierie de prompts approfondie. Le Prompt Enhancer s'exécute en tant que partie du pipeline de génération lors de chaque appel d'API.
ERNIE Image Turbo utilise la DMD (Diffusion Model Distillation) et l'apprentissage par renforcement pour compresser l'inférence de 50 étapes à 8, offrant une amélioration de la vitesse de plus de 6 fois. Turbo est gratuit sur Atlas Cloud et adapté à l'itération rapide et à la génération de brouillons. Le modèle standard s'exécute en qualité maximale pour les actifs de production finaux tels que les affiches commerciales et les graphiques éditoriaux.
Oui. ERNIE Image est publié sous la licence Apache 2.0, qui autorise l'utilisation commerciale, la modification et la distribution. Les images générées peuvent être utilisées dans la publicité, les emballages, les publications et autres applications commerciales. Consultez les conditions complètes de la licence sur le dépôt GitHub d'ERNIE Image pour toute condition spécifique.
Guides, tutoriels et actualités produit pour tirer le meilleur d'Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.