
Atlas Cloud aloja ERNIE Image y ERNIE Image Turbo bajo la Baidu API, ambos con modelo de pago por uso. Cada modelo es líder de código abierto en la renderización de texto en inglés y chino.
Crea imágenes impactantes y listas para producción a partir de prompts y referencias con los modelos de IA de generación de imágenes más avanzados en Atlas Cloud.
Compare standard vs. our pricing across every Baidu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Baidu ERNIE Image Turbo Text-to-image | — | Start fromFree | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
ERNIE Image está diseñado para flujos de trabajo donde el texto debe ser legible dentro de la imagen generada. Los equipos lo utilizan para producir activos bilingües, diseños estructurados y creatividades con mucho texto a gran escala sin necesidad de un equipo de diseño.
Los equipos de marketing utilizan ERNIE Image para generar carteles de campaña con texto legible en inglés y chino en una sola llamada de API, dirigiéndose a ambos mercados con la misma estructura de prompt. El modelo renderiza ambas escrituras con una precisión superior a 0,96, por lo que los titulares y el cuerpo del texto quedan impecables sin necesidad de correcciones de posproducción. Los precios de pago por uso de Atlas Cloud hacen que sea práctico generar docenas de variantes por campaña sin un costo de diseño por activo.
Las marcas que ingresan al mercado chino utilizan ERNIE Image para generar maquetas de etiquetas de productos y envases con texto bilingüe preciso antes de comprometerse con la producción de impresión. El modelo maneja chino simplificado, chino tradicional e inglés en el mismo diseño, incluido el texto pequeño en etiquetas y listas de ingredientes. A una resolución de salida de 1024×1024, las maquetas tienen calidad de producción suficiente para su uso en aprobaciones de clientes y presentaciones normativas.
Los editores y los estudios de contenido utilizan ERNIE Image para generar viñetas de cómics con globos de diálogo, cuadros de subtítulos y texto de viñeta precisos en chino o inglés. El modelo obtiene una puntuación superior a 0,96 en LongTextBench específicamente para este tipo de salida estructurada de texto en imagen. ERNIE Image Turbo en Atlas Cloud es gratuito, lo que hace que el diseño de viñetas de gran volumen no tenga costo durante la fase de iteración.
Los equipos de datos construyen canales que convierten datos estructurados en imágenes de infografías etiquetadas utilizando la precisión de renderizado de texto de ERNIE Image. Las etiquetas de los gráficos, los cuadros de texto y los encabezados de las secciones se renderizan con precisión en ambos idiomas a partir de un solo prompt, eliminando el paso de diseño manual entre la salida de datos y el elemento visual. El Prompt Enhancer integrado reescribe automáticamente breves descripciones de datos en instrucciones de diseño detalladas.
Los equipos de marketing de resultados generan creatividades publicitarias localizadas para los mercados de habla china e inglesa a partir del mismo brief de campaña, utilizando el soporte bilingüe de ERNIE Image para producir ambas variantes de idioma en un solo flujo de trabajo. Cada creatividad viene con texto preciso dentro de la imagen, eliminando la necesidad de editar o rediseñar las imágenes generadas. El nivel Turbo gratuito en Atlas Cloud mantiene los costos de prueba en cero mientras los equipos evalúan qué variantes creativas escalar.
Los equipos de producto y diseño utilizan ERNIE Image para generar capturas de pantalla de maquetas de interfaz de usuario con texto de marcador de posición realista, renderizado con precisión en inglés o chino. El modelo maneja etiquetas de botones, texto de navegación, campos de formulario y texto de ventanas modales con alta fidelidad, lo que permite que las maquetas se puedan utilizar en presentaciones sin necesidad de editar manualmente las capas de texto. Esto reduce el tiempo entre el concepto del wireframe y el diseño visual listo para las partes interesadas de horas a minutos.
ERNIE Image obtiene una puntuación superior a 0,96 en LongTextBench para la renderización de texto en chino, la más alta entre los modelos de texto a imagen de pesos abiertos. La mayoría de los modelos de código abierto de la competencia obtienen puntuaciones muy por debajo de 0,3 en escenarios de texto en chino, lo que los hace poco fiables para cualquier flujo de trabajo que requiera texto en chino legible dentro de las imágenes generadas. ERNIE Image es la opción práctica si la precisión del texto en chino en el resultado es un requisito indispensable.
Sí. ERNIE Image procesa ambas escrituras en una sola llamada de generación, manteniendo una alta precisión para cada una de forma independiente. Esto es útil para carteles bilingües, envases y recursos de marketing que requieren que ambos idiomas sean legibles en el mismo diseño. Las puntuaciones de LongTextBench tanto para inglés como para chino superan el 0,96.
ERNIE Image incluye un Prompt Enhancer ligero que reescribe automáticamente los prompts de entrada breves en descripciones más ricas y estructuradas antes de pasarlos al modelo de difusión. Esto significa que puede enviar prompts breves y obtener resultados más detallados y precisos sin necesidad de una extensa ingeniería de prompts. El Prompt Enhancer se ejecuta como parte de la canalización de generación en cada llamada a la API.
ERNIE Image Turbo utiliza DMD (Diffusion Model Distillation) y aprendizaje por refuerzo para comprimir la inferencia de 50 pasos a 8, logrando una mejora de velocidad de más de 6 veces. Turbo es gratuito en Atlas Cloud y es adecuado para la iteración rápida y la generación de borradores. El modelo estándar se ejecuta con calidad total para activos de producción final, como carteles comerciales y gráficos editoriales.
Sí. ERNIE Image se publica bajo la licencia Apache 2.0, que permite su uso comercial, modificación y distribución. Las imágenes generadas pueden utilizarse en publicidad, envases, publicaciones y otras aplicaciones comerciales. Revise los términos completos de la licencia en el repositorio de GitHub de ERNIE Image para conocer cualquier condición específica.
Guías, tutoriales y novedades de producto para aprovechar al máximo Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.