
O Atlas Cloud hospeda o ERNIE Image e o ERNIE Image Turbo sob a Baidu API, ambos com pagamento conforme o uso. Cada modelo é líder em código aberto para renderização de texto em inglês e chinês.
Crie visuais impressionantes e prontos para produção a partir de prompts e referências com os mais avançados modelos de IA de geração de imagens na Atlas Cloud.
Compare standard vs. our pricing across every Baidu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Baidu ERNIE Image Turbo Text-to-image | — | Start fromFree | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
O ERNIE Image foi desenvolvido para fluxos de trabalho onde o texto precisa ser legível dentro da imagem gerada. As equipes o utilizam para produzir ativos bilíngues, layouts estruturados e criativos com muito texto em grande escala, sem a necessidade de uma equipe de design.
As equipes de marketing usam o ERNIE Image para gerar pôsteres de campanha com texto legível em inglês e chinês em uma única chamada de API, atingindo ambos os mercados com a mesma estrutura de prompt. O modelo renderiza ambas as escrituras com precisão superior a 0,96, para que os títulos e o corpo do texto saiam nítidos sem correções de pós-produção. O modelo de preços de pagamento conforme o uso da Atlas Cloud torna prático gerar dezenas de variantes por campanha sem custo de design por ativo.
Marcas que entram no mercado chinês usam o ERNIE Image para gerar mockups de rótulos de produtos e embalagens com texto bilíngue preciso antes de se comprometerem com a produção de impressão. O modelo lida com chinês simplificado, chinês tradicional e inglês no mesmo layout, incluindo textos pequenos em rótulos e listas de ingredientes. Com uma resolução de saída de 1024×1024, os mockups têm qualidade de produção suficiente para serem usados em aprovações de clientes e submissões regulatórias.
Editores e estúdios de conteúdo usam o ERNIE Image para gerar painéis de quadrinhos com balões de fala, caixas de legenda e texto de painel precisos em chinês ou inglês. O modelo pontua acima de 0,96 no LongTextBench especificamente para esse tipo de saída estruturada de texto em imagem. O ERNIE Image Turbo no Atlas Cloud é gratuito, o que torna a elaboração de painéis em alto volume sem custos durante a fase de iteração.
As equipes de dados constroem pipelines que convertem dados estruturados em imagens de infográficos rotuladas usando a precisão de renderização de texto do ERNIE Image. Rótulos de gráficos, caixas de destaque e cabeçalhos de seção são renderizados com precisão em ambos os idiomas a partir de um único prompt, eliminando a etapa de design manual entre a saída de dados e o visual. O Prompt Enhancer integrado reescreve automaticamente descrições breves de dados em instruções de layout detalhadas.
As equipes de marketing de performance geram criativos de anúncios localizados para os mercados de língua chinesa e inglesa a partir do mesmo briefing de campanha, usando o suporte bilíngue do ERNIE Image para produzir ambas as variantes de idioma em um único fluxo de trabalho. Cada criativo vem com texto preciso na imagem, eliminando a necessidade de editar ou recompor as imagens geradas. O nível Turbo gratuito no Atlas Cloud mantém os custos de teste em zero enquanto as equipes avaliam quais variantes de criativos escalar.
As equipes de produto e design usam o ERNIE Image para gerar capturas de tela de mockups de interface do usuário com textos de espaço reservado realistas renderizados com precisão em inglês ou chinês. O modelo lida com rótulos de botões, textos de navegação, campos de formulário e textos de janelas modais com alta fidelidade, tornando os mockups utilizáveis em apresentações sem a edição manual das camadas de texto. Isso reduz o tempo entre o conceito do wireframe e o visual pronto para os stakeholders de horas para minutos.
O ERNIE Image atinge uma pontuação superior a 0,96 no LongTextBench para renderização de texto em chinês, a mais alta entre os modelos de texto para imagem de pesos abertos. A maioria dos modelos de código aberto concorrentes tem pontuação bem abaixo de 0,3 em cenários de texto em chinês, o que os torna não confiáveis para qualquer fluxo de trabalho que exija texto em chinês legível nas imagens geradas. O ERNIE Image é a escolha prática se o texto em chinês preciso na saída for um requisito estrito.
Sim. O ERNIE Image lida com ambas as escritas em uma única chamada de geração, mantendo alta precisão para cada uma de forma independente. Isso é útil para pôsteres bilíngues, embalagens e ativos de marketing que precisam que ambos os idiomas sejam legíveis no mesmo layout. As pontuações do LongTextBench tanto para inglês quanto para chinês estão acima de 0,96.
O ERNIE Image inclui um Prompt Enhancer leve que reescreve automaticamente prompts de entrada curtos em descrições mais ricas e estruturadas antes de passá-los para o modelo de difusão. Isso significa que você pode enviar prompts breves e obter resultados mais detalhados e precisos sem a necessidade de uma extensa engenharia de prompts. O Prompt Enhancer é executado como parte do pipeline de geração em cada chamada de API.
O ERNIE Image Turbo utiliza DMD (Diffusion Model Distillation) e aprendizado por reforço para comprimir a inferência de 50 passos para 8, proporcionando uma melhoria de velocidade de mais de 6x. O Turbo é gratuito na Atlas Cloud e adequado para iteração rápida e geração de rascunhos. O modelo padrão é executado com qualidade total para ativos de produção final, como pôsteres comerciais e gráficos editoriais.
Sim. O ERNIE Image é lançado sob a licença Apache 2.0, que permite uso comercial, modificação e distribuição. As imagens geradas podem ser usadas em publicidade, embalagens, publicações e outras aplicações comerciais. Revise os termos completos da licença no repositório do ERNIE Image no GitHub para verificar condições específicas.
Guias, tutoriais e novidades de produto para você aproveitar ao máximo a Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.