A edição de imagens impulsiona a maior parte do trabalho de produção. As equipes começam com uma foto de produto, uma imagem de marca ou um design de personagem. Depois, precisam de variações, trocas de fundo e novas cenas.
Os modelos de referência de imagem lidam bem com esse trabalho. Você fornece um prompt e uma imagem; o modelo mantém as partes importantes e altera o restante. Este guia compara os modelos de edição de imagem de alto nível no Atlas Cloud e mostra onde cada um se encaixa.
Última atualização: 29 de abril de 2026
Aqui estão exemplos do que os modelos de imagem com referência podem produzir:



O que conta como edição de imagem por IA (2026)
A edição de imagem por IA agora inclui mais do que simples inpainting. Modelos de referência de imagem (muitas vezes chamados de "Image-to-Image" ou "geração guiada por Canny/Depth") podem mudar o estilo, reenquadrar e estender uma imagem a partir de uma única chamada de API.
- Transferência de estilo: Aplique o visual de uma imagem a um novo assunto.
- Consistência de personagem: Mantenha o mesmo personagem em diferentes poses e cenas.
- Variações de produto: Mostre um produto em novos cenários ou iluminação.
- Geração consistente com a marca: Mantenha uma identidade visual única em um lote.
- Integração de texto: Renderize texto preciso e de alta fidelidade diretamente nas imagens (exclusivo do GPT Image 2).
O padrão de API é simples. Envie um prompt e uma imagem de referência. Receba de volta uma imagem que segue ambos.
Como funciona a edição de imagem com referência por trás das câmeras
O modelo recebe dois inputs: o prompt e a imagem de referência. Ele codifica ambos e gera uma nova imagem usando a referência como um sinal de condicionamento. O prompt diz o que mudar, enquanto a referência indica quais âncoras visuais manter.
A adesão não é fixa. Alguns modelos mantêm-se próximos a características faciais, silhuetas, paleta ou dicas de material. Outros tratam a referência de forma mais flexível, usando-a apenas como guia. O resultado depende do modelo, do prompt e da especificidade da imagem original.
Esses sistemas não copiam pixels linha por linha. Eles preservam a estrutura de alto nível e características reconhecíveis, enquanto regeneram textura, iluminação, detalhes de fundo e pequenas formas locais. É por isso que uma referência limpa ajuda; ela dá ao modelo um alvo estável.
A tabela comparativa completa
| Modelo | Desenvolvedor | Preço/Img | Máx Refs | Consistência | Melhor para |
| GPT Image 2 | OpenAI | ~USD0.01-0.41/foto | 10 imagens | Elite | Lógica complexa, renderização de texto, raciocínio espacial |
| Flux 2 Pro | Black Forest | USD0.03-0.05 | 1 imagem | Forte | Geração de marca consistente, variantes de produto |
| Nano Banana 2 | USD0.08-0.16 | 14 imagens | Excelente | Séries de personagens, variações estilizadas, detalhes 4K | |
| Seedream v5.0 Lite | ByteDance | USD0.032 | 14 imagens | Boa | Produção de variantes em alto volume, velocidade |
| Imagen 4 Ultra | Google DeepMind | USD0.06 | Apenas texto | N/A | Imagens principais premium (sem input de referência) |
| Z-Image Turbo | Z-AI | USD0.01 | Apenas texto | N/A | Geração focada em velocidade (sem input de referência) |
O Atlas Cloud oferece uma única chave de API para todos eles. Você alterna entre modelos alterando apenas um parâmetro.
Rankings por caso de uso
Melhor para raciocínio complexo e texto: GPT Image 2
O GPT Image 2 é o modelo mais inteligente da linha. Como utiliza um espaço latente de "pensamento", ele pode raciocinar através de instruções espaciais complexas e renderizar tipografia perfeita.
Cenário: Você precisa trocar um fundo, mas manter um frasco de perfume específico intacto, adicionando um rótulo legível "520 Limited Edition" em uma fonte específica.
Melhor para consistência de personagens: Nano Banana 2
O Nano Banana 2 é a melhor escolha para personagens recorrentes. Ele mantém as características faciais, roupas e acessórios estáveis em novas cenas.
Isso o torna útil para histórias, mascotes, avatares e mockups de mercadorias. O Nano Banana 2 é precificado como um modelo de edição premium a USD0.08 por imagem em 1K, USD0.12 em 2K e USD0.16 em 4K.
Melhor para produção consistente com a marca: Flux 2 Pro
O Flux 2 Pro é o padrão mais seguro para trabalhos de marca. Dê a ele uma imagem de referência sólida e ele manterá a cor, a iluminação e o tom visual em várias saídas.
Melhor para variantes de alto volume: Seedream v5.0 Lite
O Seedream v5.0 Lite é adequado para grandes lotes. É rápido o suficiente para centenas de variantes e barato o suficiente para usar em escala.
O Seedream v5.0 Lite funciona bem para variações de produtos, cenas de estilo de vida e ativos de teste A/B.
Melhor para qualidade máxima (sem referência): Imagen 4 Ultra
O Imagen 4 Ultra não utiliza imagem de referência. Use o Imagen 4 Ultra quando precisar de uma imagem principal ("hero image") e não precisar de controle de referência.
Detalhes de cada modelo
GPT Image 2
ID do modelo: openai/gpt-image-2/edit
Preço: Escalonado (baixa/alta resolução)
Use para: Seguir instruções precisas.
Exemplo de prompt: O mesmo produto da referência, mas colocado em um balcão de mármore. Adicione o texto "Maison Francis Kurkdjian" na parede atrás dele em letras douradas elegantes.
Nano Banana 2
ID do modelo: google/nano-banana-2/edit
Preço: USD0.08 por imagem em 1K, USD0.12 em 2K, USD0.16 em 4K
Suporte a referência: Sim, 1 imagem
Resolução máxima: 4K
O Nano Banana 2 foi criado para consistência de identidade. Ele mantém o mesmo personagem reconhecível através de várias poses, roupas e cenas.
Exemplo de prompt:
1same fox mascot as the reference, waving in a school hallway, red backpack, clean children's book styleExemplo de prompt:
1same anime barista from the reference, night cafe scene, pouring coffee, warm neon lighting, keep face and outfit designUse para:
- Conteúdo narrativo: Reutilize um personagem em várias cenas
- Mockups de produtos: Coloque um personagem em camisas, canecas, pôsteres ou embalagens
- Variações de avatar: Mantenha um avatar consistente através de estilos e expressões
- Protótipos de ativos de jogos: Teste poses, roupas e posturas a partir de uma única imagem conceitual
Um pacote de 100 imagens custa USD8 no nível 1K. Use quando a consistência for mais importante do que o menor custo.
Leia mais no guia do Nano Banana 2 e no guia de prompts do Nano Banana 2.
Seedream v5.0 Lite
ID do modelo: bytedance/seedream-v5.0-lite/edit
Preço: USD0.032 por imagem
Suporte a referência: Sim, 1 imagem
Resolução máxima: 4704x2016
O Seedream v5.0 Lite é um modelo de processamento em lote. Funciona melhor quando você precisa de muitas saídas úteis rapidamente.
Exemplo de prompt:
1same running shoe from the reference on a city sidewalk, athletic campaign look, hard daylight, sharp retail detailExemplo de prompt:
1same bottled drink in a picnic scene, summer palette, friends in soft focus background, ad-ready compositionUse para:
- Variantes de fotografia de produto -- mesmo produto, novas configurações ou iluminação
- Variações de cenas lifestyle -- mesmo conceito, diferentes assuntos ou estações
- Lotes de conteúdo localizado -- mesma ideia de campanha, diferentes estilos regionais
- Geração de ativos de teste A/B -- muitas versões de uma única imagem central
Leia mais no guia do Seedream v5.0 Lite.
Acesso à API: Edição com imagens de referência
O fluxo de trabalho é o mesmo em todos os três modelos de edição. Cadastre-se no Atlas Cloud, crie uma chave de API e ganhe USD1 em crédito gratuito. Isso é suficiente para um pequeno teste em todos os três.

O padrão em Python é igual para todos os modelos:
python1import requests 2import time 3 4 5API_KEY = "your-atlas-cloud-api-key" 6BASE_URL = "https://api.atlascloud.ai/api/v1" 7 8 9# Generate image with a reference -- works the same for Flux 2 Pro, 10# Nano Banana 2, and Seedream v5.0 Lite 11response = requests.post( 12 f"{BASE_URL}/model/generateImage", 13 headers={ 14 "Authorization": f"Bearer {API_KEY}", 15 "Content-Type": "application/json" 16 }, 17 json={ 18 "model": "black-forest-labs/flux-2-pro/text-to-image", 19 "prompt": "the same product photographed in a sunlit kitchen scene, morning light, cozy lifestyle aesthetic", 20 "reference_image_url": "https://your-cdn.com/product-hero.jpg", 21 "width": 1024, 22 "height": 1024 23 } 24) 25 26 27result = response.json() 28 29 30# Poll for results 31while True: 32 status = requests.get( 33 f"{BASE_URL}/model/prediction/{result['request_id']}/get", 34 headers={"Authorization": f"Bearer {API_KEY}"} 35 ).json() 36 if status["status"] == "completed": 37 print(f"Image: {status['output']['image_url']}") 38 break 39 time.sleep(3)
Para trocar de modelo, altere o campo
1modelExperimente a edição de imagem por IA no Atlas Cloud -- USD1 de crédito grátis
Padrões de fluxo de trabalho práticos
Padrão 1: Pipeline de ativos de marca (Flux 2 Pro)
Uma marca precisa de 50 imagens para redes sociais por semana em um estilo visual único.
- Solução: Use o Flux 2 Pro. Ele mantém a cor, iluminação e texturas de materiais (como vidro ou seda) consistentes em muitas saídas.
- Custo: 50 imagens x USD 0.05 = USD 2.50 por semana.
Padrão 2: Biblioteca de personagens (Nano Banana 2)
Um criador precisa de um mascote em 100 cenas diferentes para um aplicativo.
- Solução: Use o Nano Banana 2. Ele mantém as características faciais e roupas estáveis em novas poses melhor do que qualquer outra API pública.
- Custo: 100 imagens x USD 0.08 = USD 8.00 no total.
Padrão 3: Edição lógica e rica em texto (GPT Image 2)
Uma campanha requer texto específico no produto ou lógica espacial complexa (por exemplo, "Coloque o frasco atrás das flores, não na frente").
- Solução: Use o GPT Image 2. Seu "Mecanismo de Raciocínio" garante que textos como "OUD velvet mood" sejam grafados corretamente e posicionados logicamente na cena.
- Custo: 100 imagens x USD 0.053 (Nível Médio) = USD 5.30 no total.
Padrão 4: Lote de variantes (Seedream v5.0 Lite)
Uma equipe de e-commerce precisa de 500 variantes lifestyle de uma foto de produto para testes A/B.
- Solução: Use o Seedream v5.0 Lite. É rápido o suficiente para lotes massivos e barato o suficiente para usar em escala.
- Custo: 500 imagens x USD 0.032 = USD 16.00.
Quando NÃO usar a edição de imagem com referência
- Inpainting pixel-perfect: Use ferramentas de inpainting dedicadas se você precisar apenas alterar uma pequena área local (como uma imperfeição) sem tocar no restante da imagem.
- Correspondência de cor por pixel: A iluminação da IA pode deslocar levemente os códigos hexadecimais. Use pós-processamento para conformidade estrita com cores da marca.
- Remoção de fundo simples: Se você só precisa de um fundo branco, use uma ferramenta de remoção de fundo. Usar o GPT Image 2 para isso seria um desperdício de seu poder de raciocínio e orçamento.
Perguntas frequentes
Qual modelo tem a melhor consistência de personagem?
Nano Banana 2. Ele foi construído especificamente para a preservação da identidade. No entanto, o GPT Image 2 é melhor se o personagem precisar interagir com texto ou máquinas complexas.
Posso usar várias imagens de referência ao mesmo tempo?
Atualmente, a maioria dos modelos no Atlas Cloud aceita uma imagem de referência por solicitação. Para mistura de estilos, é melhor gerar uma única referência "composta" primeiro.
Como o GPT Image 2 difere dos outros?
Ele não apenas "copia" o estilo; ele compreende o conteúdo. Ele sabe que um "frasco de perfume" é feito de vidro e ajustará os reflexos logicamente quando você alterar o fundo.
Quanto cobre o crédito gratuito de USD 1?
- Seedream v5.0 Lite: ~31 imagens.
- Flux 2 Pro: ~20–33 imagens.
- GPT Image 2 (Médio): ~18 imagens.
- Nano Banana 2: ~12 imagens.
Veredito
- Escolha o GPT Image 2 se você precisar que a IA "entenda" e "leia/escreva" dentro da imagem.
- Escolha o Flux 2 Pro para a melhor qualidade estética em trabalhos de marcas de luxo.
- Escolha o Nano Banana 2 para consistência de personagem e PI.
- Escolha o Seedream v5.0 Lite para produzir em massa milhares de variantes com o menor custo.
O Atlas Cloud torna fácil testar mais de um modelo. Use uma única chave de API, mantenha um único sistema de faturamento e alterne os modelos com uma simples mudança de parâmetro.
Obtenha USD1 de crédito grátis no Atlas Cloud -- Experimente todos os modelos de edição de imagem
────────────────────────────────────────────────────────────






