Como criar um jogo 3D estilo Zelda com apenas uma API de IA

A partir de uma única frase descrevendo um ambiente, acabei com um personagem 3D articulado que conseguia caminhar e pular dentro de uma engine de jogo, vagando por um cânion bioluminescente com o espírito visual de Zelda. Nunca abri um programa de modelagem, nem escrevi uma única linha de código de renderização de baixo nível.

Este artigo percorre todo o processo, incluindo os erros que cometi ao longo do caminho. Cada capacidade de IA que utilizei veio da mesma plataforma, Atlas Cloud, e todo o fluxo de trabalho foi executado com uma única chave de API.

A versão curta: O que antes exigia uma equipe agora exige apenas uma API

No passado, criar um jogo 3D jogável significava superar vários obstáculos técnicos. Você precisava saber modelar em ferramentas como ZBrush ou Blender, articular um personagem com um esqueleto, animá-lo por meio de quadros-chave ou captura de movimento e, então, escrever o código necessário para levar esses ativos para uma engine de jogo. Para a maioria dos iniciantes, qualquer uma dessas etapas era suficiente para interromper o projeto antes mesmo de começar.

O que eu queria testar era simples: a IA agora consegue conectar essas etapas de ponta a ponta, permitindo que alguém sem experiência em modelagem ou programação crie uma demonstração de jogo 3D que realmente rode dentro de uma engine?

A resposta, após tentar, é sim. Todo o pipeline de IA, desde a geração de imagens e conversão 3D até a texturização e criação de skybox, foi executado por meio de uma única chave de API. O trabalho de engenharia mais técnico, incluindo a montagem no Blender e a configuração do projeto no Godot, foi orquestrado pelo Claude. Meu papel foi basicamente inspecionar os resultados e descrever o que eu queria a seguir.

Uma chave de API sustentou todo o fluxo de trabalho. GPT Image 2, YouChuan MJ V8.1, Nano Banana 2, Seed 3D, Hunyuan 3D e outros modelos rodaram através do Atlas Cloud usando a mesma chave. Não houve necessidade de se registrar em uma plataforma após a outra, recarregar contas separadas ou integrar diferentes APIs manualmente.

Uma chave de API sustentou todo o fluxo de trabalho

Visão geral do fluxo de trabalho completo, na ordem que segui

plaintext
1①  GPT Image 2       →  Arte conceitual do ambiente, definindo a estética: renderização estilo Zelda com um cânion bioluminescente escuro
2②  Edição GPT Image 2 →  Transformar o ambiente em um “diorama 3D”, limpando-o para uma imagem base isométrica
3③  Hunyuan 3D        →  Testar a cena completa transformando o diorama inteiro em 3D em uma única passada
4④  GPT Image 2       →  Gerar um skybox 360° com o mesmo modelo, usado como o fundo estrelado do jogo
5⑤  YouChuan MJ V8.1  →  Desenhar o conceito do personagem guarda-florestal, definindo a essência do protagonista
6⑥  Nano Banana 2     →  Preservar a consistência do personagem e redesenhar o design em uma pose T frontal como referência
7⑦  Seed 3D           →  Converter a imagem do personagem em 3D, com geometria limpa de cabelo e dedos, estrutura favorável à articulação, PBR integrado e modelo Seed da ByteDance
8⑧  Nano Banana 2 + Hunyuan 3D  →  Construir o acessório da lanterna separadamente
9⑨  Mixamo + Blender × Claude →  Articulação automática e animações de caminhar/correr/pular com Mixamo; Claude via MCP gerencia a importação, conexão de materiais, alinhamento e exportação GLB no Blender
10⑩  Godot 4           →  Integrar tudo: controlador de personagem, câmera em terceira pessoa, skybox, névoa volumétrica e lanterna brilhante

As etapas ① a ⑧ usaram recursos de IA disponíveis no Atlas Cloud, que se posiciona como “Uma API para toda IA de Mídia”, uma interface única para chamar mais de 300 modelos. Isso inclui o YouChuan MJ na etapa ⑤. O Mixamo na etapa ⑨, o Godot na etapa ⑩ e o Blender nos bastidores para a configuração de materiais foram ferramentas de terceiros gratuitas.

Abaixo está o processo prático, com os prompts reais que usei em cada etapa.

Etapa 1 | GPT Image 2: Primeiro, desenhe o mundo

O ponto de partida não foi o personagem, mas a estética do mundo inteiro. Usei o GPT Image 2 no Atlas Cloud para gerar uma imagem conceitual do ambiente e definir o tom: renderização estilo Zelda, combinada com um cânion escuro e bioluminescente.

Prompt do ambiente ('text-to-image'; defini a proporção para '16:9' nos parâmetros do playground):

plaintext
1bioluminescent fantasy canyon at night, stylized painterly game concept art, towering deep-indigo and magenta rock cliffs glowing with teal veins, tall bell-shaped glowing flora with crystal tips, ancient carved standing stones with angular constellation glyphs, winding ridge path, a small hooded ranger with a warm lantern beside a campfire for scale, misty atmospheric depth, starry night sky, cool teal-and-violet palette with warm amber accent, dreamy magical mood, soft cel-shaded painterly rendering, cinematic wide establishing shot, high detail

Essa imagem tornou-se a âncora estética de todo o projeto. A paleta de cores, a iluminação e a construção do mundo foram decididas aqui. Nesta fase, a única questão era se a imagem parecia boa. Se ela poderia ser modelada, isso viria depois.

Por que o GPT Image 2 para o ambiente: Para o pipeline de "cenário de ambiente seguido de conversão para diorama", o GPT Image 2 foi a opção mais estável em meus testes. Suas composições eram claras e suas cores se mantiveram bem. Quando tentei outros modelos de imagem para a conversão de diorama, eles frequentemente transformavam a imagem em um modelo de argila branca, perdendo informações de cor e material necessárias para a modelagem posterior. Para a trilha do ambiente, mantive o GPT Image 2.

GPT Image 2

Etapa 2 | Edição do GPT Image 2: Transforme o ambiente em um diorama 3D

Em seguida, a imagem conceitual precisava ser transformada em algo que um modelo 3D pudesse entender. Uma pintura conceitual de grande angular não funciona bem como uma entrada direta de modelagem. A iluminação é muito dramática e o fundo muito poluído. Então, usei a função edit do GPT Image 2 para limpá-la para uma imagem base estilo diorama isométrico, preparando o material para a próxima etapa.

Prompt de conversão para diorama (GPT Image 2 'edit', usando a imagem do ambiente da Etapa 1 como entrada):

plaintext
1Convert this scene into a clean 3D-renderable isometric diorama, keeping ALL original colors and textures fully intact — purple-magenta rock, teal glowing bell flowers, carved runestones, mossy ground. Plain simple background. Even soft neutral lighting so the true surface colors read clearly; remove only the heavy colored rim-light, fog and warm campfire glow. Do NOT desaturate, do NOT turn into grey clay. Preserve material and texture detail, single connected terrain chunk, 3/4 orthographic view, no text, no characters.

A armadilha mais comum aqui: não deixe a imagem virar um modelo de argila cinza-branca. O Hunyuan lê as informações de textura da próxima etapa diretamente das cores da imagem de entrada. Se você fornecer uma imagem semelhante a argila cinza, ele só poderá retornar um modelo cinza. É por isso que o prompt diz explicitamente 'keeping ALL original colours' (mantendo TODAS as cores originais) e 'Do NOT desaturate' (NÃO dessaturar). O objetivo é remover apenas a luz de contorno forte, a névoa e o brilho da fogueira, preservando a cor base e os detalhes do material.

Hunyuan

Etapa 3 | Hunyuan 3D: Eleve todo o diorama para 3D em uma única passada

Esta etapa foi um teste de estresse deliberado. Em vez de quebrar a cena em ativos separados, alimentei toda a imagem do diorama da etapa anterior no Hunyuan 3D para ver se ele conseguiria reconstruir a cena inteira de uma vez.

O resultado foi mais utilizável do que eu esperava. O diorama saiu com cerca de 100.000 polígonos. Sua estrutura geral, formas rochosas e relações de terreno foram bem preservadas, e ele veio com texturas PBR em vez de uma malha branca nua. Eu esperava algo mais próximo de um relevo achatado. Após o pré-processamento do diorama, o modelo da cena completa foi muito mais utilizável do que o previsto. Foi uma surpresa agradável que vale a pena notar.

Uma nota sobre o princípio por trás disso: Esta parte usou a geração de imagem única do Hunyuan 3D, ou imagem-para-3D. Quando recebe uma imagem grande angular completa, ele se baseia na imagem e na inferência estilística para preencher a estrutura tridimensional ausente. A parte mais impressionante é que, mesmo com apenas uma imagem frontal grande angular, ele consegue inferir razoavelmente a parte de trás e a parte inferior invisíveis no mesmo estilo, produzindo uma cena tridimensional completa em vez de um relevo plano. Para um diorama, isso já é bastante capaz. Para ambientes mais refinados, a abordagem mais ortodoxa ainda é dividir a cena em ativos separados, modelá-los um por um e montá-los na engine.

Hunyuan imagem-para-3D

Por que o Hunyuan para o ambiente, e não o Seed 3D: Rodei ambos os modelos na mesma imagem de diorama. Para ambientes, o Hunyuan produziu texturas mais completas e sólidas. Padrões de rocha e detalhes do solo foram bem representados. A tentativa de ambiente do Seed perdeu uma boa parte da textura e pareceu mais áspera no geral. Então, para ambientes e cenas, escolhi o Hunyuan. Para personagens, a conclusão foi o inverso, como explicado na Etapa 7.

Hunyuan em vez de Seed 3D

Uma regra rege todo o projeto: mantenha a contagem de polígonos abaixo de 100.000. Em um jogo, um modelo que roda suavemente é mais importante do que um com detalhes excessivos. Quando a contagem de polígonos fica muito alta, a articulação torna-se mais difícil, a engine fica lenta e a iteração demora para sempre. Para ativos de jogo jogáveis, 50.000 a 100.000 polígonos geralmente são suficientes. Ferramentas de modelagem podem oferecer 500.000 ou um milhão, mas isso é mais adequado para filmes ou impressão 3D. Uma demonstração jogável não precisa disso.

Etapa 4 | GPT Image 2: Gerar um skybox 360° com o mesmo modelo

O céu estrelado do jogo não foi modelado. Foi um skybox na engine, uma imagem panorâmica que envolve o mundo inteiro. Usei novamente o GPT Image 2, em duas etapas:

Primeiro, usei a imagem conceitual do ambiente da Etapa 1 como referência de imagem-para-imagem e gerei um céu estrelado limpo, removendo o terreno e mantendo apenas o céu. A cor e a atmosfera permaneceram consistentes com o cenário original: índigo profundo a azul real, estrelas densas, aurora verde-azulada, meteoros e nebulosas.
Então, usei o edit para converter essa imagem em um panorama equirretangular 360° com proporção 2:1 e bordas esquerda-direita contínuas, pronto para ser colocado na engine como um skybox.

Prompt de céu limpo (imagem-para-imagem, usando a imagem conceitual do ambiente da Etapa 1; proporção '2:1'):

plaintext
1A pure night sky only, no terrain and no horizon line, bioluminescent dark fantasy game sky: smooth deep indigo-to-royal-blue gradient, a dense field of bright white and pale-cyan stars, soft flowing teal-green aurora ribbons, a faint cyan-and-magenta nebula glow, one or two thin meteor streaks, dreamy magical atmosphere, soft cel-shaded painterly rendering, no ground, no mountains, no characters, sky fills the entire frame.

céu limpo com GPT-image-2

Converter para panorama 360° ('edit', usando a imagem do céu acima; proporção '2:1'):

plaintext
1Convert this night sky into a full 360-degree equirectangular spherical panorama with a 2:1 aspect ratio, for use as a seamless game skybox. Wrap horizontally so the left and right edges line up with no visible seam. Keep the same teal-and-violet palette, bright stars and soft aurora. No ground, no characters, seamless tiling.

panorama 360 com GPT-image-2

Esta etapa mostra novamente a vantagem de uma chave cobrindo toda a cadeia. A imagem do ambiente, a base do diorama e o skybox foram todos gerados com o GPT Image 2, sem precisar trocar de modelo.

Etapa 5 | YouChuan MJ V8.1: Desenhar o protagonista ranger

Uma vez que o ambiente foi definido, era hora do protagonista. O personagem é a alma do projeto. Usei o YouChuan MJ V8.1 no Atlas Cloud porque sua consistência de estilo e atmosfera visual se adequaram bem ao projeto, tornando-o um bom ajuste para definir a sensação geral do protagonista.

Eu queria uma ranger feminina de cabelo azul que pertencesse ao mesmo mundo: rabo de cavalo preso para trás, um colete de couro justo com acabamento em runas bioluminescentes, uma camada inferior slim de manga longa, luvas sem dedos, calças ajustadas e botas resistentes.

Prompt do personagem (descrição simples; a proporção e a força do estilo foram definidas no painel de parâmetros, não escritas no prompt):

plaintext
1full body character design of a young female explorer-ranger, athletic slim build, short tousled hair or a low tied-back ponytail (no long loose hair over the shoulders), wearing a fitted sleeveless leather tunic with glowing teal-rune trim over a slim close-fitting long-sleeve underlayer, fitted trousers tucked into sturdy boots, fingerless gloves and forearm bracers, a small warm-amber lantern clipped at the hip, gentle determined expression, bioluminescent dark fantasy style, cool teal-and-violet palette with warm amber accent glow, soft cel-shaded painterly rendering, calm neutral standing pose with arms held clearly away from the torso, clean plain background, full body visible head to toe, clearly separated arms and legs, NO cape, NO robe, NO flared sleeves, NO face-covering hood, game character concept art, high detail

Configurações de parâmetro: proporção '2:3' para uma imagem vertical de corpo inteiro, Estilo 'raw', Stylize '250'.

Configurações de parâmetro com YouChuan MJ V8.1

A lição mais importante de todo o projeto: escolha um personagem fácil de articular.

Minha primeira versão do protagonista era uma sacerdotisa encapuzada, com mangas largas, mantos longos, um capuz cobrindo o rosto e cabelo solto sobre os ombros. A arte ficou linda, mas a articulação colapsou completamente. O manto fundiu as pernas em uma saia em forma de cone, então a articulação automática não conseguiu identificar onde estavam as pernas. As mangas largas tornaram-se grandes pedaços flutuantes de tecido que os ossos do esqueleto não conseguiam controlar corretamente, causando clipping severo assim que o personagem se movia. O capuz e o rosto também faziam parte da mesma malha, então o rosto se distorcia quando os pesos eram puxados.

O problema subjacente é que tecido solto e suspenso é o que a simulação de tecido deve lidar. Forçá-lo em um esqueleto rígido tem limites claros, especialmente para iniciantes.

É por isso que é melhor escolher um personagem com membros claramente separados e roupas justas. O uso repetido do prompt de fitted (justo), NO flared sleeves (sem mangas largas), clearly separated arms and legs (braços e pernas claramente separados) e NO hood (sem capuz) não foi acidental. Cada frase estava lá para bloquear um modo de falha específico. Escolher o personagem certo pode poupar metade do trabalho mais tarde na articulação.

Etapa 6 | Nano Banana 2: Preservar a consistência e redesenhar o personagem em uma pose T frontal

A imagem do MJ era linda, mas ainda era uma ilustração, com uma pose e um ponto de vista irregulares. Ela não poderia ser usada diretamente para modelagem. A entrada preferida para modelagem 3D e articulação é uma referência de pose T frontal: braços estendidos horizontalmente, membros separados e simetria clara. Isso dá à IA a melhor chance de elevá-la com precisão para as três dimensões.

Esta etapa foi para o Nano Banana 2. Ele redesenhou a imagem conceitual do MJ em uma pose T frontal limpa, preservando a identidade do personagem. Também removi a lanterna de sua mão, já que a lanterna seria modelada separadamente, e encurtei e achatei a aba de pano na cintura para que ela não se transformasse em outro problema de simulação de tecido.

Prompt de processamento de pose T (NB2 'edit', usando a imagem selecionada do personagem MJ como entrada):

plaintext
1Redraw this exact character in a clean front-facing T-pose for 3D modeling: both arms extended straight out horizontally to the sides with a clear visible gap between the arms and the torso, hands open and empty, legs straight and clearly apart (not touching), standing upright, symmetric, facing forward. Keep the identical character identity — blue tousled short hair with a small ponytail, same face, sleeveless vest with glowing teal-rune trim, fitted long-sleeve underlayer, fingerless gloves, fitted trousers, chunky boots, cool teal-and-violet palette with warm accents. Remove the lantern and any held prop. Replace the bulky side hip pouch with a slim flat tactical belt. Shorten the hanging front cloth flap so it ends above mid-thigh, never between the legs. Even neutral lighting, plain pure white background, no shadows, full body head to toe, clearly separated arms and legs, everything fitted close to the body, NO cape, NO robe, NO flared sleeves, NO hood, clean game-character reference.

Processamento de pose T

A razão para escolher o Nano Banana 2 aqui foi prática. Ele é forte na preservação da consistência do personagem, para que o rosto e as roupas não mudem ao alterar a pose ou o ponto de vista. Ele também é rápido e barato, o que torna a iteração repetida indolor.

Esta etapa é essencialmente o tradutor de todo o pipeline. Ela transforma uma imagem que parece boa para humanos em uma imagem que um modelo 3D pode ler.

Por que pose T em vez de pose A? Com os braços mantidos horizontalmente, há menos oclusão entre as axilas e o torso. A geração de imagem-para-3D produz geometria mais limpa, e os articuladores automáticos reconhecem a estrutura de forma mais confiável.

Mais um ponto: antes de alimentar a imagem em um modelo de imagem-para-3D, limpe-a completamente. Use um fundo branco simples, centralize o personagem, mantenha o corpo inteiro no enquadramento sem cortes, simplifique o fundo e certifique-se de que haja apenas um sujeito na imagem. O modelo Seed 3D da Etapa 7 depende dessa imagem para reconstruir o personagem. Quanto mais limpo e proeminente for o sujeito da entrada, mais precisa será a geometria gerada. Frases como plain pure white background, full body head to toe e clearly separated arms and legs estavam lá por um motivo.

Etapa 7 | Seed 3D: De uma vista frontal para um personagem totalmente texturizado

Este foi o evento principal. Para o personagem, usei o Seed 3D no Atlas Cloud, um modelo da ByteDance. Alimentei-o com a vista frontal da pose T da etapa anterior, e ele gerou um modelo de personagem completo com texturas PBR. Geometria e material vieram juntos em uma única passada. A mesma chave de API carregou o fluxo de trabalho perfeitamente desde a geração de imagem até a geração 3D.

Por que usar o Seed para o personagem, mas o Hunyuan para o ambiente? Executei ambos os modelos nos mesmos materiais. A conclusão foi que eles devem ser atribuídos por caso de uso:

Personagem Totalmente Texturizado

Caso de uso	Modelo	Motivo
Personagem	Seed 3D	Separa melhor o cabelo e a oclusão facial, e a geometria e textura das luvas e dedos são melhores, tornando o resultado mais adequado para articulação. A desvantagem é que a textura parece ligeiramente áspera à distância.
Ambiente	Hunyuan 3D	Produz texturas mais completas e sólidas para padrões de rocha e detalhes de superfície semelhantes, como visto na Etapa 3.

Por que o trabalho com personagens prioriza a geometria em vez da textura: Um personagem precisa ser articulado e animado posteriormente. A geometria e a topologia, como se o cabelo e o rosto estão devidamente separados e se os dedos estão limpos, determinam se o personagem pode ser articulado de forma organizada. Esses são defeitos graves se derem errado. Textura áspera é um problema mais leve. A iluminação na engine pode diminuir a lacuna, e as texturas ainda podem ser re-assadas posteriormente. Para o personagem, a vantagem geométrica do Seed importou mais.

Na prática, o Seed 3D teve um bom desempenho. A partir de apenas uma imagem frontal, ele inferiu razoavelmente a parte de trás da cabeça, o corpo e as solas dos pés no mesmo estilo. Ele também incluiu materiais PBR, e o cabelo e os dedos saíram limpos. Esse último ponto é precisamente o motivo pelo qual funcionou bem para um personagem articulado.

Configurações do painel Seed: O Subdivision Level tem três níveis. low é 100.000 polígonos, medium é 500.000 e high é um milhão. Seguindo a regra de contagem de polígonos, mantive abaixo de 100.000 e usei low para o personagem. Para 'File Format', escolhi GLB, que inclui texturas PBR e é reconhecido nativamente tanto pelo Blender quanto pelo Godot. O download vem como um .zip.

Etapa 8 | Nano Banana 2 + Hunyuan 3D: Construir o acessório da lanterna separadamente

Não soldei a lanterna no modelo do personagem. Em vez disso, fiz dela um ativo de acessório separado. Isso mantém a articulação e a animação limpas; dentro da engine, a lanterna pode simplesmente ser anexada à mão do personagem.

Primeiro, usei o Nano Banana 2 para gerar uma imagem limpa e independente da lanterna a partir de uma vista 3/4. Certifiquei-me de não "assar" (bake) o brilho na textura, deixando a intensidade para ser manipulada dentro da engine.

Prompt do acessório da lanterna (NB2 'text-to-image'):

plaintext
1A single rugged adventurer's handheld lantern as a standalone 3D game asset, compact portable explorer design, weathered dark gunmetal-and-brass frame with glowing teal-rune engravings, a warm-amber glowing crystal core behind simple flat glass panels, ONE single sturdy fixed carry ring on top only — no side handle, no swinging bail, a few practical leather straps and rivets, bioluminescent dark fantasy style matching a teal-and-violet explorer with warm amber accents, centered on a pure white background, even neutral studio lighting, full object visible, 3/4 orthographic view, true material colors, no strong glow baked in, no shadows, clean reference.

Então, alimentei-o no Hunyuan 3D Pro, com face_count definido para 40.000, enable_pbr ativado e GLB como formato. A estrutura de metal e as texturas decorativas de runas foram preservadas.

Por que Hunyuan para o acessório em vez de Seed: O Hunyuan Pro permite reduzir a 'face_count' para 40.000. O mínimo do Seed é 100.000. Para um acessório pequeno, 40.000 polígonos é mais leve na engine.

hunyuan para acessório

Etapa 9 | Mixamo: Articulação gratuita e animações de caminhar, correr e pular

Nesse ponto, o modelo ainda era uma estátua. Para fazê-lo se mover, ele precisava de um esqueleto e animações. Usei a versão web do Mixamo, ferramenta gratuita da Adobe. Você pode entrar com um Adobe ID e usá-la sem escrever código.

A articulação e a animação acontecem dentro do Mixamo, usando o esqueleto nativo do Mixamo, portanto não há retargeting, nem plug-in e nem necessidade de lutar com fluxos de trabalho complexos no Blender. Esse é o principal motivo para escolher o Mixamo. Um iniciante pode enviar o modelo, clicar algumas vezes e baixar um personagem que já consegue caminhar e pular.

Articulação: Envie o modelo do personagem e coloque alguns marcadores no queixo, pulsos, cotovelos, joelhos e virilha. O Mixamo então gera um esqueleto humanoide padrão automaticamente. Como essa ranger tinha roupas justas e pernas separadas, o Mixamo reconheceu os membros na primeira tentativa e articulou o personagem de forma limpa.
Animação: Pesquise Walking (caminhar), Running (correr) e Jumping (pular) na biblioteca de animações do Mixamo, aplique-as ao personagem e visualize os resultados diretamente.
Download: Para cada animação, escolha FBX Binary, selecione With Skin para que o modelo seja incluído e marque In Place, para que o movimento permaneça no lugar enquanto o deslocamento é tratado pelo código da engine. Caso contrário, o deslocamento embutido da animação pode arrastar o personagem para longe.

Mixamo

Armadilha real nº 1: o envio de um FBX produziu o erro "unable to map your existing skeleton" (incapaz de mapear seu esqueleto existente). Na primeira vez, usei o Claude para operar o Blender e exportar um FBX. O Mixamo assumiu que o arquivo já continha um esqueleto e tentou mapear essa articulação existente, o que falhou. A solução do Claude foi exportar o modelo como OBJ. O OBJ não tem conceito de esqueleto, então o Mixamo foi forçado a executar sua articulação automática do zero. Isso evitou o problema completamente. Como a textura não é necessária para a articulação, o OBJ é bom o suficiente.

Armadilha real nº 2: o Mixamo baixa o modelo na escala 0.01. Quando importado para o Blender ou uma engine de jogo, o personagem fica minúsculo. O Claude detectou automaticamente que o modelo estava pequeno demais e redefiniu a escala do objeto para 1.0, aproximadamente 1,5 metro de altura humana.

Uma verdade dos bastidores: o Mixamo lidou com a articulação e animação automáticas, mas o trabalho de limpeza dentro do Blender foi basicamente feito pelo Claude.

Mais especificamente, o Claude estava conectado ao Blender por meio do MCP. Você pode pensar no MCP como uma ponte que permite que um modelo de linguagem grande opere diretamente o software em seu computador. Ele lidou com uma sequência de etapas fragmentadas e propensas a erros para mim: importar automaticamente os arquivos FBX baixados do Mixamo, restaurar a escala de 0.01 para um tamanho normal, alinhar malha e esqueleto, reconectar as texturas que o Mixamo havia removido para os materiais PBR originais do Seed e, finalmente, exportar um GLB que a engine do jogo pudesse usar diretamente. Eu só precisei inspecionar os resultados e dizer a ele o que fazer a seguir.

Etapa 10 | Godot 4: Monte tudo na engine e faça-a correr

A etapa final foi o Godot 4, que é gratuito, de código aberto, tem cerca de 100 MB para instalar, não requer registro e suporta GLB nativamente. É aqui que a atmosfera se uniu. A engine em si não é o foco; se você estiver familiarizado com Unity, também funcionaria. Escolhi o Godot porque é leve e rápido de aprender. Seus arquivos de projeto também são texto simples, o que significava que o Claude poderia escrever, modificar e executar todo o projeto Godot diretamente, em vez de exigir que eu arrastasse controles manualmente.

O Claude trouxe automaticamente os três ativos GLB para o projeto: o personagem, o ambiente e a lanterna. Então ele configurou o seguinte:

Controlador de personagem: usando CharacterBody3D e algumas dezenas de linhas de GDScript, criou o movimento WASD, Shift para correr, barra de espaço para pular, rotação de câmera controlada pelo mouse e uma câmera de acompanhamento em terceira pessoa que permanece atrás do personagem.
Máquina de estado de animação: parado ao ficar em pé, caminhar ou correr ao se mover, pular quando no ar. Isso foi apenas algumas condições if alternando entre as três animações do Mixamo.
Skybox: WorldEnvironment conectado ao PanoramaSkyMaterial, com o panorama 360° da Etapa 4 inserido. O céu estrelado então envolveu o mundo inteiro.
Névoa volumétrica e brilho: o Godot 4 possui névoa volumétrica real integrada. Combinado com o brilho emissivo das flores em forma de sino e bloom, produziu rapidamente a atmosfera de um cânion mágico.
Iluminação da lanterna: a lanterna foi parentada ao osso da mão do personagem, com uma luz pontual OmniLight3D amarelo quente colocada dentro dela. Onde quer que ela ande, a luz quente a segue. A maneira como ilumina o solo dá à cena uma forte sensação de exploração.

Godot4

O próprio projeto Godot também foi escrito pelo Claude. A configuração do projeto, as cenas e o script do controlador de personagem eram todos texto simples. Descrevi a interação e a atmosfera de câmera que eu queria, e o Claude escreveu diretamente dentro do projeto, modificou-o e executou verificações através de várias rodadas até que parecesse certo.

Da geração de imagem e geração 3D à montagem no Blender e configuração da cena no Godot, o Claude fez o trabalho do programador durante todo o tempo. Eu só precisei descrever o que queria. Quando digo que não escrevi uma linha de código de baixo nível, não quero dizer que não houve código. Quero dizer que o Claude carregou o fardo técnico para mim.

Por que usei o Atlas Cloud para todo o fluxo de trabalho

A parte mais difícil deste fluxo de trabalho não é necessariamente aprender qualquer ferramenta individual. A verdadeira dor é saltar entre uma dúzia de plataformas, cada uma com seu próprio registro, faturamento e integração de API. O Atlas Cloud simplificou isso:

Uma chave de API para todo o fluxo de trabalho. Esta foi a parte mais importante. GPT Image 2 para ambientes e skyboxes, MJ para o personagem, Nano Banana 2 para conversão de visualização, Seed 3D e Hunyuan 3D para modelagem: tudo rodou na mesma chave. Sem trocas, sem integração repetida. Foi isso que tornou realista para uma pessoa terminar o projeto.
Uma API para toda IA de Mídia. Uma interface pode chamar mais de 300 modelos, cobrindo geração de imagem, 3D, vídeo e modelos de linguagem grandes. Para alternar modelos, você muda o nome do modelo.
Uma categoria de modelo 3D recém-adicionada. A nova categoria de geração 3D inclui o Seed 3D da ByteDance e o Hunyuan 3D da Tencent. A geração de imagem-para-3D com texturas PBR em uma única etapa foi a peça-chave que tornou o fluxo de trabalho viável. Em meus testes, o Seed funcionou melhor para personagens e o Hunyuan para ambientes.
LLMs de fronteira sob a mesma chave. Não se esqueça do maestro nos bastidores. O Atlas Cloud também fornece acesso a APIs de LLMs de fronteira. LLMs, modelos de imagem e modelos 3D foram todos cobertos por uma chave, o que tornou possível um fluxo de trabalho de uma pessoa só.
Preços competitivos. A geração de imagem e geração 3D foram baratas o suficiente para permitir tentativas e erros repetidos.
Mais do que uma API: MCP, CLI e Skills. A interface é compatível com OpenAI e pode ser usada como uma integração "drop-in". Além disso, o Atlas Cloud também oferece seu próprio Servidor MCP, CLI de linha de comando e Skills. Uma vez que a própria IA pode chamar os modelos na plataforma, conectar a geração de imagem, a criação 3D e o restante do fluxo de trabalho em uma linha torna-se natural.

Em uma frase: o que antes exigia uma equipe e uma dúzia de contas agora pode ser feito por uma pessoa, com uma chave de API, começando com uma única frase e terminando com um mundo 3D que pode correr e pular.

Experimente agora

Abra o Atlas Cloud e vá para a nova categoria de modelos 3D. Comece gerando seu primeiro personagem. Não importa se você não sabe modelar ou programar. A IA pode lidar com a modelagem, a engine pode dar vida à atmosfera, e seu trabalho é imaginar o mundo.

Todos os modelos usados neste artigo, incluindo GPT Image 2, YouChuan MJ V8.1, Nano Banana 2, Seed 3D, Hunyuan 3D e Claude, estão disponíveis no mesmo pool de modelos.

Como usar ambos os modelos no Atlas Cloud?

O Atlas Cloud permite que você use modelos lado a lado — primeiro em um playground, depois via uma única API.

Método 1: Usar diretamente no playground do Atlas Cloud

Clique no link https://www.atlascloud.ai para usar no playground.

Método 2: Acessar via API

Etapa 1: Obtenha sua chave de API

Crie uma chave de API em seu console e copie-a para uso posterior.

atlas cloud: 1

atlas cloud: 2

Etapa 2: Verifique a documentação da API

Revise o endpoint, os parâmetros de solicitação e o método de autenticação em nossa documentação da API.

Etapa 3: Faça sua primeira solicitação

VOLTAR À LISTA

Crie um jogo 3D estilo Zelda do zero com apenas uma chave de API