Cómo construir un juego 3D al estilo Zelda con una sola API de IA

A partir de una sola frase que describe un entorno, terminé con un personaje 3D con rigging capaz de caminar y saltar dentro de un motor de juego, recorriendo un cañón bioluminiscente con el espíritu visual de Zelda. Nunca abrí un programa de modelado ni escribí una línea de código de renderizado de bajo nivel.

Este artículo recorre todo el proceso, incluidos los errores que cometí en el camino. Cada capacidad de IA que utilicé provino de la misma plataforma, Atlas Cloud, y todo el flujo de trabajo se ejecutó con una sola clave API.

La versión corta: Lo que antes requería un equipo, ahora solo necesita una API

Antiguamente, crear un juego 3D jugable significaba superar varios obstáculos técnicos. Tenías que saber modelar en herramientas como ZBrush o Blender, preparar un personaje con un esqueleto (rigging), animarlo mediante fotogramas clave o captura de movimiento y luego escribir el código necesario para llevar esos activos a un motor de juego. Para la mayoría de los principiantes, cualquiera de esos pasos era suficiente para detener el proyecto antes de empezar.

Lo que quería probar era simple: ¿puede la IA conectar estos pasos de principio a fin, permitiendo que alguien sin experiencia en modelado o programación cree una demo de juego 3D que realmente funcione dentro de un motor?

La respuesta, tras intentarlo, es sí. Todo el flujo de trabajo de IA, desde la generación de imágenes y la conversión a 3D hasta el texturizado y la creación del skybox, se ejecutó a través de una sola clave API. El trabajo de ingeniería más técnico, incluida la integración en Blender y la configuración del proyecto en Godot, fue orquestado por Claude. Mi papel fue principalmente inspeccionar los resultados y describir lo que quería a continuación.

Una sola clave API gestionó todo el flujo de trabajo. GPT Image 2, YouChuan MJ V8.1, Nano Banana 2, Seed 3D, Hunyuan 3D y otros modelos se ejecutaron en Atlas Cloud utilizando la misma clave. No hubo necesidad de registrarse en múltiples plataformas, recargar cuentas por separado ni integrar diferentes APIs manualmente.

Una sola clave API gestionó todo el flujo de trabajo

Resumen del flujo de trabajo completo, en el orden que seguí

plaintext
1①  GPT Image 2       →  Arte conceptual del entorno, definiendo la estética: renderizado estilo Zelda en un cañón bioluminiscente oscuro
2②  Edición GPT Image 2  →  Transformar el entorno en un "diorama 3D" limpiándolo en una imagen base isométrica
3③  Hunyuan 3D        →  Prueba de esfuerzo convirtiendo todo el diorama a 3D en una sola pasada
4④  GPT Image 2       →  Generar un skybox de 360° con el mismo modelo, utilizado como fondo estrellado del juego
5⑤  YouChuan MJ V8.1  →  Diseñar el concepto del personaje guardabosques, definiendo la esencia del protagonista
6⑥  Nano Banana 2     →  Mantener la consistencia del personaje y rediseñar el concepto en una referencia T-pose frontal
7⑦  Seed 3D           →  Convertir la imagen del personaje a 3D, con geometría limpia en pelo y dedos, estructura apta para rig, PBR incorporado y modelo Seed de ByteDance
8⑧  Nano Banana 2 + Hunyuan 3D  →  Construir el accesorio de la linterna por separado
9⑨  Mixamo + Blender × Claude →  Rigging automático y animaciones de caminar/correr/saltar con Mixamo; Claude mediante MCP gestiona la importación, conexión de materiales, alineación y exportación GLB en Blender
10⑩  Godot 4           →  Integración total: controlador de personaje, cámara en tercera persona, skybox, niebla volumétrica y linterna brillante

Los pasos ① al ⑧ utilizaron capacidades de IA disponibles en Atlas Cloud, que se posiciona como "Una API para toda la IA de medios", una interfaz única para invocar más de 300 modelos. Esto incluye YouChuan MJ en el paso ⑤. Mixamo en el paso ⑨, Godot en el paso ⑩ y Blender para la configuración de materiales fueron herramientas de terceros gratuitas.

A continuación, el proceso práctico con los prompts reales que utilicé en cada paso.

Paso 1 | GPT Image 2: Primero, dibujar el mundo

El punto de partida no fue el personaje, sino la estética de todo el mundo. Utilicé GPT Image 2 en Atlas Cloud para generar una imagen conceptual del entorno y definir el tono: renderizado estilo Zelda, combinado con un cañón oscuro y bioluminiscente.

Prompt del entorno ('text-to-image'; establecí la relación de aspecto en '16:9' en los parámetros del playground):

plaintext
1bioluminescent fantasy canyon at night, stylized painterly game concept art, towering deep-indigo and magenta rock cliffs glowing with teal veins, tall bell-shaped glowing flora with crystal tips, ancient carved standing stones with angular constellation glyphs, winding ridge path, a small hooded ranger with a warm lantern beside a campfire for scale, misty atmospheric depth, starry night sky, cool teal-and-violet palette with warm amber accent, dreamy magical mood, soft cel-shaded painterly rendering, cinematic wide establishing shot, high detail

Esta imagen se convirtió en el ancla estética de todo el proyecto. La paleta de colores, la iluminación y la construcción del mundo se decidieron aquí. En esta etapa, la única pregunta era si la imagen se veía bien. Si podía modelarse, vendría después.

Por qué GPT Image 2 para el entorno: Para el flujo de "escena de entorno seguida de conversión a diorama", GPT Image 2 fue la opción más estable en mis pruebas. Sus composiciones eran claras y sus colores se mantuvieron consistentes. Al intentar otros modelos de imagen para la conversión a diorama, a menudo lavaban la imagen hacia un modelo de arcilla blanca, perdiendo información de color y material necesaria para el modelado posterior. Por ello, mantuve GPT Image 2 para el entorno.

GPT Image 2

Paso 2 | 'Edición' en GPT Image 2: Convertir el entorno en un diorama 3D

A continuación, la imagen conceptual tenía que transformarse en algo que un modelo 3D pudiera entender. Una pintura conceptual de gran angular no funciona bien como entrada directa de modelado. La iluminación es demasiado dramática y el fondo demasiado complejo. Así que primero usé la función edit de GPT Image 2 para limpiarla y convertirla en una imagen base de estilo diorama isométrico, preparando el material para la siguiente etapa.

Prompt de conversión a diorama (Edición de GPT Image 2, utilizando la imagen del entorno del Paso 1 como entrada):

plaintext
1Convert this scene into a clean 3D-renderable isometric diorama, keeping ALL original colors and textures fully intact — purple-magenta rock, teal glowing bell flowers, carved runestones, mossy ground. Plain simple background. Even soft neutral lighting so the true surface colors read clearly; remove only the heavy colored rim-light, fog and warm campfire glow. Do NOT desaturate, do NOT turn into grey clay. Preserve material and texture detail, single connected terrain chunk, 3/4 orthographic view, no text, no characters.

La trampa más común: no dejes que la imagen se convierta en un modelo de arcilla gris-blanca. Hunyuan lee la información de textura de la siguiente etapa directamente de los colores en la imagen de entrada. Si le proporcionas una imagen gris, solo puede devolver un modelo gris. Por eso el prompt especifica 'mantener TODOS los colores originales' y 'NO desaturar'. El objetivo es eliminar solo la luz de contorno fuerte, la niebla y el brillo cálido de la fogata, preservando el color base y el detalle del material.

Hunyuan

Paso 3 | Hunyuan 3D: Elevar todo el diorama a 3D en una sola pasada

Este paso fue una prueba de estrés deliberada. En lugar de dividir la escena en activos separados, introduje toda la imagen del diorama del paso anterior en Hunyuan 3D para ver si podía reconstruir toda la escena de una sola vez.

El resultado fue más utilizable de lo que esperaba. El diorama resultó con unos 100,000 polígonos. Su estructura general, formas rocosas y relaciones de terreno se conservaron bien, y venía con texturas PBR en lugar de una malla blanca básica. Esperaba algo más parecido a un relieve aplanado. Tras el preprocesamiento del diorama, el modelo de la escena completa fue mucho más útil de lo anticipado.

Nota sobre el principio detrás de esto: Esta parte utilizó la generación de imagen única de Hunyuan 3D, o imagen-a-3D. Cuando se le da una imagen de gran angular completa, confía en la inferencia estilística y de imagen para completar la estructura tridimensional faltante. Lo más impresionante es que, incluso con una sola imagen frontal, puede inferir razonablemente la parte trasera y la base ocultas con el mismo estilo. Para un diorama, es bastante capaz. Para entornos más refinados, el enfoque ortodoxo sigue siendo dividir la escena en activos separados y ensamblarlos en el motor.

Hunyuan imagen-a-3D

Por qué Hunyuan para el entorno y no Seed 3D: Ejecuté ambos modelos en la misma imagen de diorama. Para entornos, Hunyuan produjo texturas más completas y sólidas. Los patrones de roca y los detalles del suelo se vieron mejor. El intento de Seed con el entorno perdió una cantidad considerable de textura y se veía más tosco en general. Para los personajes, la conclusión fue la inversa, como se explica en el Paso 7.

Hunyuan en lugar de Seed 3D

Una regla rige todo el proyecto: mantener el conteo de polígonos por debajo de 100,000. En un juego, es más importante que un modelo funcione sin problemas que uno con detalles excesivos. Una vez que el conteo de caras es muy alto, el rigging se vuelve difícil, el motor se ralentiza y la iteración toma una eternidad. Para activos de juego jugables, de 50,000 a 100,000 caras suele ser suficiente.

Paso 4 | GPT Image 2: Generar un skybox de 360° con el mismo modelo

El cielo estrellado del juego no fue modelado. Era un skybox en el motor, una imagen panorámica que envuelve todo el mundo. Utilicé GPT Image 2 nuevamente, en dos pasos:

Primero, usé la imagen conceptual del entorno del Paso 1 como referencia y generé un cielo estrellado limpio, eliminando el terreno. El color y la atmósfera se mantuvieron consistentes con el ajuste original: índigo profundo, estrellas densas, aurora verde azulada, meteoros y nebulosas.
Luego usé edit para convertir esa imagen en un panorama equirectangular de 360° con una relación 2:1 y bordes laterales sin costuras, listo para ser integrado como skybox.

Prompt de cielo limpio (imagen-a-imagen, usando la imagen conceptual del Paso 1; relación de aspecto '2:1'):

plaintext
1A pure night sky only, no terrain and no horizon line, bioluminescent dark fantasy game sky: smooth deep indigo-to-royal-blue gradient, a dense field of bright white and pale-cyan stars, soft flowing teal-green aurora ribbons, a faint cyan-and-magenta nebula glow, one or two thin meteor streaks, dreamy magical atmosphere, soft cel-shaded painterly rendering, no ground, no mountains, no characters, sky fills the entire frame.

cielo limpio con GPT-image-2

Convertir a panorama de 360° ('edit', usando la imagen del cielo anterior; relación de aspecto '2:1'):

plaintext
1Convert this night sky into a full 360-degree equirectangular spherical panorama with a 2:1 aspect ratio, for use as a seamless game skybox. Wrap horizontally so the left and right edges line up with no visible seam. Keep the same teal-and-violet palette, bright stars and soft aurora. No ground, no characters, seamless tiling.

panorama 360 con GPT-image-2

Paso 5 | YouChuan MJ V8.1: Dibujar al protagonista guardabosques

Una vez establecido el entorno, llegó el turno del protagonista. Utilicé YouChuan MJ V8.1 en Atlas Cloud por su consistencia de estilo. Quería una guardabosques de pelo azul: coleta, chaleco de cuero ajustado con ribetes de runas cian brillantes, guantes sin dedos, pantalones ajustados y botas resistentes.

Prompt del personaje:

plaintext
1full body character design of a young female explorer-ranger, athletic slim build, short tousled hair or a low tied-back ponytail (no long loose hair over the shoulders), wearing a fitted sleeveless leather tunic with glowing teal-rune trim over a slim close-fitting long-sleeve underlayer, fitted trousers tucked into sturdy boots, fingerless gloves and forearm bracers, a small warm-amber lantern clipped at the hip, gentle determined expression, bioluminescent dark fantasy style, cool teal-and-violet palette with warm amber accent glow, soft cel-shaded painterly rendering, calm neutral standing pose with arms held clearly away from the torso, clean plain background, full body visible head to toe, clearly separated arms and legs, NO cape, NO robe, NO flared sleeves, NO face-covering hood, game character concept art, high detail

La lección más importante: elige un personaje apto para el rigging. Mi primera versión tenía capas anchas, capuchas y pelo largo. Aunque se veía hermoso, el rigging colapsó por completo porque la IA no pudo identificar la separación entre las piernas y los brazos. La ropa holgada y suspendida es un problema para un esqueleto rígido. Elegir un personaje con ropa ceñida y extremidades separadas ahorra la mitad del trabajo.

Paso 6 | Nano Banana 2: Redibujar al personaje en T-pose frontal

La imagen de MJ era hermosa, pero era una ilustración. Para modelar y hacer rigging, se necesita una pose en T: brazos extendidos horizontalmente, extremidades separadas y simetría clara. Usé Nano Banana 2 para redibujar la imagen en esta pose, asegurando consistencia y eliminando accesorios complejos que pudieran dar problemas.

Prompt de T-pose (Edición de NB2):

plaintext
1Redraw this exact character in a clean front-facing T-pose for 3D modeling: both arms extended straight out horizontally to the sides with a clear visible gap between the arms and the torso, hands open and empty, legs straight and clearly apart (not touching), standing upright, symmetric, facing forward. Keep the identical character identity — blue tousled short hair with a small ponytail, same face, sleeveless vest with glowing teal-rune trim, fitted long-sleeve underlayer, fingerless gloves, fitted trousers, chunky boots, cool teal-and-violet palette with warm accents. Remove the lantern and any held prop. Replace the bulky side hip pouch with a slim flat tactical belt. Shorten the hanging front cloth flap so it ends above mid-thigh, never between the legs. Even neutral lighting, plain pure white background, no shadows, full body head to toe, clearly separated arms and legs, everything fitted close to the body, NO cape, NO robe, NO flared sleeves, NO hood, clean game-character reference.

Paso 7 | Seed 3D: De vista frontal a personaje totalmente texturizado

Para el personaje, utilicé Seed 3D en Atlas Cloud. Introduje la vista en T y generó un modelo completo con texturas PBR. La geometría de los dedos y el cabello salió limpia, lo que facilitó enormemente el rigging.

Caso de uso	Modelo	Razón
Personaje	Seed 3D	Separa mejor el cabello y la cara, ideal para rigging.
Entorno	Hunyuan 3D	Produce texturas más sólidas para rocas y superficies.

Ajustes en Seed: En Subdivision Level, utilicé low (100,000 polígonos) para mantener el rendimiento. El formato GLB fue la elección para una compatibilidad nativa con Blender y Godot.

Paso 8 | Nano Banana 2 + Hunyuan 3D: Construir el accesorio de la linterna

No soldé la linterna al modelo, sino que la creé como un activo separado. Esto mantiene el rigging limpio; en el motor, la linterna simplemente se une al hueso de la mano. Usé Nano Banana 2 para el concepto y Hunyuan 3D Pro (con 40,000 polígonos) para la generación 3D.

Paso 9 | Mixamo: Rigging gratuito y animaciones

Utilicé la versión web de Mixamo de Adobe. Al subir el modelo (en formato OBJ para evitar conflictos de esqueletos previos), Mixamo reconoció automáticamente las extremidades y generó el rig. Busqué "Walking", "Running" y "Jumping", apliqué las animaciones y descargué los archivos con la opción In Place marcada para que el motor gestionara el desplazamiento.

Nota técnica: Claude, operando en Blender mediante MCP, fue quien realizó el trabajo pesado: escalar el modelo (que llega a escala 0.01 desde Mixamo), reconectar las texturas PBR originales y exportar el GLB final.

Paso 10 | Godot 4: Ensamblaje y ejecución

Godot 4 es ligero y soporta GLB nativamente. Claude se encargó de escribir el script del controlador de personaje (CharacterBody3D), configurar la máquina de estados de animación y añadir la niebla volumétrica y la iluminación de la linterna. El resultado final es una experiencia fluida donde la luz de la linterna reacciona al movimiento en el cañón bioluminiscente.

Por qué utilicé Atlas Cloud para todo el flujo

Una clave API para todo: Desde GPT Image 2 hasta Seed 3D, todo bajo el mismo paraguas.
Acceso a más de 300 modelos: La flexibilidad de cambiar entre modelos según el caso de uso es inigualable.
Categoría 3D especializada: Incluye lo mejor de ByteDance y Tencent, ideal para flujos de trabajo de IA generativa.
Claude + MCP: La capacidad de orquestar herramientas locales mediante lenguaje natural convierte tareas técnicas complejas en simples instrucciones de texto.

En resumen: lo que antes requería un equipo y una docena de cuentas, ahora lo puede hacer una sola persona con una API, desde una frase hasta un mundo 3D jugable.

Pruébalo ahora

Abre Atlas Cloud y dirígete a la nueva categoría de modelos 3D. Comienza generando tu primer personaje. No importa si no sabes modelar o programar; la IA se encarga de la estructura, y tú de la visión.

https://www.atlascloud.ai

VOLVER A LA LISTA