Ejemplo: Generación de imagen a video

Ejemplo completo de creación de videos a partir de imágenes usando la API de Atlas Cloud

Descripción general

Este tutorial demuestra un flujo de trabajo completo de imagen a video: subir una imagen de origen, generar un video a partir de ella y obtener el resultado.

Requisitos previos

  • Una cuenta de Atlas Cloud con clave API
  • Un archivo de imagen de origen (JPEG, PNG o WebP)
  • Python 3.7+ con la biblioteca requests

Ejemplo completo en Python

import requests
import time
import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY", "your-api-key")
BASE_URL = "https://api.atlascloud.ai/api/v1"

def upload_image(file_path):
    """Subir una imagen local y obtener una URL temporal."""
    with open(file_path, "rb") as f:
        response = requests.post(
            f"{BASE_URL}/model/uploadMedia",
            headers={"Authorization": f"Bearer {API_KEY}"},
            files={"file": f}
        )
    response.raise_for_status()
    url = response.json().get("url")
    print(f"Uploaded: {url}")
    return url

def generate_video(image_url, prompt, model="kling-v2.0"):
    """Enviar una tarea de generación de video a partir de una imagen."""
    response = requests.post(
        f"{BASE_URL}/model/generateVideo",
        headers={
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        },
        json={
            "model": model,
            "prompt": prompt,
            "image_url": image_url
        }
    )
    response.raise_for_status()
    return response.json().get("predictionId")

def wait_for_result(prediction_id, interval=5, timeout=300):
    """Consultar el resultado de la generación con tiempo de espera."""
    elapsed = 0
    while elapsed < timeout:
        response = requests.get(
            f"{BASE_URL}/model/getResult?predictionId={prediction_id}",
            headers={"Authorization": f"Bearer {API_KEY}"}
        )
        result = response.json()
        status = result.get("status")

        if status == "completed":
            return result.get("output")
        elif status == "failed":
            raise Exception(f"Failed: {result.get('error')}")

        print(f"  Status: {status} ({elapsed}s)")
        time.sleep(interval)
        elapsed += interval

    raise TimeoutError("Generation timed out")

# Paso 1: Subir imagen de origen
print("Step 1: Uploading image...")
image_url = upload_image("my_photo.jpg")

# Paso 2: Generar video
prompt = "The person slowly turns their head and smiles, camera zooms in slightly"
print(f"Step 2: Generating video with prompt: {prompt}")
prediction_id = generate_video(image_url, prompt)
print(f"Task submitted: {prediction_id}")

# Paso 3: Esperar resultado
print("Step 3: Waiting for video...")
video_url = wait_for_result(prediction_id)
print(f"Video ready: {video_url}")

Ejemplo completo en Node.js

import fs from "fs";

const API_KEY = process.env.ATLASCLOUD_API_KEY || "your-api-key";
const BASE_URL = "https://api.atlascloud.ai/api/v1";

async function uploadImage(filePath) {
  const formData = new FormData();
  formData.append("file", new Blob([fs.readFileSync(filePath)]));

  const response = await fetch(`${BASE_URL}/model/uploadMedia`, {
    method: "POST",
    headers: { Authorization: `Bearer ${API_KEY}` },
    body: formData,
  });

  if (!response.ok) throw new Error(`Upload failed: ${response.status}`);
  const { url } = await response.json();
  console.log(`Uploaded: ${url}`);
  return url;
}

async function generateVideo(imageUrl, prompt, model = "kling-v2.0") {
  const response = await fetch(`${BASE_URL}/model/generateVideo`, {
    method: "POST",
    headers: {
      Authorization: `Bearer ${API_KEY}`,
      "Content-Type": "application/json",
    },
    body: JSON.stringify({ model, prompt, image_url: imageUrl }),
  });

  if (!response.ok) throw new Error(`Generate failed: ${response.status}`);
  return (await response.json()).predictionId;
}

async function waitForResult(predictionId, interval = 5000, timeout = 300000) {
  const start = Date.now();
  while (Date.now() - start < timeout) {
    const response = await fetch(
      `${BASE_URL}/model/getResult?predictionId=${predictionId}`,
      { headers: { Authorization: `Bearer ${API_KEY}` } }
    );
    const result = await response.json();

    if (result.status === "completed") return result.output;
    if (result.status === "failed") throw new Error(result.error);

    console.log(`  Status: ${result.status}`);
    await new Promise((r) => setTimeout(r, interval));
  }
  throw new Error("Timeout");
}

// Ejecutar el flujo de trabajo
console.log("Step 1: Uploading image...");
const imageUrl = await uploadImage("my_photo.jpg");

console.log("Step 2: Generating video...");
const predictionId = await generateVideo(
  imageUrl,
  "The person slowly turns and smiles, gentle camera movement"
);

console.log("Step 3: Waiting for result...");
const videoUrl = await waitForResult(predictionId);
console.log(`Video ready: ${videoUrl}`);

Consejos

  • Modelos de video: Diferentes modelos tienen diferentes fortalezas — Kling para calidad, Seedance para movimiento, Vidu para estilo cinematográfico
  • Prompt para movimiento: Describe el movimiento deseado, el movimiento de cámara y los cambios de escena
  • Calidad de imagen: Imágenes de origen de mayor calidad generalmente producen mejores resultados de video
  • Tiempo de generación: La generación de video típicamente tarda de 30 segundos a 3 minutos dependiendo del modelo y parámetros
  • Intervalo de consulta: Usa intervalos de 5 segundos para video (vs 2 segundos para imágenes) para reducir llamadas API innecesarias

Próximos pasos