
Wan 2.6 Image-to-Image API by Alibaba
Supports image editing and mixed text and image output to meet diverse generation and integration needs.
Entrée
Sortie
InactifVotre requête coûtera $0.021 par exécution. Avec $10, vous pouvez exécuter ce modèle environ 476 fois.
Vous pouvez continuer avec :
Exemple de code
import requests
import time
# Step 1: Start image generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "alibaba/wan-2.6/image-edit",
"prompt": "A beautiful landscape with mountains and lake",
"width": 512,
"height": 512,
"steps": 20,
"guidance_scale": 7.5,
}
generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]
# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
def check_status():
while True:
response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
result = response.json()
if result["data"]["status"] == "completed":
print("Generated image:", result["data"]["outputs"][0])
return result["data"]["outputs"][0]
elif result["data"]["status"] == "failed":
raise Exception(result["data"]["error"] or "Generation failed")
else:
# Still processing, wait 2 seconds
time.sleep(2)
image_url = check_status()Installer
Installez le package requis pour votre langage.
pip install requestsAuthentification
Toutes les requêtes API nécessitent une authentification via une clé API. Vous pouvez obtenir votre clé API depuis le tableau de bord Atlas Cloud.
export ATLASCLOUD_API_KEY="your-api-key-here"En-têtes HTTP
import os
API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {API_KEY}"
}N'exposez jamais votre clé API dans du code côté client ou dans des dépôts publics. Utilisez plutôt des variables d'environnement ou un proxy backend.
Soumettre une requête
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "your-model",
"prompt": "A beautiful landscape"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())Soumettre une requête
Soumettez une requête de génération asynchrone. L'API renvoie un identifiant de prédiction que vous pouvez utiliser pour vérifier le statut et récupérer le résultat.
/api/v1/model/generateImageCorps de la requête
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "alibaba/wan-2.6/image-edit",
"input": {
"prompt": "A beautiful landscape with mountains and lake"
}
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}")Réponse
{
"id": "pred_abc123",
"status": "processing",
"model": "model-name",
"created_at": "2025-01-01T00:00:00Z"
}Vérifier le statut
Interrogez le point de terminaison de prédiction pour vérifier le statut actuel de votre requête.
/api/v1/model/prediction/{prediction_id}Exemple d'interrogation
import requests
import time
prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
while True:
response = requests.get(url, headers=headers)
result = response.json()
status = result["data"]["status"]
print(f"Status: {status}")
if status in ["completed", "succeeded"]:
output_url = result["data"]["outputs"][0]
print(f"Output URL: {output_url}")
break
elif status == "failed":
print(f"Error: {result['data'].get('error', 'Unknown')}")
break
time.sleep(3)Valeurs de statut
processingLa requête est encore en cours de traitement.completedLa génération est terminée. Les résultats sont disponibles.succeededLa génération a réussi. Les résultats sont disponibles.failedLa génération a échoué. Vérifiez le champ d'erreur.Réponse terminée
{
"data": {
"id": "pred_abc123",
"status": "completed",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.png"
],
"metrics": {
"predict_time": 8.3
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}
}Télécharger des fichiers
Téléchargez des fichiers vers le stockage Atlas Cloud et obtenez une URL utilisable dans vos requêtes API. Utilisez multipart/form-data pour le téléchargement.
/api/v1/model/uploadMediaExemple de téléchargement
import requests
url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
with open("image.png", "rb") as f:
files = {"file": ("image.png", f, "image/png")}
response = requests.post(url, headers=headers, files=files)
result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}")Réponse
{
"data": {
"download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
"file_name": "image.png",
"content_type": "image/png",
"size": 1024000
}
}Schema d'entrée
Les paramètres suivants sont acceptés dans le corps de la requête.
Aucun paramètre disponible.
Exemple de corps de requête
{
"model": "alibaba/wan-2.6/image-edit"
}Schema de sortie
L'API renvoie une réponse de prédiction avec les URL des résultats générés.
Exemple de réponse
{
"id": "pred_abc123",
"status": "completed",
"model": "model-name",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.png"
],
"metrics": {
"predict_time": 8.3
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}Atlas Cloud Skills
Atlas Cloud Skills intègre plus de 300 modèles d'IA directement dans votre assistant de codage IA. Une seule commande pour installer, puis utilisez le langage naturel pour générer des images, des vidéos et discuter avec des LLM.
Clients pris en charge
Installer
npx skills add AtlasCloudAI/atlas-cloud-skillsConfigurer la clé API
Obtenez votre clé API depuis le tableau de bord Atlas Cloud et définissez-la comme variable d'environnement.
export ATLASCLOUD_API_KEY="your-api-key-here"Fonctionnalités
Une fois installé, vous pouvez utiliser le langage naturel dans votre assistant IA pour accéder à tous les modèles Atlas Cloud.
Serveur MCP
Le serveur MCP Atlas Cloud connecte votre IDE avec plus de 300 modèles d'IA via le Model Context Protocol. Compatible avec tout client compatible MCP.
Clients pris en charge
Installer
npx -y atlascloud-mcpConfiguration
Ajoutez la configuration suivante au fichier de paramètres MCP de votre IDE.
{
"mcpServers": {
"atlascloud": {
"command": "npx",
"args": [
"-y",
"atlascloud-mcp"
],
"env": {
"ATLASCLOUD_API_KEY": "your-api-key-here"
}
}
}
}Outils disponibles
Schéma API
Schéma non disponibleVeuillez vous connecter pour voir l'historique des requêtes
Vous devez vous connecter pour accéder à l'historique de vos requêtes de modèle.
Se ConnecterWan 2.6Création Vidéo IA Multi-Plans Professionnelle
La dernière avancée d'Alibaba en génération vidéo par IA. Créez des vidéos 1080p jusqu'à 15 secondes avec narration multi-plans, cohérence des personnages guidée par référence et synchronisation audiovisuelle native. Le premier modèle à véritablement comprendre la logique du storyboard pour des récits cinématographiques.
Percées Révolutionnaires
Ce qui fait de Wan 2.6 le changeur de jeu dans la génération vidéo par IA
Narration Multi-Plans
Premier modèle à comprendre la logique du storyboard. Génère automatiquement des plans séquentiels avec des transitions cohérentes, maintenant l'apparence du personnage et la cohérence de l'environnement à travers les changements de scène—permettant des arcs narratifs complets en une seule génération de 15 secondes.
Référence vers Vidéo (R2V)
Téléchargez une vidéo de référence de 2-30 secondes pour extraire et préserver l'apparence du personnage, les motifs de mouvement et les caractéristiques vocales. Créez des performances de personnages cohérentes sur plusieurs vidéos avec une précision sans précédent.
Rendu de Texte Précis
Capacités de rendu de texte leaders de l'industrie pour l'emballage de produits, la signalisation et le contenu de marque. Génère un texte clair et lisible dans les images vidéo—essentiel pour les applications marketing et commerciales.
Capacités Principales
Durée Étendue de 15 Secondes
Générez jusqu'à 15 secondes par vidéo avec structure complète en "Trois Actes" (Exposition → Action → Résolution)
Qualité Professionnelle 1080p
Sortie native 1080p à 24fps avec qualité cinématographique et stabilité visuelle améliorée
Synchronisation Audio Native
Le dialogue correspond aux mouvements des lèvres, la musique de fond s'aligne sur le rythme, les effets sonores se déclenchent parfaitement
Cohérence des Personnages
Maintenez l'apparence, les costumes et l'identité des personnages à travers les plans et plusieurs vidéos
Contrôle Caméra Cinématographique
Mouvements de caméra professionnels incluant panoramiques, zooms, plans de suivi et mouvements de dolly
Formats d'Image Flexibles
16:9 (YouTube), 9:16 (Reels), 1:1 (Carré) - optimisé pour les plateformes sans recadrage en post-production
Wan 2.6 vs Wan 2.5 : Améliorations Majeures
Découvrez les nouveautés de la dernière version
Trois Modes de Génération Spécialisés
Choisissez le mode adapté à votre flux de travail créatif
Texte vers Vidéo (T2V)
Le Plus PopulaireGénérez des vidéos complètes à partir de prompts texte avec segmentation multi-plans améliorée et traitement de prompts perfectionné. Parfait pour la narration et l'exploration créative.
- Segmentation automatique des plans à partir d'un seul prompt
- Compréhension de l'interaction multi-personnages
- Mouvement de caméra et indices émotionnels
- Préservation des détails environnementaux
Image vers Vidéo (I2V)
AmélioréTransformez des images fixes en vidéos animées avec cohérence de mouvement améliorée. Idéal pour les vitrines de produits, l'animation de photos et la narration visuelle.
- Rendu de texte précis pour les produits
- Cohérence de style entre les images
- Mouvement naturel à partir d'images fixes
- Optimisation visuelle guidée par le récit
Référence vers Vidéo (R2V)
NOUVEAUTéléchargez une vidéo de référence (2-30s) pour préserver l'apparence du personnage, les motifs de mouvement et la voix. La garantie de cohérence la plus forte pour le contenu axé sur les personnages.
- Préservation complète de l'identité du personnage
- Extraction des caractéristiques vocales
- Réplication des motifs de mouvement
- Scènes de co-action multi-personnages
Parfait Pour
Marketing et Publicité
Démos de produits avec rendu de texte, campagnes de marque avec cohérence des personnages et vidéos promotionnelles
Création de Contenu
Vidéos YouTube, reels de réseaux sociaux, narration multi-plans et flux de travail de montage vidéo
E-commerce
Vitrines de produits avec texte précis, vidéos tutoriels et recréation de témoignages clients
Éducation et Formation
Contenu pédagogique, matériel de cours et récits éducatifs multi-scènes
Divertissement
Courts métrages, histoires axées sur les personnages, séquences cinématographiques et expériences créatives
Pré-visualisation
Développement de concepts cinématographiques, création de storyboards et planification de scènes pour les productions
Intégration API Wan 2.6 T2V, I2V et R2V
Suite API complète pour la génération Texte vers Vidéo, Image vers Vidéo et Référence vers Vidéo
API Texte vers Vidéo (T2V API)
Notre API Wan 2.6 T2V transforme les prompts texte en vidéos cinématographiques multi-plans avec segmentation automatique de scènes. Générez des vidéos professionnelles 1080p jusqu'à 15 secondes avec synchronisation audio native.
API Image vers Vidéo (I2V API)
Notre API Wan 2.6 I2V donne vie aux images fixes avec contrôle de mouvement précis et rendu de texte. Parfait pour les vidéos de produits, l'animation de photos et la création de contenu de marque.
API Référence vers Vidéo (R2V API)
Notre API Wan 2.6 R2V préserve l'identité du personnage à partir de vidéos de référence. Téléchargez des clips de 2-30 secondes pour extraire l'apparence, la voix et les motifs de mouvement pour une génération de personnages cohérente.
Suite API Complète
Les trois modes API Wan 2.6 (T2V API, I2V API, R2V API) supportent l'architecture RESTful avec documentation complète. Démarrez avec des SDK pour Python, Node.js et plus. Chaque endpoint inclut la synchronisation audiovisuelle native et les droits d'utilisation commerciale complets.
Comment Démarrer avec Wan 2.6
Commencez à créer des vidéos professionnelles en quelques minutes avec deux chemins simples
Intégration API
Pour les développeurs qui construisent des applications
Inscrivez-vous et Connectez-vous
Créez votre compte Atlas Cloud ou connectez-vous pour accéder à la console
Ajoutez un Moyen de Paiement
Liez votre carte de crédit dans la section Facturation pour approvisionner votre compte
Générez une Clé API
Accédez à Console → Clés API et créez votre clé d'authentification
Commencez à Construire
Utilisez les endpoints API T2V, I2V ou R2V pour intégrer Wan 2.6 dans votre application
Expérience Playground
Pour les tests rapides et l'expérimentation
Inscrivez-vous et Connectez-vous
Créez votre compte Atlas Cloud ou connectez-vous pour accéder à la plateforme
Ajoutez un Moyen de Paiement
Liez votre carte de crédit dans la section Facturation pour commencer
Utilisez le Playground
Allez dans le playground Wan 2.6, choisissez le mode T2V/I2V/R2V et générez des vidéos instantanément
Questions Fréquentes
Qu'est-ce qui rend la capacité multi-plans de Wan 2.6 unique ?
Wan 2.6 est le premier modèle à vraiment comprendre la logique du storyboard. Contrairement à Wan 2.5 qui créait des effets de "morphing" désordonnés, Wan 2.6 peut automatiquement segmenter un seul prompt en plusieurs plans distincts avec des transitions cohérentes, maintenant la cohérence des personnages à travers les changements de scène.
Comment fonctionne Référence vers Vidéo (R2V) ?
Téléchargez une vidéo de référence de 2-30 secondes, et Wan 2.6 extrait l'apparence du personnage, les motifs de mouvement et les caractéristiques vocales. Vous pouvez ensuite générer de nouvelles vidéos mettant en vedette le même personnage avec une identité cohérente—idéal pour créer des séries de contenu axées sur les personnages.
Quels formats et durées vidéo sont supportés ?
Wan 2.6 génère des vidéos 1080p à 24fps avec des durées de 5 à 15 secondes. Les formats d'image supportés incluent 16:9 (YouTube), 9:16 (Instagram Reels/TikTok) et 1:1 (format carré), optimisés pour chaque plateforme sans nécessiter de recadrage en post-production.
Wan 2.6 peut-il rendre du texte dans les vidéos ?
Oui ! Wan 2.6 dispose d'un rendu de texte leader de l'industrie pour l'emballage de produits, la signalisation et le contenu de marque. Le modèle peut générer du texte clair et lisible dans les images vidéo—une caractéristique critique que Seedance et la plupart des concurrents n'ont pas.
Quelle est la différence entre les modes T2V, I2V et R2V ?
T2V (Texte vers Vidéo) génère à partir de prompts texte avec capacité multi-plans. I2V (Image vers Vidéo) anime des images fixes avec rendu de texte précis. R2V (Référence vers Vidéo) utilise des références vidéo pour préserver l'identité du personnage entre les générations. Choisissez selon votre type d'entrée et vos besoins de cohérence.
Ai-je des droits commerciaux sur les vidéos générées ?
Oui ! Chaque création Wan 2.6 vient avec des droits d'utilisation commerciale complets. Les vidéos sont prêtes pour la production pour les campagnes marketing, les livrables clients, le contenu de marque et les applications commerciales sans exigences de licence supplémentaires.
Pourquoi Utiliser Wan 2.6 sur Atlas Cloud ?
Tirez parti d'une infrastructure de niveau entreprise pour vos flux de travail professionnels de génération vidéo
Infrastructure Conçue sur Mesure
Déployez la génération multi-plans et les capacités R2V de Wan 2.6 sur une infrastructure spécifiquement optimisée pour les charges de travail vidéo IA exigeantes. Performance maximale pour la génération 1080p de 15 secondes.
API Unifiée pour Tous les Modèles
Accédez à Wan 2.6 (T2V, I2V, R2V) aux côtés de plus de 300 modèles IA (LLM, image, vidéo, audio) via une API unifiée. Intégration unique pour tous vos besoins en IA générative avec authentification cohérente.
Prix Compétitifs
Économisez jusqu'à 70% par rapport à AWS avec des prix transparents à l'usage. Pas de frais cachés, pas d'engagements—évoluez du prototype à la production sans vous ruiner.
Sécurité Certifiée SOC I & II
Vos vidéos de référence et contenu généré protégés avec certifications SOC I & II et conformité HIPAA. Sécurité de niveau entreprise avec transmission et stockage chiffrés.
SLA de 99,9% de Disponibilité
Fiabilité de niveau entreprise avec garantie de 99,9% de disponibilité. Votre génération vidéo multi-plans Wan 2.6 est toujours disponible pour les campagnes de production et les flux de travail de contenu critiques.
Intégration Facile
Intégration complète en quelques minutes avec API REST et SDK multi-langages (Python, Node.js, Go). Basculez entre les modes T2V, I2V et R2V de manière transparente avec structure d'endpoint unifiée.
Spécifications Techniques
Expérimentez la Génération Vidéo Multi-Plans Professionnelle
Rejoignez les créateurs de contenu, marketeurs et cinéastes du monde entier qui révolutionnent la production vidéo avec les capacités révolutionnaires de narration multi-plans et de cohérence des personnages de Wan 2.6.
Alibaba WAN 2.6 Image Edit
Alibaba WAN 2.6 Image Edit enables you to upload an existing visual and specify the desired adjustments. The model preserves layout and subject structure while implementing high-quality updates based on natural language.
Why creators love it
- Structure-preserving edits: Make lighting, color, or object changes without breaking composition.
- Text-guided styling: Reimagine materials, moods, or art styles with concise prompts.
- Prompt expansion on demand: Enable automatic prompt enrichment when you need extra detail.
- Flexible output sizes: Pick the resolution that best matches your downstream workflow.
Perfect for
- Marketing and design teams refining campaign visuals.
- E-commerce sellers upgrading product imagery.
- Content creators polishing thumbnails, covers, and posts.
- Artists experimenting with variations of their original work.
Billing rules
- Minimum charge: 1 image.
- Total cost = number of images × price per resolution.
How to use
- Provide the image you want to refine. (Image dimensions must be in (384, 5000))
- Describe the desired adjustments in the prompt.
- Choose the target resolution and submit.
- Review the enhanced output and download the version you like best.
Pro tips
- Start with clear instructions about colors, lighting, or objects to adjust.
- Pair positive and negative prompts to control what should or should not appear.
- Keep source images at or above your target resolution for optimal fidelity.
Note
If you did not upload the image locally, please ensure that the image URL is accessible! A successfully accessible image will display a preview in the interface.
Recommended Resolutions
| Aspect Ratio | Exact (W×H) | Exact Pixels | Rounded (W×H, ÷64) | Rounded Pixels |
|---|---|---|---|---|
| 1:1 | 1448 × 1448 | 2,096,704 | 1408 × 1408 | 1,982,464 |
| 3:2 | 1773 × 1182 | 2,095,686 | 1728 × 1152 | 1,990,656 |
| 4:3 | 1672 × 1254 | 2,096,688 | 1664 × 1216 | 2,023,424 |
| 16:9 | 1936 × 1089 | 2,108,304 | 1920 × 1088 | 2,088,960 |
| 21:9 | 2212 × 948 | 2,096,976 | 2176 × 960 | 2,088,960 |
| 1:1 | 1024 × 1024 | 1,048,576 | 1024 × 1024 | 1,048,576 |
| 3:2 | 1254 × 836 | 1,048,344 | 1216 × 832 | 1,011,712 |
| 4:3 | 1182 × 887 | 1,048,434 | 1152 × 896 | 1,032,192 |
| 16:9 | 1365 × 768 | 1,048,320 | 1344 × 768 | 1,032,192 |
| 21:9 | 1564 × 670 | 1,047,880 | 1536 × 640 | 983,040 |
| 1:1 | 323 × 323 | 104,329 | 320 × 320 | 102,400 |
| 3:2 | 397 × 264 | 104,808 | 384 × 256 | 98,304 |
| 4:3 | 374 × 280 | 104,720 | 448 × 320 | 143,360 |
| 16:9 | 432 × 243 | 104,976 | 448 × 256 | 114,688 |
| 21:9 | 495 × 212 | 104,940 | 576 × 256 | 147,456 |






