مهارة سير عمل الدراما المثالية: دمج GPT Image 2 و Seedance 2.0 عبر مفتاح API واحد

yxUS-H6oB1A

1. من أين بدأت الحكاية: تلاقي نموذجين

أبريل 2026.

أطلقت OpenAI نموذج GPT Image 2 — حيث وصلت قدرات تقديم النصوص، والمعرفة بالعالم، والجماليات إلى أقصى حدودها.

"من اليوم فصاعداً، دخلت الصور المولدة بالذكاء الاصطناعي، تماماً مثل النصوص المولدة به، عصراً لم يعد فيه الشخص العادي قادراً على التمييز بينها وبين الصور الحقيقية."

في الوقت نفسه، ظهر منشوران يحظيان بتفاعل كبير على منصة X:

@AI_Jasonyu:

دمج GPT-Image 2 مع Seedance 2.0 يخلق مزيجاً قاتلاً. سير العمل بسيط: ينتج GPT-Image 2 لوحة القصة (storyboard) أولاً؛ وبمجرد اعتمادها، يتم تمريرها إلى Seedance 2.0 لتنفيذ فيديو طويل. هكذا يجب أن يعمل فيديو الذكاء الاصطناعي.

@arrakis_ai:

خط أنابيب العمل (pipeline) الذي يجمع بين Codex و GPT Image 2 مذهل حقاً. إنه أكثر سير عمل ذكاء اصطناعي إحداثاً للتغيير رأيته هذا العام. وضعت مسودة نصية مع جملة واحدة — "حول هذا إلى كتاب مصور" — وكانت النتيجة كتاباً مصوراً مكتملاً.

كلا المنشورين يشيران إلى الشيء نفسه: أفضل نموذج صور + أفضل نموذج فيديو، مترابطان في خط عمل واحد.

المشكلة: لتشغيل هذا الخط سابقاً، كنت تحتاج إلى حصة (quota) في OpenAI GPT Image 2، ووصول إلى ByteDance Seedance 2.0، وكود برمجي مخصص لربط المطالبات (prompts)، والتعامل مع الطوابير (polling)، وإدارة شبكات توصيل المحتوى (CDN).

هذا لم يعد ضرورياً الآن.

2. Atlas Cloud تدعم الآن GPT Image 2: مفتاح واحد يربط الطرفين

أضافت Atlas Cloud للتو GPT Image 2 إلى قائمة نماذجها، لتصبح في نفس المجموعة مع سلسلة Seedance 2.0 الكاملة (تحويل النص إلى فيديو / الصور إلى فيديو / المرجع إلى فيديو / سريع / عالي الدقة).

سابقاً	الآن
التقديم على حصة OpenAI + دمج Seedance بشكل منفصل	مفتاح API واحد من Atlas Cloud
حزمتان SDK، نظاما فوترة، ومجموعتان من الوثائق	نقطة نهاية موحدة: `https://api.atlascloud.ai/api/v1`
بناء نظام خاص بك للتعامل مع الطوابير / CDN / الأخطاء	توفر قوالب جاهزة للـ SDK / MCP / المهارات

توجد في الأساس نقطتا نهاية فقط:

# توليد الصور (GPT Image 2 / Seedream / Qwen Image ...) POST https://api.atlascloud.ai/api/v1/model/generateImage?utm_source=blog&utm_medium=article&utm_campaign=ultimate-drama-workflow-gpt-image-2-seedance-2-0 # توليد الفيديوهات (Seedance 2.0 / Kling / Vidu ...) POST https://api.atlascloud.ai/api/v1/model/generateVideo?utm_source=blog&utm_medium=article&utm_campaign=ultimate-drama-workflow-gpt-image-2-seedance-2-0 # نقطة نهاية مشتركة للاستعلام عن الحالة GET https://api.atlascloud.ai/api/v1/model/prediction/{id}

المصادقة عبر Bearer token. export ATLASCLOUD_API_KEY=... وأنت جاهز للعمل.

ملاحظة الامتثال: كل شخصية في هذا الشرح هي شخصية رقمية واقعية تم إنشاؤها بواسطة GPT Image 2. لا توجد أي إشارة أو ارتباط بأشخاص حقيقيين.

3. أفضل نموذج صور GPT Image 2 + أفضل نموذج فيديو Seedance 2.0

تعتمد معظم شروحات فيديو الذكاء الاصطناعي أحد نهجين:

النهج أ: تحويل النص إلى فيديو مباشرة (مطالبة مباشرة → فيديو 15 ثانية)

المشكلة: مقامرة بلقطة واحدة، واستهلاك الموارد في كل إعادة محاولة.

النهج ب: شرائح متعددة (6-12 لقطة × 5 ثوانٍ لكل منها، ثم تجميعها)

المشكلة: بطيء (6× توليد صور + 6× توليد فيديو)، مكلف، وسهولة فقدان اتساق الشخصيات.

يتبع drama-director طريقاً ثالثاً:

النهج ج: صفحة قصص مصورة من 9 خانات + فيديو متحرك واحد لمدة 15 ثانية

يقوم GPT Image 2 بتوليد صفحة واحدة مقسمة إلى 9 خانات (3×3) (9 إطارات لقصة مصورة مرسومة في صورة واحدة).
يستهلك Seedance 2.0 تلك الصفحة بالإضافة إلى مطالبة حركية، وينتج فيديو واحداً مدته 15 ثانية في مكالمة واحدة — يتعامل Seedance مع الصورة المكونة من 9 خانات كـ حمض نووي بصري ومرجع للقصة (الشخصيات، الملابس، المواقع، الإضاءة، لوحة الألوان كلها مثبتة من الصورة) ويخرج لقطة سينمائية مدتها 15 ثانية للمشهد الفعلي — ترى حرفياً الألياف النانوية مشدودة، سفينة سياحية تبحر، صفائح معدنية تتشقق، وأعمدة مياه تتفجر — وليس مجرد "كاميرا تتنقل فوق كتاب مصور".

المزايا الثلاث لهذا المزيج:

البعد	طريق الـ 9 خانات	طريق الشرائح (6-8 لقطات)
التكلفة	1 توليد صورة + 1 توليد فيديو	6-8× توليد صور + 6-8× توليد فيديو
الوقت	~3-5 دقائق	~8-15 دقيقة
اتساق الشخصيات	9 خانات على لوحة واحدة — النموذج يضمن الاتساق طبيعياً	كل لقطة تولد مستقلة، تحتاج إلى مرجع لربط الشخصيات
تكلفة التعديل	تعديل الـ prompt وإعادة توليد صورة واحدة فقط	تغيير لوحة واحدة يؤثر على كامل خط العمل
النتيجة	فيديو درامي مصور مكتمل، جاهز للنشر	يتطلب مونتاجاً وتجميعاً بعد الإنتاج

النقطة 3 — اتساق الشخصيات — هي أكبر تحدٍ في سير العمل المترابط. بما أن شبكة الـ 9 خانات هي حرفياً "9 مناطق على نفس اللوحة"، فإن GPT Image 2 يحافظ طبيعياً على نفس مظهر الشخصية وملابسها عبر جميع الخانات. هذا القرار التصميمي يلغي قدراً هائلاً من الهندسة اللاحقة.

4. drama-director: رسالة واحدة، خط عمل متكامل

ما عليك فعله

داخل Claude Code، كل ما تحتاجه هو:

حول هذا النص الروائي إلى دراما مصورة: <الصق النص هنا>

يلتقط Claude المحفزات ("دراما مصورة" / "لوحة قصة" / "9 خانات" / ...)، ويحمل مهارة drama-director ليقوم بالآتي:

قراءة المادة → تقطيرها إلى 9 مشاهد أساسية (ترتيب قراءة 3×3).
بناء image_prompt متكامل (وصف الخانات + قيود الأسلوب) وعرضه عليك للمراجعة.
مكالمة واحدة إلى GPT Image 2 → صفحة القصص المصورة (ملف .json مع image_url).
عرض الصورة عليك؛ بمجرد الموافقة، مكالمة واحدة إلى Seedance 2.0 I2V → فيديو متحرك لمدة 15 ثانية (ملف .json مع video_url).
إصدار تقرير Markdown.

لقد كتبت رسالتين فقط من البداية إلى النهاية: النص، و"تأكيد".

5. التثبيت في 3 دقائق

الخطوة 1 — احصل على مفتاح API

سجل في atlascloud.ai وقم بتوليد مفتاح من صفحة مفاتيح API.

export ATLASCLOUD_API_KEY="sk-your-key" echo 'export ATLASCLOUD_API_KEY="sk-your-key"' >> ~/.zshrc

الخطوة 2 — تثبيت مهارة drama-director

قم باستنساخ المجلد من GitHub إلى دليل مهارات Claude:

mkdir -p ~/.claude/skills git clone https://github.com/kianaliang-dev/drama-director-skill ~/.claude/skills/drama-director

تحقق:

ls ~/.claude/skills/drama-director/

الخطوة 3 — اختبار تجريبي

python3 ~/.claude/skills/drama-director/scripts/generate_image.py \ --prompt "a cinematic 3x3 comic book page with 9 panels showing a cyberpunk chase scene, bold black gutters, film noir palette" \ --aspect 1:1

بعد ~30 ثانية يجب أن ترى ملف JSON يحتوي على image_url. افتح الرابط في المتصفح — إذا ظهرت صفحة قصص مصورة من 9 خانات، فقد نجح النظام.

6. مثال: "عملية جوتشنغ" من رواية مشكلة الأجسام الثلاثة → دراما مصورة (15 ثانية)

لماذا هذا المشهد؟

إنه أحد أكثر المشاهد انفجاراً بصرياً في رواية ليو تسي شين — سفينة سياحية تقطعها ألياف نانوية في قناة بنما. حركة سينمائية مكثفة جداً، تتناسب تماماً مع 9 مشاهد درامية.

ما يفعله Claude:

يكتشف المحفزات ويحمل مهارة drama-director.
يقسم النص إلى 9 إيقاعات (تجهيز الخيوط ← اقتراب السفينة ← التلامس الأول ← بداية انزلاق الطبقات ← التقطيع الكامل ← الانهيار ← تحطم المعدن ← اللقطة الواسعة للنتائج ← مراقبو الشاطئ).
يجهز الـ image_prompt الكامل للمراجعة، وبمجرد تأكيدك، يقوم بتوليد الصورة ثم الفيديو.

النتيجة: فيديو مدته 15 ثانية بدقة 720p، بتكلفة إجمالية تقريبية 1.5-2 دولار فقط.

7. الأسئلة الشائعة

س: كم تكلفة الـ API؟ ج: Atlas Cloud بنظام الدفع حسب الاستخدام، لا توجد اشتراكات. حلقة واحدة مدتها 15 ثانية تكلف ~1.5-2 دولار.

س: ماذا لو كان الفيديو يبدو كصورة ثابتة؟ ج: المطالبة الحركية ليست قوية بما يكفي — أضف "حركة كاميرا، تقريب، تحرك المشاهد بالتتابع، تأثير المنظور الموازي، رياح، دخان، حركة مياه".

س: هل يدعم النصوص العربية؟ ج: نعم. يقوم Claude تلقائياً بإعادة صياغة النصوص العربية إلى image_prompt و motion_prompt بالإنجليزية (لأن كلا النموذجين يفضلان الإنجليزية). ويحتفظ التقرير بوصف القصة العربي الأصلي.

روابط ذات صلة