غالبًا ما كان المستخدمون الذين أنشأوا مقاطع باستخدام Kling AI 1.6 في أواخر عام 2024 يجرون نفس الاختبار: إدخال أوامر حركة معقدة ومراقبة ما سيفشل. وفي معظم الأحيان، لم يكن هناك أي فشل. تم إصدار Kling 1.6 كترقية كبيرة عن إصدار 1.5، حيث دفعت بعرض الفيديو إلى دقة 1080p عالية الوضوح وقدمت وضعي Standard و Professional. ولسنوات، احتلت الصدارة في مقاييس الأداء التابعة لجهات خارجية في فئة مولدات الفيديو بالذكاء الاصطناعي.
لقد انتهى ذلك العصر.
أصبح Kling 3.0 Turbo، الذي أُطلق في 17 يونيو 2026، يتعامل الآن مع تحويل النص إلى فيديو وتحويل الصورة إلى فيديو مع تسلسلات متعددة اللقطات، وصوت أصلي، ومزامنة شفاه محسنة بسرعات إخراج أسرع. فبينما كان إصدار 1.6 يقتصر على دقة 720p مع تحكم محدود في نقاط النهاية، يقوم Kling 3.0 Turbo بإنشاء مقاطع من 3 إلى 15 ثانية بدقة تصل إلى 1080p، مع واقعية سينمائية سردية يتم تقديمها من خلال التفكير البصري بسلسلة الأفكار (Visual Chain-of-Thought).
بنى Kling 1.6 الأساس، بينما أعادت سلسلة 3.0 بناء السقف.
ما هو Kling AI 1.6؟ الميزات، والبنية، وقدرات الفيديو
يستخدم Kling AI بنية محولات قائمة على الانتشار (DiT)، مدعومة من قبل Kuaishou بشبكة ترميز تلقائي متغيرة ثلاثية الأبعاد (VAE) مطورة ذاتياً، مما يتيح ضغطاً مكانياً زمنياً متزامناً. هذه البنية القائمة على الانتشار هي ما ميز إصدار 1.6 عن أدوات الفيديو بالذكاء الاصطناعي المبكرة التي كانت تميل إلى حركات "عائمة" وغير واقعية فيزيائياً. فمن خلال التفكير في كيفية تحرك الأشياء عبر المكان بمرور الوقت بدلاً من الاستيفاء بين الإطارات، أنتج إصدار 1.6 مخرجات ذات اتساق فيزيائي أكثر إحكاماً بشكل ملحوظ من سابقاته.
وباعتباره أداة ذكاء اصطناعي لتحويل النص إلى فيديو، فإنه يقبل كلاً من الأوامر النصية والصور الثابتة، مع توفر فئتين تخدمان مراحل إنتاج متميزة.
Kling 1.6 Standard مقابل Pro: مقارنة مباشرة
| الميزة | Kling 1.6 Standard | Kling 1.6 Pro |
| الدقة | 720p | 1080p |
| أقصى مدة | 5 ثوانٍ | 5 أو 10 ثوانٍ |
| التحكم في الإطار | الإطار الأول فقط | الإطار الأول والأخير |
| الأفضل لـ | مسودات التواصل الاجتماعي، التكرار السريع | التسليم النهائي، الأصول المصقولة |
| تكلفة API (متعددة الصور) | ~0.056 دولار أمريكي/ثانية | ~0.098 دولار أمريكي/ثانية |
| تكلفة API (تحرير الفيديو) | ~0.084 دولار أمريكي/ثانية | ~0.140 دولار أمريكي/ثانية |
| تكلفة API (تمديد الفيديو) | ~0.280 دولار أمريكي/طلب | ~0.490 دولار أمريكي/طلب |
- Kling 1.6 Standard مصمم للسرعة والاستقرار، مما يجعله خياراً عملياً للاستخدام اليومي، والمقاطع الترويجية السريعة، واختبارات وسائل التواصل الاجتماعي. يعني وقت معالجة إنشاء الفيديو الأقل أن المبدعين يمكنهم اختبار مفاهيم متعددة في جلسة واحدة دون طوابير انتظار طويلة للريندر.
- Kling 1.6 Pro يدعم دقة تصل إلى 1080p ويوفر تكييفاً للإطارين الأول والأخير، وهي ميزة حصرية لفئة Pro تسمح للمبدعين بتحديد إطاري البداية والنهاية للمقطع، مما يمنح تحكماً إخراجياً دقيقاً في القوس البصري. كما يوفر متغير Pro متعدد الموضوعات اتساقاً محسناً ودقة متقدمة في تتبع الحركة عبر موضوعات متعددة في مشهد واحد.
وضع الاختبار: أوامر حقيقية وتحليل تشوهات الحركة
لقياس الاختلافات المعمارية بين فئات توسيع Kling 1.6 بدقة، أجرينا اختبار تقلب إطار بإطار في ظل ظروف ريندر متطابقة.
تمثل مقاطع الفيديو النموذجيان أدناه الإخراج المباشر لكل فئة: يتعامل نموذج Pro مع مشهد سينمائي واقعي للغاية، بينما يتعامل نموذج Standard مع رسوم متحركة ثلاثية الأبعاد منمقة مع متطلبات تتبع سريعة.
ملاحظة: استخدمت جميع الاختبارات التالية Kling 1.6 API من Atlas Cloud.
[فيديو 1: إنشاء Kling 1.6 Pro]
النموذج: Kling 1.6 Pro Tier
الأمر: صورة سينمائية لطالب مدرسة تحت مظلة حافلة. تمطر بالخارج، سماء ملبدة بالغيوم الداكنة. لقطة مقربة للزجاج المبلل. حركة المرور في المدينة البعيدة ضبابية. قوام واقعي، 4k، تكوين سينمائي.
[فيديو 2: إنشاء Kling 1.6 Standard]
النموذج: فئة Kling 1.6 Standard
الأمر: جرو متحرك بأسلوب Pixar يطارد بفرح كرة قدم ملونة عبر عشب حديقة مشمس ونابض بالحياة، تتبع حركة عالي السرعة، طاقة مرحة، إضاءة سينمائية.
الالتزام بالأمر: ما نجح فيه كل مقطع
كان الالتزام بالأمر قوياً في كلا الفيديوين على مستوى المشهد. كما يظهر في المقطع الأول، حافظ نموذج Pro بشكل صحيح على الإضاءة الملبدة بالغيوم، وخطوط المطر، والزجاج المبلل، وعمق المجال الضحل عبر جميع الإطارات البالغ عددها 153 إطاراً بمعدل 30 إطاراً في الثانية على مدار 5.1 ثانية. تحولت خلفية الشارع بشكل صحيح مع حركة المركبة، وظلت ملابس الموضوع متسقة في اللون والشكل من الإطار 0 إلى الإطار 152.
في المقابل، افتتح مقطع Standard بجرو متحرك بأسلوب Pixar في منتصف قفزة يطارد كرة قدم، مطابقاً لأمر الحركة بأسلوب Pixar بدقة. كانت التأطير، وإضاءة العشب، وإجراءات الموضوع جميعها توجيهية بوضوح.
تحليل تشوهات الحركة: أين صمد محرك الفيزياء وأين تعثر؟
بينما قدم كلا النموذجين بصرياً ما طلبه الأمر الأولي، تكشف مقاييس جودة الفيديو الآلية الخاصة بنا عن قصة أكثر حدة في الداخل:
| المقياس | Pro (شارع ممطر) | Standard (كلب متحرك) | ماذا يعني ذلك |
| متوسط اختلاف الإطار | 4.19 | 6.2 | كان لدى Standard حركة إجمالية أعلى |
| أقصى اختلاف إطار | 8.61 | 10.84 | أظهر Standard قفزات أكبر بين الإطارات |
| الانحراف المعياري الزمني | 2.16 | 1.64 | كان لدى Pro تباين أكبر في وتيرة الحركة |
| الحدة (متوسط Laplacian) | 161.99 | 25.38 | Pro أكثر حدة بشكل ملحوظ لكل إطار |
| الحدة (الحد الأدنى) | 99.09 | 14.52 | كانت أضبابية إطارات Standard ناعمة جداً |
| الانحراف المعياري لوميض السطوع | 1.61 | 1.21 | كان لدى Pro تباين سطوع أكبر قليلاً |
حافظ الاتساق الزمني بشكل استثنائي في مقطع Pro: ظل وجه الموضوع البشري، ووضعيته، وملابسه ثابتة من إطار لآخر، مع عدم وجود تشوه مرئي للشخصية بين الإطارين 0 و152. كان سلوك جزيئات المطر واقعياً فيزيائياً طوال الوقت.
ومع ذلك، إذا شاهدت مقطع Standard عن كثب، تظهر مشكلة كبيرة في تشوه الشخصية عبر وقت التشغيل البالغ 5 ثوانٍ. يتغير شكل أذن الكلب من متهدل ومستدير في الإطار 0، إلى كبير ومنتصِب مثل فصيلة Corgi بحلول الإطارات 60 و152. كما تتغير نسب وجهه بشكل ملحوظ بين منتصف المقطع والإطارات النهائية. هذا تشوه ناتج عن ضبابية الحركة مرتبط مباشرة بدرجات حدة Standard المنخفضة (متوسط 25.38 مقابل 161.99 في Pro) ومرساة النموذج الهيكلية الأضعف على الشخصيات المنمقة في الحركة العالية.
التحكم في حركة الكاميرا: متسق ولكنه مقيد
ظل التحكم في حركة الكاميرا في مقطع Pro ثابتاً على دفع طفيف للداخل، متتبعاً الموضوع بشكل طبيعي. كان لمقطع Standard تحريك أفقي أكثر ديناميكية ولكنه أنتج مقايضة واضحة: حركة كاميرا أسرع مقترنة بحدة أقل لكل إطار وزيادة خطر تشوه الشخصية.
على الرغم من أن كلا المقطعين يعملان بسلاسة بمعدل 30 إطاراً في الثانية بالضبط دون إطارات مفقودة، إلا أن أياً منهما لم يوفر التوجيه المكاني الحبيبي الذي تم تقديمه في التحديثات اللاحقة، مثل ميزة فرشاة الحركة (Motion Brush) الموجودة في الإصدارين 2.6 و3.0.
Kling AI 1.6 مقابل Kling 3.0: مقارنة تفصيلية للأداء والجودة
لجعل هذه المقارنة ملموسة، يستخدم كلا المقطعين اللذين تم تحليلهما هنا نفس مدخلات الصورة المصدر: شخص وحيد يرتدي قبعة يقف بجانب سيارة حمراء كلاسيكية على طريق منحدر ساحلي.
من خلال ريندر هذه الصورة الثابتة عبر محركات إنشاء مختلفة في وقت واحد، يمكننا التباين مباشرة بين كيفية تعامل كل عصر مع تركيب الحركة، وديناميكيات الموائع، والإضاءة الحجمية داخل شاشة مقسمة واحدة.
- اللوحة اليسرى: تم إنشاؤها عبر Kling 3.0 Turbo (24 إطاراً في الثانية، 121 إطاراً)
- اللوحة اليمنى: تم إنشاؤها عبر Kling 1.6 Pro (30 إطاراً في الثانية، 153 إطاراً)
- أمر الإدخال الأساسي: تتبع تحويل الصورة إلى فيديو (I2V)، انحراف طائرة بدون طيار سينمائي، حركة بيئية واقعية، نسيم البحر.
الدقة والتفاصيل
أنتج كلا المقطعين أبعاد بكسل متطابقة تقريباً، لكن حدة كل إطار أخبرت قصة مختلفة:
| المقياس | Kling 1.6 Pro | Kling 3.0 Turbo |
| متوسط الحدة (Laplacian) | 50.91 | 31.21 |
| الحد الأدنى للحدة | 41.25 | 24.14 |
| الانحراف المعياري لوميض السطوع | 2.578 | 1.833 |
| الانحراف المعياري لاختلاف الإطار الزمني | 0.272 | 0.269 |
| تشبع اللون (HSV-S) | 143.82 | 136.39 |
قيس Kling 1.6 بأنه أكثر حدة لكل إطار في هذا المقطع المحدد، ربما بسبب معدل الإطارات الأعلى البالغ 30 إطاراً في الثانية الذي يحافظ على وضوح الحواف. ومع ذلك، أنتج Kling 3.0 Turbo سطوعاً أكثر استقراراً عبر المقطع (انحراف معياري وميضي أقل بمقدار 1.833 مقابل 2.578)، وهو ما يترجم إلى ثبات تعريض سينمائي أكثر تحكماً. والجدير بالذكر أن سلسلة نماذج Kling 3.0 تدعم بالكامل إخراج 4K أصلي عبر Kling 3.0 Omni—وهو سقف لم يصل إليه 1.6 أبداً.
الفيزياء، والإضاءة، والوزن البيئي
الفحص البصري لمقارنة الفيديو المباشرة يجعل القفزة الجيلية واضحة على الفور.
- انظر إلى اللوحة اليمنى (Kling 1.6 Pro): يعامل المحرك السحابة الخلفية كلوحة ثابتة ومضاءة بشكل موحد طوال المقطع. مع تتبع الكاميرا، لا توجد حركة بخار داخلية داخل السحابة نفسها. تظل العناصر البيئية مجمدة تماماً.
- انظر إلى اللوحة اليسرى (Kling 3.0 Turbo). هنا، تتحرك السحابة بشكل طبيعي. فهي تبني كثافة وتتحرك في الوقت الفعلي. تضربها أشعة الشمس من زوايا مختلفة مع تحرك الكاميرا. انظر إلى العشب على اليسار. إنه ينحني تحت نسيم بحر واقعي. المقطع الأيمن ثابت تماماً. الإصدار 3.0 الجديد يحاكي في الواقع فيزياء حقيقية.
طول المشهد والتسلسل
هذه هي الفجوة الأكثر وضوحاً بين النموذجين:
- Kling 1.6: حد أقصى صارم لمدة إنشاء الفيديو يبلغ 5 ثوانٍ لكل مقطع. تطلب المحتوى الأطول خياطة يدوية لإنشاءات منفصلة.
- Kling 3.0 Turbo: يدعم من 3 إلى 15 ثانية أصلاً، مع أوامر متعددة اللقطات عبر ما يصل إلى 6 لقطات محددة في إنشاء واحد.
بالنسبة لأي شخص يتابع تقدم Kling AI 2.5 مقابل 1.6، فإن القفزة من 1.6 إلى سلسلة نماذج Kling 3.0 ليست مجرد ترقية واحدة؛ فهي تمتد عبر أربعة أجيال رئيسية من النماذج، يضيف كل منها قدرة هيكلية لم يتم تصميم بنية 1.6 لدعمها.
تحولات التحكم المتقدمة: من أوامر 1.6 الأساسية إلى تحكم الحركة 3.0 ومزامنة شفاه الصوت
كان العمل مع Kling 1.6 يتطلب وعياً واضحاً بحدود سلوك النموذج. بينما قدم 1.6 مسارات فرشاة حركة (Motion Brush) موثوقة للتوجيه الهيكلي، ظل تحكمه المتقدم في الكاميرا الافتراضية موجهاً بالنص إلى حد كبير، ويفتقر إلى فرض هيكلي أو مكاني صريح. إذا نفذت الشخصية دورة دورانية معقدة، فغالباً ما كانت الهندسة الوجهية تنجرف إلى "الوادي الغريب" (Uncanny Valley). علاوة على ذلك، كان الصوت غائباً تماماً عن خط أنابيب الإنشاء—اضطر المبدعون إلى تصدير أصول فيديو صامتة وتتبع الأصوات يدوياً باستخدام أدوات خارجية مثل ElevenLabs أو CapCut.
اتسعت فجوة التحكم بشكل كبير مع كل قفزة معمارية لاحقة.
ما كان يفتقر إليه Kling 1.6
| ميزة التحكم | Kling 1.6 | أول ظهور لها |
| تحكم متقدم في الحركة (نقل الفيديو المرجعي) | غير متاح | Kling 2.6 (ديسمبر 2025) |
| مزامنة شفاه الصوت الأصلية | غير متاح | Kling 2.6 (ديسمبر 2025) |
| لوحة عمل متعددة اللقطات | غير متاح | Kling 3.0 (يناير 2026) |
| اتساق مرجع الشخصية عبر الزوايا | جزئي (عبر وضع عناصر 4 صور) | Kling 3.0 (يناير 2026) |
| فرشاة الحركة (تحكم بمسار مرسوم) | متاح (أقنعة ثابتة/ديناميكية) | Kling 1.0 / تم تحديثه في 1.6 |
ما استبدل به 3.0 سير العمل هذا
قدم Kling 3.0 أنظمة مرجع شخصية قوية متعددة الصور، تقفل بنية وجه الموضوع، وخزانة ملابسه، وهويته الأساسية عبر حركات الكاميرا المتطرفة، وزوايا الملف الشخصي، والدفع الديناميكي للداخل.
تمت ترقية الإنشاء المشترك السمعي البصري الأصلي، الذي ظهر في الأصل في Kling 2.6 للقضاء على مزامنة الصوت في برامج مزدوجة، بالكامل في سلسلة 3.0. يوسع Kling 3.0 طلاقة مزامنة الشفاه عبر خمس لغات مع ربط نغمة صوت لكل شخصية، مما يضمن بقاء حوارات الشخصيات المتعددة متميزة تماماً داخل نفس الإطار.
تعد لوحة العمل متعددة اللقطات هي التحول النموذجي الحقيقي لـ 3.0. باستخدام محرك لوحة العمل الذكية، يمكن للمستخدمين التحكم في ما يصل إلى ست لقطات كاميرا في إنشاء واحد. يتعامل النموذج تلقائياً مع استمرارية خزانة الملابس، وإضاءة المشهد، وانتقالات الكاميرا عبر الزوايا الواسعة ولقطات POV.
بينما كان وضع العناصر في Kling 1.6 يمزج فقط ما يصل إلى أربع صور مرجعية في إطار واحد، يعمل Kling 3.0 كمخرج رقمي كامل النطاق—يرسخ الهوية، والإضاءة، والحوار المتزامن ضمن تسلسل مستمر من 15 ثانية متعدد اللقطات.
التسعير، والأرصدة، والقيمة: هل يستحق النموذج المرقى التكلفة؟
كان Kling 1.6 متاحاً منذ الإطلاق: سمحت الفئة المجانية للمبدعين باختبار النموذج بدون تكلفة مقدمة، على الرغم من أن المخرجات كانت تحمل علامات مائية ومحدودة بدقة أقل. لا يزال هيكل أرصدة Kling AI المجانية قائماً حتى اليوم، لكن المساحة الإبداعية توسعت بشكل كبير.
توفر الخطة المجانية 66 رصيداً شهرياً يتم إعادة تعيينها في نهاية كل دورة فوترة ولا يتم ترحيلها. تحمل مقاطع الفيديو الخاصة بالفئة المجانية علامات مائية ولا يمكن استخدامها تجارياً. يبدأ الوصول المدفوع من 6.99 دولاراً أمريكياً/شهرياً في خطة Standard، والتي تعمل كنقطة دخول للاستخدام التجاري وإخراج الفيديو الخالي من العلامات المائية.
خطط أسعار الاشتراك في لمحة
| الخطة | السعر الشهري | الأرصدة/الشهر | الأفضل لـ |
| مجاني | 0 دولار | 66/شهر | اختبار الأوامر، الاستخدام الشخصي |
| Standard | 6.99 دولار | 660 | المبدعون التجاريون العرضيون |
| Pro | 25.99 دولار | 3,000 | المستقلون، الإنتاج الأسبوعي |
| Premier | 64.99 دولار | 8,000 | الوكالات، الإنتاج عالي الحجم |
| Ultra | 180 دولار | 26,000 | الاستوديوهات، وصول أولوية 3.0 |
تكلفة الثانية من الإنشاء: ما هي تكلفة الدقة فعلياً؟
يستخدم نظام 3.0 البيئي نظام خصم وحدات شفافاً يعتمد على الدقة ووضع الإنشاء. يكلف فيديو قياسي مدته 5 ثوانٍ بدقة 720p باستخدام Kling 2.5 Turbo 15 رصيداً، بينما يتسع نفس المقطع الذي تم إنشاؤه على Kling 3.0 إلى 45 رصيداً—مما يضاعف تكلفة الإنشاء ثلاث مرات لمجرد اختيار النموذج. الانتقال إلى وضع Professional بدقة 1080p أو إضافة صوت أصلي يزيد من تكلفة الرصيد بشكل متناسب. وبالتالي، يمكن لمبدع على خطة Standard يشغل مقاطع Kling 3.0 بوضع Professional مع صوت أن يستهلك مخصصاته الشهرية البالغة 660 رصيداً في حوالي 6 إلى 9 مقاطع فيديو.
هل يستحق درجة مقياس ELO العلاوة؟
مع درجة مقياس ELO تبلغ 1,243 بين جميع نماذج الفيديو بالذكاء الاصطناعي، يقع Kling 3.0 بثبات قبل Google Veo 3.1، وRunway Gen-4، وPika 2.2. بالنسبة للمبدعين التجاريين حيث تؤثر جودة المقطع الواحد بشكل مباشر على معايير التسليم، فإن ترقية 3.0 تبرر بسهولة سرعة أرصدتها الأعلى. بالنسبة للاختبار الشخصي أو محتوى التواصل الاجتماعي منخفض المخاطر، لا يزال الاستفادة من Kling 1.6 على الفئة المجانية أو Standard تغطي الحاجة الأساسية بجزء بسيط من السعر.
أفضل حالات الاستخدام والحكم النهائي: من يجب أن يظل يستخدم Kling 1.6؟
لا تتطلب كل احتياجات الإنتاج تسلسل 4K متعدد اللقطات مع صوت أصلي وتفكير بسلسلة الأفكار البصري. لا يزال لـ Kling 1.6 دور محدد في عام 2026، وتحديداً للمبدعين الذين يعطون الأولوية للسرعة، وانخفاض استهلاك الرصيد، والتكرار السريع على الصقل السينمائي.
متى يكون Kling 1.6 منطقياً لا يزال؟
| حالة الاستخدام | النموذج الموصى به | السبب |
| اختبار الأوامر قبل الالتزام بالأرصدة | Kling 1.6 Standard | أقل تكلفة لكل إنشاء (~0.042 دولار/تشغيل) |
| مقاطع اجتماعية بسيطة (TikTok، Reels، Shorts) | Kling 1.6 Standard | إخراج سريع، حركة 720p مستقرة |
| مسودات لوحة العمل لموافقة العميل | Kling 1.6 Pro | إخراج 1080p بتكلفة رصيد منخفضة |
| مشهد متعدد الموضوعات مع صور مرجعية | Kling 1.6 Multi-I2V Pro | اتساق محسن عبر الموضوعات |
| إنتاج فيديو تجاري على نطاق واسع | Kling 3.0 Pro أو Turbo | صوت أصلي، 4K، مدة 15 ثانية |
| سير عمل صناعة الأفلام الاحترافية | Kling 3.0 Omni | لوحة عمل متعددة اللقطات، قفل الشخصية |
الحكم الصادق
Kling 1.6 مبني للسرعة والاستقرار، مما يجعله الخيار العملي عندما لا تكون الجودة هي القيد الأساسي. بالنسبة لاختبار الأوامر، فهو يسمح للمبدعين بالتحقق من مفهوم المشهد، أو تأطير الكاميرا، أو حركة الشخصية قبل إنفاق 45 رصيداً على إنشاء Kling 3.0. حلقة النماذج الأولية تلك مفيدة حقاً وتوفر الميزانية في الريندر النهائي.
بالنسبة لأي شخص يعمل في سير عمل صناعة الأفلام الاحترافية أو إنتاج الفيديو التجاري، لم يعد 1.6 هو الأداة الأساسية الصحيحة. يدعم Kling 3.0 تسلسلات لوحة عمل متعددة اللقطات من خمس إلى ست لقطات مع اتساق الشخصية، واستمرارية خزانة الملابس، والتحكم في حركة الكاميرا عبر الزوايا وتبادلات الحوار. تلك القدرة غير موجودة في 1.6 بأي فئة.
باعتباره أفضل مولد فيديو بالذكاء الاصطناعي لمنشئي المحتوى ذوي المتطلبات الإنتاجية، فإن سلسلة 3.0 هي الخيار الواضح. يكسب Kling 1.6 مكانه ليس في مقدمة خط الإنتاج، بل كمحطة أولى عندما تحتاج إلى الاختبار بسرعة والقرار بسرعة.







