Happy Horse 1.0 في مواجهة Kling 3.0: اختبرنا كليهما بـ 9 مطالبات (Prompts) متطابقة
قبل أن تضغط على زر الإنشاء لأي مطالبة فيديو بالذكاء الاصطناعي، هناك دائمًا نصف ثانية لا تعرف فيها حقًا ما الذي ستحصل عليه. لقد عايشنا هذا الشعور لفترة كافية، لذا توجهنا مباشرة إلى مكتبة المطالبات الرسمية الخاصة بـ Kling، واخترنا تسع مطالبات كما هي، وقمنا بتشغيلها عبر Happy Horse 1.0 كلمة بكلمة.
النطاق كان تحديًا حقيقيًا: من جهة، لقطة مقربة بطيئة لعطر في شقة بباريس مع تعليق صوتي فرنسي؛ ومن جهة أخرى، مشهد لحديقة مقمرة مدته 15 ثانية حيث تطلق امرأة ترتدي فستانًا أخضر داكنًا زهرة بيضاء في منتصف ركضها، بينما تتدفق شخصيات بملابس تاريخية من الجانبين، ويحاول رجل الإمساك بيدها. معظم النماذج ستعاني بصمت في هذا المستوى من التعقيد.
كلا النموذجين يعملان على Atlas Cloud، أي نفس المنصة، نفس الظروف، ودون أي تعديلات من أي جانب. مقاطع الفيديو أدناه مرتبة حسب الصعوبة. تابع القراءة وستتحدث الفيديوهات عن نفسها.
Happy Horse 1.0 في مواجهة Kling 3.0: مقارنة تقنية كاملة
| النموذج | Happy Horse 1.0 | Kling 3.0 Pro |
|---|---|---|
| المطور | Alibaba | Kuaishou |
| النمط (Modality) | T2V، I2V، R2V و تعديل الفيديو | T2V، I2V |
| الدقة | 1080P, 720P | 1080P |
| نسبة العرض | 16:9, 9:16, 1:1, 4:3, 3:4 | 16:9, 9:16, 1:1 |
| توليد الصوت | √ | √ |
| المدة | 3~15 ثانية | 3~15 ثانية |
| السعر | يبدأ من USD 0.14/ثانية | يبدأ من USD 0.095/ثانية |
يعتمد Kling 3.0 على معمارية "محول الانتشار" (Diffusion Transformer - DiT)، مما يسمح للنموذج بفهم العلاقات المكانية والزمانية للبكسلات في آن واحد. هذا يقلل بشكل كبير من الوميض واهتزاز الأنسجة مقارنة بإصداره السابق.
يدعم النموذج ميزة "المخرج الذكي" (AI Director)، والتي تسمح بحدوث انتقالات كاميرا متعددة ومختلفة ضمن إنشاء واحد مع الحفاظ على الاستمرارية المكانية للشخصيات عبر اللقطات. كما يظهر في الفيديوهات، تؤدي هذه الميزة إلى انتقالات كاميرا طبيعية في Kling 3.0. ومع ذلك، فهي تضعف أيضًا من الالتزام بتعليمات الكاميرا المحددة في المطالبات.
بالإضافة إلى ذلك، تضمن قدرة Kling 3.0 على الحفاظ على التناسق لأكثر من ثلاث شخصيات أن تبدو الشخصيات المولدة أكثر واقعية وخالية من الملامح المصطنعة.
من ناحية أخرى، يستخدم Happy Horse 1.0 معمارية محول موحدة (Unified Transformer) بـ 15 مليار معلمة (15B) ويتميز بـ 40 طبقة من آليات الانتباه الذاتي، مما ينتج مقاطع فيديو عالية الجودة وغنية بالتفاصيل. تعمل تقنية التقطير DMD-2 على ضغط خطوات إزالة الضجيج إلى 8 خطوات فقط، جنبًا إلى جنب مع MagiCompiler للتسريع، مما يمكنه من توليد فيديوهات بدقة 1080p على معالجات H100 في حوالي 38 ثانية. هذا يقلل وقت الإنشاء بشكل كبير، مما يسمح بإنتاج مقاطع الفيديو بسرعة وكفاءة.
نتائج المواجهة المباشرة: Happy Horse 1.0 في مواجهة Kling 3.0
الاختبار 1: لقطات المنتجات والمشاهد الثابتة
إعلان تجاري لعطر

لنلقِ نظرة أولاً على أداء Kling 3.0:
على الشاشة، يلتقط العرض إضاءة وظلالاً مذهلة لفترة ما بعد الظهيرة، على الرغم من أن اللقطات تم تحريرها ذاتيًا ولم تلتزم تمامًا بالمطالبات.
مقطوعة البيانو تحتوي على تقطعات، لكنها تبدو طبيعية. وتتماشى نبرة وإيقاع السرد بشكل جيد مع محتوى الفيديو.
بشكل عام، النتيجة تخطف الأنفاس.
لنلقِ نظرة الآن على أداء Happy Horse 1.0:
بصريًا، الإضاءة والظلال أكثر فخامة وتفصيلاً مقارنة بـ Kling 3.0. حتى أنه يتضمن لقطة مقربة لشعار "Kling"، مع تأثير انعكاس ينزلق من اليسار إلى اليمين يتبع حركة الكاميرا. كما أن تسلسل اللقطات يلتزم تمامًا بالمطالبات.
أما بالنسبة للموسيقى الخلفية، فمقطوعة البيانو متناغمة وأنيقة وتندمج بدقة. تأثير السرد مشابه لما قدمه Kling 3.0.
بشكل عام، Happy Horse 1.0 يتفوق في هذه الجولة.
عائلة تشاهد التلفاز

لنبدأ بمشاهدة أداء Kling 3.0:
الانتقالات بين اللقطات سلسة، لكن التفاعل بين الشخصيات الأربع مفقود، خاصة في المشاهد التي يتحدث فيها أول شخصين، حيث لا يوجد رد فعل من الآخرين وكأنهم لا يسمعون.
من حيث الصوت، على الرغم من أنه لا يتضمن ضجيج فتحة مكيف الهواء المذكور في المطالبات، إلا أن هناك صوت تلفاز يضفي أجواء واقعية ويومية.
بشكل عام، الأداء جيد ومقبول.
الآن، لنلقِ نظرة على أداء Happy Horse 1.0:
بصريًا، التفاعلات بين الشخصيات تبدو أكثر طبيعية وديناميكية مقارنة بـ Kling 3.0. ومع ذلك، في الجزء الأخير من الفيديو، تظهر المرأة والطفلان بابتسامات متطابقة تمامًا، مما يكشف عن بعض سمات الذكاء الاصطناعي التي تقلل من الواقعية.
من حيث الصوت، يتراجع Happy Horse 1.0 أمام Kling 3.0 هذه المرة، حيث لا يوجد أي ضجيج محيط. كما أن نبرة إلقاء الشخصيات للحوار تبدو مسطحة نسبيًا.
بشكل عام، كلا الأداءين في مستوى مقبول.
الاختبار 2: تسلسلات سردية بشخصية واحدة
امرأة عاملة - لقطة واحدة مستمرة

وبالمثل، لنلقِ نظرة أولاً على أداء Kling 3.0:
النتائج مذهلة؛ لنلقِ الآن نظرة على أداء Happy Horse 1.0:
من الواضح أن Kling 3.0 يقدم جودة أعلى هذه المرة.
المطالبات لم تصف إعدادات مشهد المكتب، لذا أخذ كلا النموذجين حريتهما الإبداعية. ومع ذلك، فإن المشهد الذي أنشأه Kling 3.0 أكثر منطقية. في المقابل، يظهر Happy Horse 1.0 إعدادًا غير منطقي حيث يتم فصل المساحة بين مصعدين بباب زجاجي.
بالنسبة لتصرفات الشخصية، يلتزم Kling 3.0 بشكل أكبر بالمطالبات، حيث صور أفعالًا مثل "خلع نظارتها الشمسية ووضعها في حقيبتها" و"تعليق الحقيبة على علاقة معاطف بالقرب من المدخل". من ناحية أخرى، في فيديو Happy Horse 1.0، تختفي نظارة الشخصية تمامًا بعد خلعها، وتختفي الحقيبة والمعطف بعد أن خلعت الشخصية المعطف، ليعود المعطف للظهور لاحقًا على الشخصية.
ومع ذلك، لم ينجح أي من النموذجين في تصوير مشاهد "خلع السترة الخارجية وتعليقها على نفس العلاقة" و"توقيع المستند قبل إعادته". مشهد تعليق المعطف مفقود تمامًا. وفي مشهد التوقيع، أغفل Kling 3.0 التوقيع، بينما قام Happy Horse 1.0 بجعل الشخصية توقع على مستند مقلوب، وهو أمر غير منطقي.
بشكل عام، في هذه الجولة، Kling 3.0 هو المتفوق.
سائق شاحنة - تسلسل من 4 لقطات

لنبدأ بمشاهدة أداء Kling 3.0:
من الواضح أن تصيير الإضاءة وخلق الأجواء قوي جدًا، والشخصيات لها ملامح مميزة دون أي وجوه واضحة للذكاء الاصطناعي. ومع ذلك، هناك خلل بسيط في اللقطة الثانية؛ داخل السيارة، لا ينبغي أن يكون هناك ضوء قادم من الجانب الخلفي الأيمن لرأس البطل. وفي اللقطة الرابعة، يوجد تشوه في الزاوية اليمنى السفلية للصورة.
بشكل عام، النتيجة مبهرة للغاية.
الآن، لنلقِ نظرة على أداء Happy Horse 1.0:
صورة الطفل لا تبدو واقعية للغاية، مع ظهور خطوط فوضوية غريبة على ذراعه اليسرى.
بشكل عام، كلاهما متساوٍ. وبجانب بعض العيوب في التفاصيل، كلاهما حقق متطلبات المطالبات.
عربة ثلجية (Snowmobile) - تسلسل من 6 زوايا

لنبدأ بمشاهدة أداء Kling 3.0، ثم ننتقل إلى أداء Happy Horse 1.0:
حركة الكاميرا في Kling 3.0 أكثر طبيعية، وحركة المركبة تبدو أكثر واقعية. في المقابل، تبدو معدات Happy Horse 1.0 جديدة جدًا، مما يجعلها تبدو غير واقعية، وفي اللقطة الثالثة، تختفي مسارات العجلات على الثلج.
Kling 3.0 يتفوق هنا.
الاختبار 3: حوار وتفاعل بين شخصين
زوجان في الشرفة - مشهد من 4 أسطر

لنبدأ بمراجعة أداء Kling 3.0، ثم ننتقل إلى أداء Happy Horse 1.0:
يتميز Kling 3.0 بتلوين جميل، ولقطات مقربة تتماشى مع المطالبات، وتعبيرات وجه أغنى، ومزامنة شفاه أكثر دقة، ومظهر شخصيات أكثر تميزًا.
يتراجع Happy Horse 1.0 في أداء الكاميرا مقارنة بـ Kling 3.0. بالنسبة للسطر الأول للشخصية الذكرية، مزامنة الشفاه غير واضحة.
في هذه الجولة، يقدم Kling 3.0 أداءً أفضل.
شارع في مدريد - طلب الاتجاهات

لنراجع أولاً أداء Kling 3.0، ثم ننتقل إلى Happy Horse 1.0:
كلا النموذجين أظهرا مهارات جيدة في اللغة الإسبانية. في فيديو Kling 3.0، تبدو حركات موظف المتجر ذو الشعر الأبيض غير طبيعية، حيث يستمر في الإشارة إلى السائح.
في هذه الحالة، يقدم Happy Horse 1.0 حركات أكثر طبيعية؛ حيث تقرأ السائحة الإسبانية من هاتفها، وحركات الموظف ذو الشعر الأبيض أكثر واقعية.
Happy Horse 1.0 يتفوق في هذه الجولة.
الاختبار 4: مشاهد معقدة متعددة الشخصيات
الركض في الحديقة - مشهد ملحمي

أولاً، الفيديو من Kling 3.0، يليه الفيديو من Happy Horse 1.0:
يظهر Happy Horse 1.0 التزامًا أقوى بالمطالبات، حيث نجح في التقاط مشاهد مثل "في علامة 8 ثوانٍ... تمد يدها للخلف لتأخذ يده بينما يركضان معًا للأمام"، وكذلك "في الثواني الثلاث الأخيرة... تبدأ شخصياتهما في ملء منتصف الإطار تدريجيًا".
في المقابل، حافظ Kling 3.0 باستمرار على لقطة تتبع جانبية طوال الوقت.
بشكل عام، لم يقدم أي من النموذجين أداءً جيدًا بشكل خاص، وربما يرجع ذلك جزئيًا إلى أن المطالبة لم تكن مفصلة بما يكفي. ومع ذلك، يقدم Happy Horse 1.0 أداءً أفضل نسبيًا من Kling 3.0 في هذه الجولة.
برج تمثال الجبس - لم شمل مع ديناصور

وبالمثل، لنلقِ نظرة أولاً على Kling 3.0، ثم على Happy Horse 1.0:
تبدو مرئيات Kling 3.0 ككل أكثر واقعية وسينمائية، ويلتزم المحتوى بالمطالبات. في المقابل، يفشل الديناصور الصغير في Happy Horse 1.0 في الخروج من خلف التمثال، وهو ما لا ينحرف عن المطالبات فحسب، بل يجعل القصة غير متسقة مع المنطق العام.
في هذه الجولة، Kling 3.0 هو الفائز.
Happy Horse 1.0 أو Kling 3.0: أيهما يناسب سير عملك؟
يتفوق Happy Horse 1.0 في تصيير التفاصيل، وتفاعل الحركة، والالتزام بالمطالبات، وسرعة الإنشاء.
بينما يعمل Kling بشكل أفضل في تصميم الكاميرا، وجودة المرئيات، والمؤثرات الصوتية البيئية.
عندما تحتاج إلى إنشاء سريع، وتكرار عالٍ، أو محتوى يركز على حركات وتفاعلات الشخصيات (مثل الدراما القصيرة، والمحتوى الاجتماعي، وعروض المنتجات)، اختر Happy Horse 1.0.
عندما يتطلب الأمر تصميم كاميرا معقدًا أو محتوى يتطلب جودة مرئية عالية وانغماسًا في الأجواء (مثل الإعلانات التجارية، والترويج للعلامة التجارية، ومقاطع الأفلام)، اختر Kling 3.0.
تشغيل كلا النموذجين على Atlas Cloud
ما هو Atlas Cloud؟
إنها منصة تبسط الذكاء الاصطناعي من خلال منحك الوصول إلى أكثر من 300 نموذج رائد في مكان واحد، للنصوص والصور والفيديو والمزيد.
لمن هذه المنصة؟
• المطورون الذين يريدون وصولاً سهلاً وبأسعار معقولة للذكاء الاصطناعي. • الفرق التي تدير مشاريع تحتاج إلى الذكاء الاصطناعي في مجالات متعددة. • الشركات التي تحتاج إلى ذكاء اصطناعي موثوق لأعمالها المهمة. • المستخدمون لأدوات مثل ComfyUI و n8n.
لماذا تختارها؟
• واجهة برمجة تطبيقات واحدة تتيح لك استخدام كل شيء بمفتاح واحد فقط. • تسعير واضح، بدون مفاجآت، وتكاليف منخفضة. • مصممة للمؤسسات: مستقرة، آمنة، ومدعومة من قبل الخبراء. • تعمل مع الأدوات التي تستخدمها بالفعل. • تبقى بياناتك آمنة وتلبي احتياجات الامتثال.
كيف تقارن بالآخرين؟
• Fal.ai: تمتلك Atlas نماذج أكثر وأسعارًا أفضل. • Wavespeed: Atlas تكلف أقل وتتضمن دعمًا للمؤسسات. • Kie.ai: Atlas أكثر وضوحًا في التسعير وتقدم مجموعة أكبر. • Replicate: تمتلك Atlas نماذج أكثر وأسعارًا أفضل. • مقدمو خدمات آخرون (مثل OpenAI): تجمع Atlas كل شيء في منصة واحدة بسيطة.
كيفية استخدام Happy Horse 1.0 على Atlas Cloud
تتيح لك Atlas Cloud استخدام النماذج جنبًا إلى جنب - أولاً في مساحة العمل (Playground)، ثم عبر واجهة برمجة تطبيقات واحدة.
الطريقة 1: الاستخدام المباشر في مساحة العمل (Playground) على Atlas Cloud
انقر على الرابط أدناه لاستخدامه مباشرة.
الطريقة 2: الوصول عبر واجهة برمجة التطبيقات (API)
الخطوة 1: الحصول على مفتاح API الخاص بك
قم بإنشاء مفتاح API في لوحة التحكم الخاصة بك وانسخه لاستخدامه لاحقًا.


الخطوة 2: التحقق من توثيق الـ API
راجع نقطة النهاية، ومعلمات الطلب، وطريقة المصادقة في وثائق الـ API الخاصة بنا.
الخطوة 3: إرسال طلبك الأول (مثال بلغة Python)
مثال: توليد فيديو باستخدام Happy Horse 1.0 (النص إلى فيديو)
plaintext1import requests 2import time 3 4# الخطوة 1: بدء توليد الفيديو 5generate_url = "https://api.atlascloud.ai/api/v1/model/generateVideo" 6headers = { 7 "Content-Type": "application/json", 8 "Authorization": "Bearer $ATLASCLOUD_API_KEY" 9} 10data = { 11 "model": "alibaba/happyhorse-1.0/text-to-video", # مطلوب. اسم النموذج. خيارات: alibaba/happyhorse-1.0/text-to-video 12 "prompt": "مسافر يسير ببطء عبر صحراء واسعة عند غروب الشمس، والضوء الذهبي يلقي ظلالاً طويلة على الكثبان الرملية. الرياح ترفع بلطف ذرات رمل ناعمة في الهواء، مما يخلق ضبابًا سينمائيًا ناعمًا. الكاميرا تتبع من الخلف بزاوية منخفضة، وتدور تدريجيًا لتكشف عن صورة المسافر الظلية مقابل الأفق المتوهج. توهج عدسة خفيف، إضاءة واقعية للغاية، عمق مجال ضحل، جودة سينمائية 4K، حركة بطيئة، تفاصيل عالية الدقة، جو درامي.", # مطلوب. نص يصف محتوى الفيديو 13 "resolution": "1080P", # دقة الفيديو. خيارات: 720P | 1080P 14 "ratio": "16:9", # نسبة العرض. خيارات: 16:9 | 9:16 | 1:1 | 4:3 | 3:4 15 "duration": 5, # مدة الفيديو بالثواني. (min: 3, max: 15) 16 "seed": -1, # البذرة العشوائية (Seed) لتوليد الفيديو. (min: -1, max: 2147483647) 17} 18 19generate_response = requests.post(generate_url, headers=headers, json=data) 20generate_result = generate_response.json() 21prediction_id = generate_result["data"]["id"] 22 23# الخطوة 2: الاستعلام عن النتيجة 24poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}" 25 26def check_status(): 27 while True: 28 response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"}) 29 result = response.json() 30 31 if result["data"]["status"] in ["completed", "succeeded"]: 32 print("Generated video:", result["data"]["outputs"][0]) 33 return result["data"]["outputs"][0] 34 elif result["data"]["status"] == "failed": 35 raise Exception(result["data"]["error"] or "Generation failed") 36 else: 37 # لا يزال قيد المعالجة، انتظر ثانيتين 38 time.sleep(2) 39 40video_url = check_status()
Happy Horse 1.0 و Kling 3.0: أسئلة شائعة
س1: أيهما أفضل، Happy Horse 1.0 أم Kling 3.0 ؟
لقد قمنا بتشغيل كلاهما عبر تسع مطالبات متطابقة. لم يكتسح أي نموذج الآخر. كان Happy Horse أسرع والتزم أكثر بما كتبناه بالفعل. مخرجات Kling كانت ببساطة ذات حس بصري أفضل بلقطات بدت وكأنها مصممة وليس مجرد مولدة. أيهما يهم أكثر يعود لطبيعة مشروعك.
س2: من طور Happy Horse 1.0 ؟
شركة Alibaba، على الرغم من أنهم التزموا الصمت بشأن ذلك لفترة. جاء النموذج من فريق يسمى Future Life Lab داخل قسم Token Hub في Alibaba. قاد المهندس Zhang Di، وهو الذي يقف وراء Kling 1.0 و 2.0 في Kuaishou، عملية البناء، وقد انضم مجددًا إلى Alibaba في أواخر 2025.
س3: كم من الوقت يستغرق Happy Horse 1.0 لتوليد فيديو؟
حوالي 38 ثانية لدقة 1080p على معالج H100. باختصار: تقطير DMD-2 يختصر عملية إزالة الضجيج إلى 8 خطوات. معظم النماذج تحتاج إلى أكثر من ذلك بكثير. هذا هو مصدر السرعة.
س4: ما هي ميزة "المخرج الذكي" (AI Director) في Kling 3.0 ؟
بدلاً من توليد لقطة واحدة مستمرة، يقوم بتقسيم مطالبتك إلى سلسلة من القطع - زوايا مختلفة، وتأطير مختلف - ويحافظ على الشخصية متناسقة طوال الوقت. العيب هو أنه يتخذ قراراته الخاصة بشأن اللقطات التي يجب استخدامها، لذا إذا كانت مطالبتك تحدد حركة كاميرا معينة، فقد يذهب النموذج في اتجاه مختلف على أي حال.
س5: كم تبلغ تكلفة Kling 3.0 و Happy Horse 1.0 ؟
على منصة Atlas Cloud، يبلغ سعر Kling 3.0 حوالي 0.095 دولار لكل ثانية. و Happy Horse تبلغ 0.14 دولار لكل ثانية بدقة 720p. لا توجد رسوم شهرية لأي منهما. الفاتورة تعكس تمامًا ما قمت بإنشائه.
س6: ما هي أوضاع التوليد التي يدعمها Happy Horse 1.0 ؟
يتعامل النموذج مع أربعة أنواع من المدخلات: النص إلى فيديو، الصورة إلى فيديو، المرجع إلى فيديو، وتعديل الفيديو. الحد الأقصى للإخراج هو 1080p. بالنسبة لنسبة العرض، فهو يغطي 16:9، 9:16، 1:1، 4:3، و 3:4.






