هل يمتلك Grok من xAI بالفعل ميزة تعديل الصور في عام 2026؟ تحديث شهر مايو

title: هل يمتلك Grok xAI فعلياً إمكانيات تعديل الصور في عام 2026؟ تحديث مايو

description: نعم. يدعم Grok Imagine التعديل باللغة الطبيعية، وتركيب 3 صور، وستة أنماط لنقل الأسلوب، والفيديو. دليل تسعير المطورين وتكامل النظام لعام 2026.

Slug: grok-xai-image-editing-capabilities

H1: قرأنا كل سطر في وثائق قدرات تعديل الصور لـ Grok xAI. إليك ما يمكن لـ Grok فعله حقاً

نعم، يمتلك Grok AI بالتأكيد إمكانيات تعديل الصور في عام 2026. تدعم واجهة برمجة التطبيقات Imagine الخاصة بـ xAI التعديل باللغة الطبيعية وتركيب صور متعددة (حتى 3 صور مصدر)، بدءاً من USD0.02 لكل صورة باستخدام نموذج grok-imagine-image القياسي، وبدءاً من USD0.05 لكل صورة (بدقة 1K؛ وUSD0.07 بدقة 2K) باستخدام نموذج grok-imagine-image-quality عالي الجودة. لاحظ أن تعديلات الصور يتم محاسبتها لكل من الصورة المدخلة وصورة المخرجات الناتجة، لذا فإن التكلفة الفعلية لكل تعديل هي مجموع الاثنين (وثائق xAI، 2026). يغطي هذا الدليل كل قدرة، وكل معلمة، وكل تفاصيل التسعير التي يحتاجها المطورون لتقييم المنصة.

هل يمتلك Grok AI إمكانيات تعديل الصور في عام 2026؟

يمتلك Grok AI بالفعل إمكانيات تعديل الصور في عام 2026، وهي أكثر شمولاً مما يتوقعه العديد من المطورين. وفقاً للوثائق الرسمية لـ xAI (نظرة عامة على xAI Imagine، مايو 2026)، تدعم المنصة تعديل الصور بسعر USD0.02/صورة، وتعديل الصور المتعددة مع ما يصل إلى 3 صور مصدر، وتوليد الصور بدقة تصل إلى 2K، وتحويل الصورة إلى فيديو بسعر USD0.05/ثانية.

لقد توسعت قائمة القدرات الكاملة بشكل كبير هذا العام. توثق xAI الآن تعديل الفيديو، وتمديد الفيديو، وسير عمل المرجع إلى الفيديو جنباً إلى جنب مع أدوات الصور الأساسية. تحمل المنصة شهادات SOC 2 Type II، وتتوافق مع HIPAA، وتلتزم بـ GDPR، مما يجعلها قابلة للتطبيق في مشاريع الصناعات الخاضعة للتنظيم. تنص وثائق xAI على أن "الوسائط التي يتم إنشاؤها تخضع لمراجعة سياسة المحتوى ولا تُستخدم للتدريب"، وهو التزام ذو معنى بحماية البيانات لفرق المؤسسات.

إذا كنت تسأل هل يمتلك grok ai إمكانيات تعديل الصور 2026، فالإجابة هي نعم، وتتجاوز القدرات مجرد توليد الصور الأساسي من النصوص.

كبسولة الاقتباس: تدعم واجهة برمجة تطبيقات xAI Imagine، كما هو موثق في 12 مايو 2026، تعديل الصور بسعر USD0.02/صورة مع ما يصل إلى 3 صور مرجعية لكل طلب وإخراج بدقة 1K/2K. المنصة حاصلة على شهادة SOC 2 Type II ومتوافقة مع HIPAA، مما يجعلها مناسبة لأحمال عمل المؤسسات الإنتاجية.

قدرات توليد الصور في Grok xAI: النماذج، والتسعير، ومعلمات API (2026)

تتمحور قصة قدرات توليد الصور في grok ai لعام 2026 حول تغيير رئيسي واحد: تم إيقاف grok-imagine-image-pro اعتباراً من 15 مايو 2026. وفقاً لصفحة نماذج xAI (نماذج xAI، 2026)، يجب أن تستخدم جميع الطلبات الجديدة grok-imagine-image-quality بسعر USD0.055/صورة. يظل نموذج grok-imagine-image القياسي متاحاً بسعر USD0.02/صورة لأحمال العمل الحساسة للتكلفة.

ما الذي تمنحك إياه واجهة برمجة تطبيقات التوليد فعلياً؟ إليك تفصيل المعلمات.

توليد الصور في Grok xAI: نسب العرض إلى الارتفاع وخيارات الدقة

يدعم نموذج grok-imagine-image-quality 14 نسبة عرض إلى ارتفاع مميزة: 1:1، 16:9، 9:16، 4:3، 3:4، 3:2، 2:3، 2:1، 1:2، 19.5:9، 9:19.5، 20:9، 9:20، وauto. خيارات الدقة هي 1k أو 2k. تسمح نسبة auto للنموذج باستنتاج أفضل ملاءمة من المطالبة (prompt)، وهو ما يعمل بشكل جيد لمهام التوليد ذات الغرض العام (توليد الصور في xAI، مايو 2026).

توليد الدفعات وتنسيقات المخرجات

هل تحتاج إلى صور متعددة من مطالبة واحدة؟ تقبل طريقة sample_batch() معلمة n لإرجاع عدة تنويعات في مكالمة API واحدة. يمكن لكل استجابة تقديم الصور كروابط مؤقتة أو بيانات مشفرة بنظام base64. إذا كنت تستخدم الروابط، قم بتنزيلها على الفور لأن xAI لا تضمن التوافر على المدى الطويل.

تتضمن كل استجابة أيضاً حقل respect_moderation. تحقق من هذا قبل تمرير المخرجات. فهو يخبرك ما إذا كانت الصورة التي تم إنشاؤها قد اجتازت مراجعة سياسة المحتوى.

طلبات توليد الصور المتزامنة في Grok

بالنسبة لخطوط الأنابيب ذات الإنتاجية العالية، استخدم AsyncClient في Python مدمجاً مع asyncio.gather() لإرسال طلبات متزامنة لمطالبات مختلفة في نفس الوقت. هذا هو النمط الموصى به في وثائق xAI لتحقيق التوازي.

كبسولة الاقتباس: اعتباراً من 14 مايو 2026، يدعم نموذج grok-imagine-image-quality من xAI 14 نسبة عرض إلى ارتفاع (بما في ذلك 19.5:9 و 9:19.5 لتنسيقات الهاتف المحمول)، ودقة 1K و 2K، وتوليد الدفعات عبر طريقة sample_batch() مع معلمة n. تشمل المخرجات حقل respect_moderation للتحقق من سياسة المحتوى.

كيف يعمل تعديل الصور في Grok xAI: نقل الأسلوب، والتعديل متعدد الجولات، والمزيد

قدرات تعديل الصور في grok xai التي يقلل معظم المطورين من شأنها هي خيارات نقل الأسلوب (style transfer) وسلاسل التعديل متعددة الجولات. تقبل نقطة نهاية التعديل في xAI صورة مصدر إما كرابط عام أو كـ URI بيانات مشفر بـ base64، ثم تطبق تعليمات باللغة الطبيعية لتحويلها (تعديل الصور في xAI، مايو 2026).

خيارات نقل الأسلوب في تعديل صور Grok xAI

باستخدام grok-imagine-image-quality، يمكنك طلب ستة عمليات نقل أسلوب موثقة: الرسم الزيتي بالتقنية الانطباعية، رسم بالقلم الرصاص، فن البوب، الأنمي، الألوان المائية، والتصوير فائق الواقعية. هذه ليست مجرد مرشحات (فلاتر). يفسر النموذج المحتوى الهيكلي لصورتك المصدر ويعيد تصويره بالأسلوب المستهدف.

سلاسل التعديل متعددة الجولات

هنا يصبح الأمر مثيراً للاهتمام لسير العمل المعقد. يمكنك ربط التعديلات ببعضها عن طريق تغذية مخرجات مكالمة API واحدة كمدخل للصورة المصدر للمكالمة التالية. لا يحتفظ النموذج بحالة الجلسة (session state) على جانب الخادم، لذا يدير تطبيقك تسليم الصور. يسمح هذا النهج متعدد الجولات ببناء خطوط أنابيب تعديل تكرارية: ابدأ بتركيبة أولية، ثم قم بتحسين الإضاءة، ثم طبق أسلوباً، كل ذلك من خلال مكالمات API متسلسلة.

واجهة برمجة تطبيقات تعديل الصور في xAI: عدم التوافق مع OpenAI SDK

هذه ملاحظة تكامل حرجة. طريقة images.edit() في OpenAI SDK لا تعمل مع نقطة نهاية التعديل في xAI. يرسل OpenAI SDK بيانات multipart/form-data، لكن API الخاص بـ xAI يتطلب application/json. استخدم xAI SDK، أو Vercel AI SDK، أو طلبات HTTP مباشرة بدلاً من ذلك. الفرق التي تتجاهل هذه التفاصيل ستقضي ساعات في تصحيح ما يبدو كخطأ في المصادقة ولكنه في الواقع عدم تطابق في نوع المحتوى.

معظم أدلة التكامل لتعديل صور xAI تتجاهل عدم التوافق مع OpenAI SDK تماماً، ولكنه نقطة فشل التكامل الأكثر شيوعاً. المشكلة ليست في الأذونات أو مفاتيح API. إنها في تنسيق الطلب. التحول إلى HTTP مباشر أو xAI SDK يحلها فوراً.

كبسولة الاقتباس: تقبل نقطة نهاية تعديل الصور في xAI الصور المصدر كروابط عامة أو URIs بيانات base64 وتدعم ستة عمليات نقل أسلوب عبر grok-imagine-image-quality. طريقة images.edit() في OpenAI SDK غير متوافقة صراحة لأنها ترسل multipart/form-data، بينما تتطلب xAI application/json. يجب على المطورين استخدام xAI SDK أو Vercel AI SDK أو HTTP المباشر.

قدرات تعديل الصور في Grok xAI وتبديل الوجوه: ما يمكن للمطورين بناؤه حقاً

قدرات تعديل الصور في grok xai وتبديل الوجوه هي واحدة من أكثر المواضيع بحثاً حول Imagine API، والإجابة الصادقة تتطلب بعض الدقة. لا توثق xAI ميزة "تبديل الوجوه" (face swap) بالاسم في وثائق المطورين الخاصة بها (تعديل الصور المتعدد في xAI، 2026). ما توثقه هو تعديل الصور المتعددة، الذي يعالج ما يصل إلى 3 صور مصدر لكل طلب.

إذن، ماذا يمكنك أن تبني حقاً؟

تعديل الصور المتعددة لنقل الموضوع

تقبل نقطة نهاية تعديل الصور المتعددة ما يصل إلى 3 صور مصدر في طلب واحد. تتم معالجة الصور بالترتيب الذي يتم إرسالها به. يتم تعيين نسبة العرض إلى الارتفاع افتراضياً لتطابق أول صورة مدخلة ولكن يمكن تجاوزها باستخدام معلمة aspect_ratio. تشمل حالات الاستخدام الموثقة دمج موضوعات من صور مختلفة، ونقل الأنماط عبر الصور، وتكوين المشاهد من مراجع متعددة.

يمكن للمطور إرسال صورة شخصية كصورة 1، ومشهد مستهدف كصورة 2، وكتابة مطالبة باللغة الطبيعية مثل "ضع الشخص من الصورة الأولى في المشهد من الصورة الثانية". يتعامل النموذج مع المزج. لا تسمي xAI هذا "تبديل الوجوه"، ولكن النتيجة التكوينية يمكن أن تحقق نتائج مشابهة اعتماداً على كيفية صياغة المطالبة.

في اختبارنا لسير عمل تعديل الصور المتعددة، دقة المطالبة مهمة بشكل كبير. المطالبات الغامضة مثل "ادمج هذه الصور" تنتج نتائج غير متسقة. المطالبات الصريحة التي تصف وضع الموضوع، وتطابق الإضاءة، والحفاظ على الخلفية تنتج تركيبات أفضل بكثير. معاملة نقطة النهاية كمجموعة تعليمات Photoshop باللغة الطبيعية تنتج أفضل المخرجات.

قيود تبديل الوجوه في Grok: ما لا يمكن لتعديل الصور فعله

لا تتوقع نقل تشابه وجه دقيق بالبكسل عبر أوضاع أو ظروف إضاءة مختلفة بشكل كبير. النموذج هو نظام توليدي، وليس أداة جنائية لمطابقة الوجوه. بالنسبة لتطبيقات الإنتاج التي تتطلب حفظاً صارماً للهوية، ستحتاج إلى تقييم ما إذا كانت جودة المخرجات تلبي معاييرك من خلال الاختبار.

كبسولة الاقتباس: تقبل نقطة نهاية تعديل الصور المتعددة في xAI ما يصل إلى 3 صور مصدر لكل طلب، مع تعيين نسبة العرض إلى الارتفاع افتراضياً للصورة المصدر الأولى. بينما لا توثق xAI ميزة "تبديل الوجوه"، يمكن للمطالبات باللغة الطبيعية توجيه النموذج لنقل الموضوعات عبر المشاهد. تشمل حالات الاستخدام الموثقة تكوين المشهد، ودمج الموضوعات، ونقل الأسلوب عبر مراجع متعددة.

قدرات تحليل الصور في Grok AI: الفهم البصري مع Grok 4.3

تقع قدرات تحليل الصور في grok ai في جزء منفصل من النظام عن Imagine API. يستخدم فهم الصور grok-4.3 من خلال نقطة النهاية https://api.x.ai/v1/responses، وليس نقطة نهاية توليد الصور (فهم الصور في xAI، 2026). الحفاظ على هذين النظامين منفصلين في بنيتك الهندسية أمر مهم.

تحليل الصور في Grok AI: مواصفات المدخلات

يمكن أن يصل حجم كل صورة إلى 20MiB. التنسيقات المقبولة هي JPEG/JPG و PNG. تتيح المعلمة الاختيارية "detail": "high" تحليلاً بصرياً أعمق للصور المعقدة حيث تكون التفاصيل الدقيقة مهمة، مثل المخططات الفنية أو مسح المستندات الكثيفة.

تدعم نقطة النهاية صوراً متعددة لكل طلب وتقبل أي مزيج من مدخلات الصور والنصوص بأي ترتيب. هذه المرونة مفيدة لمهام المقارنة، حيث يمكنك إرسال صورتين للمنتج وطلب وصف الاختلافات من النموذج.

تحليل الصور في Grok: متطلبات معالجة البيانات

تنصح وثائق xAI المطورين صراحة بعدم تخزين سجل الطلبات/الاستجابات على الخادم عند إرسال الصور. بالنسبة للتطبيقات الحساسة للخصوصية، يعني هذا أن خط أنابيب معالجة الصور الخاص بك لا يجب أن يسجل حمولات الصور الخام في حالة السكون. ابنِ استراتيجية التسجيل الخاصة بك حول البيانات الوصفية (metadata) بدلاً من محتوى الصور.

قدرات توليد الصور في Grok xAI و Flux: الفصل بين الحقيقة والخيال

ارتباك قدرات توليد الصور في grok xai و Flux منتشر على نطاق واسع في مجتمعات المطورين. إليك الفصل الواقعي: Flux هي عائلة نماذج أنشأتها Black Forest Labs. ليست جزءاً من xAI أو Grok. كلاهما نظامان منفصلان تماماً من شركات مختلفة (كتالوج نماذج Atlas Cloud، 2026).

يستخدم توليد الصور في Grok نماذجه الخاصة المملوكة: grok-imagine-image-quality و grok-imagine-image. لا يوجد محرك Flux يعمل تحت غطاء Imagine API.

لماذا يستمر الارتباك؟ ربما لأن كلاً من Flux و Grok Imagine متاحان من خلال منصات التجميع مثل Atlas Cloud، حيث يظهران جنباً إلى جنب في نفس كتالوج النماذج. رؤيتهما مدرجتين معاً تجعل بعض المطورين يفترضون أنهما مترابطان.

إذا كنت تريد نماذج Flux تحديداً، فإن Flux Kontext Dev متاح على Atlas Cloud بسعر USD0.025/صورة و Flux Kontext Dev Lora بسعر USD0.03/صورة. هذه خيارات نماذج منفصلة، وليست مكونات من Grok. قيمها بشكل مستقل بناءً على متطلبات الجودة والتكلفة الخاصة بك.

يظهر الخلط بين Flux و Grok أيضاً في مقارنات المعايير عبر الإنترنت، حيث يقوم المختبرون أحياناً بتشغيل مطالبات Grok مقابل مخرجات Flux دون الكشف عن اختلاف النموذج. إذا كنت تقرأ مراجعة لـ "جودة صور Grok"، تحقق مما إذا كان المؤلف قد تحقق من النموذج الذي استدعاه فعلياً.

كبسولة الاقتباس: Flux هي عائلة نماذج بواسطة Black Forest Labs ولا تتبع xAI أو واجهة برمجة تطبيقات Grok Imagine. يستخدم Grok نماذج مملوكة بما في ذلك grok-imagine-image-quality (USD0.055/صورة) و grok-imagine-image (USD0.02/صورة). يتوفر Flux Kontext Dev بشكل منفصل على Atlas Cloud بسعر USD0.025/صورة كمنتج متميز.

قدرات توليد الصور المخصصة للبالغين (NSFW) في Grok xAI: ما تغطيه سياسة المحتوى في عام 2026

قدرات توليد الصور NSFW في grok xai لعام 2026 هي موضوع تقدم فيه الوثائق الرسمية الإطار العام دون تفاصيل شاملة. تتضمن كل استجابة Imagine API حقل respect_moderation الذي يشير إلى ما إذا كانت الصورة المولدة قد اجتازت مراجعة سياسة المحتوى الخاصة بـ xAI. الصور التي تفشل في المراجعة لن يتم إرجاعها في شكل قابل للاستخدام.

موقف xAI المعلن واضح: "الوسائط التي يتم إنشاؤها تخضع لمراجعة سياسة المحتوى ولا تُستخدم للتدريب." يتم وصف APIs الخاصة بـ Imagine بأنها "مبنية لأحمال عمل الإنتاج مع متطلبات أمنية وامتثال صارمة." يتماشى هذا التأطير مع ضوابط المحتوى على مستوى المؤسسات بدلاً من منصات التوليد المتساهلة.

لا تدرج وثائق المطورين فئات المحتوى المحظور المحددة بتفصيل دقيق. للحصول على فهم كامل وحديث لما هو مسموح به وما هو غير مسموح، تحتاج إلى مراجعة شروط خدمة xAI الرسمية مباشرة. تتغير سياسات المحتوى في هذا المجال بشكل متكرر، وقراءة شروط الخدمة تتفوق على الاعتماد على ملخصات الطرف الثالث.

ما الذي يجب أن تبنيه حول هذا؟ صمم خط الأنابيب الخاص بك للتعامل مع رفض المراجعة برشاقة. تحقق من حقل respect_moderation قبل تمرير المخرجات للمستخدمين، وقم بتنفيذ منطق احتياطي (fallback) للتوليدات المرفوضة. لا تفترض أن أي مطالبة ستجتاز المراجعة في مرحلة الإنتاج.

كيفية الوصول إلى قدرات الصور في Grok xAI من خلال Atlas Cloud

يوفر Atlas Cloud الوصول إلى Grok Imagine جنباً إلى جنب مع أكثر من 300 نموذج ذكاء اصطناعي منسق من خلال واجهة برمجة تطبيقات واحدة موحدة. بالنسبة للفرق التي ترغب في تقييم نماذج صور متعددة دون إدارة علاقات بائعين وحسابات فوترة متعددة، فإن هذا الوصول الموحد ذو قيمة عملية.

مقارنة الأسعار: xAI مباشرة مقابل Atlas Cloud

الميزة	xAI مباشرة	Atlas Cloud
grok-imagine-image-quality	USD0.05/صورة (1K) · USD0.07/صورة (2K)	USD0.055/صورة
grok-imagine-image	USD0.02/صورة	غير متوفر
grok-imagine-video	USD0.05/ثانية (480p) · USD0.07/ثانية (720p)	غير متوفر
نماذج صور أخرى	Grok Imagine فقط	27+ نموذجاً من صورة إلى صورة بما في ذلك Flux Kontext Dev، GPT Image 2، Qwen، Seedream
تنسيق API (LLM فقط)	xAI SDK / HTTP	تنسيق OpenAI Chat Completions لنقاط نهاية LLM
الامتثال	SOC 2, HIPAA, GDPR	SOC 2, HIPAA
كتالوج النماذج	Grok LLMs + Imagine + Voice	300+ نموذج

يقدم Atlas Cloud نموذج grok-imagine-image-quality بنفس سعر USD0.055/صورة مثل xAI مباشرة، مع فوترة موحدة، والوصول إلى أكثر من 300 نموذج تحت API واحدة، وبنية تحتية للامتثال المدار مشمولة. بالنسبة للفرق التي تبني خطوط أنابيب متعددة النماذج، فإن وجود Grok Imagine و Flux Kontext Dev وأكثر من 25 نموذج صور أخرى تحت حساب واحد يزيل أعباء إدارة البائعين الكبيرة.

تتبع نقاط نهاية LLM في Atlas Cloud تنسيق OpenAI Chat Completions، مما يبسط تكامل LLM للفرق التي تستخدم بالفعل أدوات متوافقة مع OpenAI. لاحظ أن هذا التنسيق المتوافق مع OpenAI ينطبق على نقاط نهاية LLM فقط. تستخدم نقاط نهاية الصور والفيديو xAI SDK أو HTTP المباشر، بما يتوافق مع متطلبات API الخاصة بـ xAI.

Atlas Cloud حاصل على شهادة SOC 2 ومتوافق مع HIPAA، ويعمل بنظام الدفع حسب الاستخدام دون حد أدنى، ويوفر الوصول إلى أكثر من 27 نموذجاً من صورة إلى صورة بخلاف Grok Imagine، بما في ذلك Flux Kontext Dev بسعر USD0.025/صورة، و GPT Image 2 Edit، و Nano Banana 2، و Qwen Image 2.0، وسلسلة Seedream.

كبسولة الاقتباس: يتم تسعير نماذج Grok Imagine المملوكة لـ xAI على منصة xAI بسعر 0.05 دولار/صورة (1K) / 0.07 دولار/صورة (2K) لـ grok-imagine-image-quality، و 0.02 دولار/صورة لـ grok-imagine-image (يتم محاسبة التعديلات لكل من الصورة المدخلة والمخرجة؛ الأرقام تستثني رسوم المدخلات لكل صورة). بشكل منفصل، يعيد المجمع الخارجي Atlas Cloud بيع grok-imagine-image-quality بسعر 0.055 دولار/صورة (نص إلى صورة وتعديل، نفس السعر) ويقدم Flux Kontext Dev كمنتج متميز بسعر 0.025 دولار/صورة.

أسئلة مكررة

هل يمتلك Grok AI إمكانيات تعديل الصور في عام 2026؟

نعم. تدعم واجهة برمجة تطبيقات Grok Imagine تعديل الصور باللغة الطبيعية بسعر USD0.02/صورة، وتعديل الصور المتعددة مع ما يصل إلى 3 صور مصدر، ونقل الأسلوب عبر ستة جماليات، وسلاسل التعديل متعددة الجولات. النموذج الموصى به للمشاريع الجديدة هو grok-imagine-image-quality بسعر USD0.055/صورة.

هل يمكنني استخدام OpenAI SDK لتعديل صور Grok؟

لا. طريقة images.edit() في OpenAI SDK غير متوافقة مع نقطة نهاية التعديل في xAI لأنها ترسل multipart/form-data بينما تتطلب xAI application/json. استخدم xAI SDK، أو Vercel AI SDK، أو طلبات HTTP مباشرة. هذا عدم التوافق لا يؤثر على نقاط نهاية LLM، فقط تعديل الصور.

هل يدعم Grok Imagine تبديل الوجوه؟

لا توثق xAI "تبديل الوجوه" كميزة مسماة. ومع ذلك، يمكن لتعديل الصور المتعددة مع ما يصل إلى 3 صور مصدر ومطالبات اللغة الطبيعية تحقيق سير عمل نقل الموضوع وتكوين المشهد. تعتمد النتائج على دقة المطالبة ودرجة اختلاف الوضع/الإضاءة بين الصور المصدر.

هل Flux جزء من Grok Imagine API؟

لا. Flux هي عائلة نماذج من Black Forest Labs وليس لها أي علاقة بـ xAI أو Grok. يستخدم Grok نماذج مملوكة: grok-imagine-image-quality و grok-imagine-image. Flux Kontext Dev هو نموذج منفصل متاح على منصات مثل Atlas Cloud بسعر USD0.025/صورة، لكنه ليس منتجاً من Grok.

ما النموذج الذي يعالج قدرات تحليل الصور في Grok؟

يستخدم فهم الصور grok-4.3 من خلال نقطة النهاية https://api.x.ai/v1/responses. وهو يدعم تنسيقات JPEG و PNG حتى 20MiB لكل صورة، وصور متعددة لكل طلب، ومعلمة اختيارية "detail": "high" للتحليل البصري المعقد. لا تقم بتخزين سجل طلب/استجابة الصور على جانب الخادم، وفقاً لوثائق xAI.

الخاتمة

تغطي Imagine API الخاصة بـ Grok مساحة أكبر بكثير من أداة النص إلى صورة الأساسية. في عام 2026، يتمتع المطورون بالوصول إلى تعديل الصور باللغة الطبيعية، وتركيب الصور المتعددة، وستة أوضاع لنقل الأسلوب، و 14 نسبة عرض إلى ارتفاع، وإخراج بدقة 1K و 2K، ونموذج فهم بصري منفصل في grok-4.3. إيقاف grok-imagine-image-pro في 15 مايو 2026 يعني أن جميع المشاريع الجديدة يجب أن تُبنى على grok-imagine-image-quality.

بعض الأشياء التي يجب مراعاتها في تقييمك. عدم توافق تعديل الصور في OpenAI SDK سيعيقك إذا لم تخطط له. تعديل الصور المتعددة ليس "تبديل وجوه" بالاسم، ولكنه يتعامل مع نقل الموضوع التكويني بالمطالبات الصحيحة. و Flux ليس Grok، بغض النظر عما قد توحي به مقالات المقارنة.

للفرق التي تريد Grok Imagine جنباً إلى جنب مع كتالوج نماذج أوسع تحت واجهة برمجة تطبيقات واحدة، يوفر منصة نماذج الذكاء الاصطناعي الموحدة من Atlas Cloud الوصول إلى أكثر من 300 نموذج بما في ذلك Grok Imagine، و Flux Kontext Dev، وأكثر من 25 خياراً آخر من صورة إلى صورة، مع امتثال SOC 2 و HIPAA وتسعير الدفع حسب الاستخدام.

القدرات جاهزة للإنتاج. السؤال هو ما إذا كانت تناسب حالة الاستخدام والميزانية المحددة الخاصة بك.

العودة إلى القائمة

قرأنا كل سطر في مستندات قدرات تحرير الصور الخاصة بـ Grok من xAI. إليك ما يمكن لـ Grok فعله بالفعل