قرأنا كل سطر في وثائق قدرات تعديل الصور الخاصة بـ Grok من xAI. إليك ما يمكن لـ Grok فعله بالفعل

نعم. تدعم Grok Imagine التحرير باللغة الطبيعية، وتركيب 3 صور، وستة أنماط لنقل النمط الفني، والفيديو. أسعار المطورين ودليل التكامل لعام 2026.

قرأنا كل سطر في وثائق قدرات تعديل الصور الخاصة بـ Grok من xAI. إليك ما يمكن لـ Grok فعله بالفعل

title: هل يمتلك Grok xAI بالفعل إمكانات تحرير الصور في عام 2026؟ تحديث مايو

description: نعم. يدعم Grok Imagine التحرير باللغة الطبيعية، وتركيب 3 صور، وستة أنماط لنقل النمط، والفيديو. تسعير المطورين ودليل التكامل لعام 2026.

Slug: grok-xai-image-editing-capabilities

H1: قرأنا كل سطر في مستندات قدرات تحرير الصور لدى Grok xAI. إليك ما يمكن لـ Grok فعله بالفعل

نعم، يمتلك Grok AI بالتأكيد إمكانات تحرير الصور في عام 2026. تدعم واجهة برمجة تطبيقات Imagine من xAI التحرير باللغة الطبيعية وتركيب صور متعددة لما يصل إلى 3 صور مصدر، بدءاً من USD0.02 لكل صورة مع نموذج grok-imagine-image القياسي، وبدءاً من USD0.05 لكل صورة (1K؛ USD0.07 بدقة 2K) مع نموذج grok-imagine-image-quality عالي الجودة. لاحظ أن عمليات تحرير الصور يتم محاسبتها لكل من صورة الإدخال وصورة الإخراج التي تم إنشاؤها، لذا فإن التكلفة الفعلية لكل عملية تحرير هي مجموع الاثنين (مستندات xAI، 2026). يغطي هذا الدليل كل القدرات، وكل المعلمات، وكل تفاصيل التسعير التي يحتاجها المطورون لتقييم المنصة.

هل يمتلك Grok AI إمكانات تحرير الصور في عام 2026؟

يمتلك Grok AI إمكانات تحرير صور في عام 2026، وهي أكثر شمولاً مما يتوقعه العديد من المطورين. وفقاً لوثائق xAI الرسمية (نظرة عامة على xAI Imagine، مايو 2026)، تدعم المنصة تحرير الصور بسعر USD0.02/صورة، وتحرير الصور المتعددة لما يصل إلى 3 صور مصدر، وتوليد الصور بدقة تصل إلى 2K، وتحويل الصورة إلى فيديو بسعر USD0.05/ثانية.

لقد توسعت قائمة القدرات الكاملة بشكل كبير هذا العام. توثق xAI الآن تحرير الفيديو، وتمديد الفيديو، وسير عمل الفيديو المرجعي إلى جانب أدوات الصور الأساسية. تحمل المنصة شهادات SOC 2 Type II، وHIPAA Eligible، وGDPR Compliant، مما يجعلها قابلة للتطبيق في مشاريع الصناعات الخاضعة للتنظيم. تنص وثائق xAI على أن "الوسائط التي يتم إنشاؤها تخضع لمراجعة سياسة المحتوى ولا تُستخدم للتدريب"، وهو التزام ذو مغزى لحماية البيانات لفرق الشركات.

إذا كنت تتساءل عما إذا كان Grok AI يمتلك إمكانات تحرير الصور في 2026، فالإجابة هي نعم، وتتجاوز القدرات مجرد التوليد الأساسي من النص إلى الصورة.

كبسولة الاقتباس: تدعم واجهة برمجة تطبيقات xAI Imagine، كما هو موثق في 12 مايو 2026، تحرير الصور بسعر USD0.02/صورة مع ما يصل إلى 3 صور مرجعية لكل طلب وإخراج بدقة 1K/2K. المنصة حاصلة على شهادة SOC 2 Type II وتتوافق مع HIPAA، مما يجعلها مناسبة لأحمال عمل الشركات الإنتاجية.

قدرات توليد الصور في Grok xAI: النماذج، الأسعار، ومعلمات API (2026)

تتمحور قصة قدرات توليد الصور في Grok AI لعام 2026 حول تغيير رئيسي واحد: تم إيقاف grok-imagine-image-pro اعتباراً من 15 مايو 2026. وفقاً لصفحة نماذج xAI (نماذج xAI، 2026)، يجب أن تستخدم جميع الطلبات الجديدة grok-imagine-image-quality بسعر USD0.055/صورة. يظل نموذج grok-imagine-image القياسي متاحاً بسعر USD0.02/صورة لأحمال العمل الحساسة للتكلفة.

ما الذي تمنحك إياه واجهة برمجة تطبيقات التوليد بالفعل؟ إليك تفصيل المعلمات.

توليد الصور في Grok xAI: نسب العرض إلى الارتفاع وخيارات الدقة

يدعم نموذج grok-imagine-image-quality 14 نسبة عرض إلى ارتفاع مختلفة: 1:1، 16:9، 9:16، 4:3، 3:4، 3:2، 2:3، 2:1، 1:2، 19.5:9، 9:19.5، 20:9، 9:20، وauto. خيارات الدقة هي 1k أو 2k. تسمح نسبة auto للنموذج باستنتاج أفضل ملاءمة من المطالبة، وهو ما يعمل بشكل جيد لمهام التوليد ذات الأغراض العامة (توليد الصور في xAI، مايو 2026).

التوليد بالدفعات وتنسيقات الإخراج

هل تحتاج إلى صور متعددة من مطالبة واحدة؟ تقبل طريقة sample_batch() معلمة n لإرجاع العديد من الاختلافات في استدعاء API واحد. يمكن لكل استجابة تقديم صور كروابط مؤقتة أو بيانات مشفرة بـ base64. إذا كنت تستخدم روابط URL، فقم بتنزيلها على الفور لأن xAI لا تضمن التوفر طويل الأمد.

تتضمن كل استجابة أيضاً حقل respect_moderation. تحقق من هذا قبل تمرير الإخراج إلى الأسفل. فهو يخبرك ما إذا كانت الصورة التي تم إنشاؤها قد اجتازت مراجعة سياسة المحتوى.

طلبات توليد الصور المتزامنة في Grok

بالنسبة لخطوط أنابيب الإنتاجية العالية، استخدم AsyncClient في بايثون مع asyncio.gather() لإطلاق طلبات متزامنة لمطالبات مختلفة في وقت واحد. هذا هو النمط الموصى به في وثائق xAI للتوازي.

كبسولة الاقتباس: اعتباراً من 14 مايو 2026، يدعم نموذج xAI grok-imagine-image-quality 14 نسبة عرض إلى ارتفاع (بما في ذلك 19.5:9 و9:19.5 لتنسيقات الأجهزة المحمولة)، ودقة 1K و2K، والتوليد بالدفعات عبر طريقة sample_batch() مع معلمة n. يتضمن الإخراج حقل respect_moderation للتحقق من سياسة المحتوى.

كيف يعمل تحرير الصور في Grok xAI: نقل النمط، التحرير متعدد الأدوار، والمزيد

قدرات تحرير الصور في Grok xAI التي يقلل معظم المطورين من شأنها هي خيارات نقل النمط وسلاسل التحرير متعدد الأدوار. تقبل نقطة نهاية التحرير الخاصة بـ xAI صورة مصدر إما كرابط URL عام أو كعنوان URI بيانات مشفر بـ base64، ثم تطبق تعليمات باللغة الطبيعية لتحويلها (تحرير الصور في xAI، مايو 2026).

خيارات نقل النمط في تحرير صور Grok xAI

باستخدام grok-imagine-image-quality، يمكنك طلب ستة تحويلات نمطية موثقة: الرسم الزيتي بتقنية الانطباعية، رسم بالقلم الرصاص، فن البوب، الأنمي، الألوان المائية، والتصوير الواقعي للغاية. هذه ليست مرشحات تراكب. يفسر النموذج المحتوى الهيكلي لصورتك المصدر ويعيد تقديمها بالنمط المستهدف.

سلاسل التحرير متعدد الأدوار

هنا يصبح الأمر مثيراً للاهتمام لسير العمل المعقد. يمكنك ربط عمليات التحرير عن طريق تغذية إخراج استدعاء API واحد كإدخال صورة مصدر للاستدعاء التالي. لا يحتفظ النموذج بحالة الجلسة في جانب الخادم، لذا يدير تطبيقك تسليم الصور. يسمح لك نهج التحرير متعدد الأدوار هذا ببناء خطوط أنابيب تحرير تكرارية: ابدأ بتكوين تقريبي، ثم قم بتحسين الإضاءة، ثم طبق نمطاً، كل ذلك من خلال استدعاءات API متسلسلة.

واجهة برمجة تطبيقات تحرير الصور في xAI: عدم التوافق مع حزمة OpenAI SDK

هذه ملاحظة تكامل حاسمة. لا تعمل طريقة images.edit() الخاصة بـ OpenAI SDK مع نقطة نهاية التحرير في xAI. ترسل حزمة OpenAI SDK بيانات multipart/form-data، لكن واجهة برمجة تطبيقات xAI تتطلب application/json. استخدم حزمة xAI SDK أو Vercel AI SDK أو طلبات HTTP مباشرة بدلاً من ذلك. الفرق التي تتجاهل هذه التفاصيل ستقضي ساعات في تصحيح ما يبدو أنه خطأ في المصادقة ولكنه في الواقع عدم تطابق في نوع المحتوى.

تتجاهل معظم أدلة التكامل لتحرير صور xAI عدم التوافق مع OpenAI SDK تماماً، ولكنه نقطة فشل التكامل الأكثر شيوعاً. المشكلة ليست في الأذونات أو مفاتيح API، بل في تنسيق الطلب. الانتقال إلى HTTP المباشر أو حزمة xAI SDK يحل المشكلة فوراً.

كبسولة الاقتباس: تقبل نقطة نهاية تحرير الصور في xAI صوراً مصدرة كروابط URL عامة أو عناوين URI للبيانات المشفرة بـ base64 وتدعم ستة تحويلات نمطية عبر grok-imagine-image-quality. طريقة images.edit() من حزمة OpenAI SDK غير متوافقة صراحةً لأنها ترسل multipart/form-data، بينما تتطلب xAI application/json. يجب على المطورين استخدام حزمة xAI SDK أو Vercel AI SDK أو طلبات HTTP مباشرة.

قدرات تحرير الصور وتبديل الوجوه في Grok xAI: ما يمكن للمطورين بناؤه بالفعل

تعد قدرات تحرير الصور في Grok xAI لتبديل الوجوه واحدة من أكثر الموضوعات التي يتم البحث عنها حول واجهة برمجة تطبيقات Imagine، والإجابة الصادقة تتطلب بعض الفهم الدقيق. لا توثق xAI ميزة "تبديل الوجه" بالاسم في وثائق المطورين الخاصة بها (تحرير الصور المتعددة في xAI، 2026). ما توثقه هو تحرير الصور المتعددة، والذي يتعامل مع ما يصل إلى 3 صور مصدر لكل طلب.

إذاً، ما الذي يمكنك بناؤه بالفعل؟

تحرير الصور المتعددة لنقل الموضوع

تقبل نقطة نهاية تحرير الصور المتعددة ما يصل إلى 3 صور مصدر في طلب واحد. تتم معالجة الصور بالترتيب الذي يتم إرسالها به. يتم ضبط نسبة العرض إلى الارتفاع افتراضياً على صورة الإدخال الأولى ولكن يمكن تجاوزها باستخدام معلمة aspect_ratio. تشمل حالات الاستخدام الموثقة دمج مواضيع من صور مختلفة، ونقل الأنماط عبر الصور، وتكوين مشاهد من مراجع متعددة.

يمكن للمطور إرسال صورة شخصية كصورة 1، ومشهد مستهدف كصورة 2، وكتابة مطالبة باللغة الطبيعية مثل "ضع الشخص من الصورة الأولى في المشهد من الثانية". يتعامل النموذج مع الدمج. لا تسمي xAI هذا "تبديل وجه"، ولكن النتيجة التركيبية يمكن أن تحقق نتائج مماثلة اعتماداً على كيفية صياغة المطالبة.

في اختبارنا لسير عمل تحرير الصور المتعددة، تعد دقة المطالبة أمراً مهماً بشكل كبير. المطالبات الغامضة مثل "ادمج هذه الصور" تنتج نتائج غير متسقة. المطالبات الصريحة التي تصف وضع الموضوع، ومطابقة الإضاءة، والاحتفاظ بالخلفية تنتج تركيبات أفضل بكثير. التعامل مع نقطة النهاية كمجموعة تعليمات فوتوشوب باللغة الطبيعية يعطي أفضل النتائج.

قيود تبديل الوجه في Grok: ما لا يمكن لتحرير الصور فعله

لا تتوقع نقل شبه تام للوجه بدقة البكسل عبر أوضاع أو ظروف إضاءة مختلفة بشكل كبير. النموذج هو نظام توليدي، وليس أداة جنائية لمطابقة الوجوه. بالنسبة لتطبيقات الإنتاج التي تتطلب حفظاً صارماً للهوية، ستحتاج إلى تقييم ما إذا كانت جودة الإخراج تلبي معاييرك من خلال الاختبار.

كبسولة الاقتباس: تقبل نقطة نهاية تحرير الصور المتعددة في xAI ما يصل إلى 3 صور مصدر لكل طلب، مع ضبط نسبة العرض إلى الارتفاع افتراضياً على صورة الإدخال الأولى. على الرغم من أن xAI لا توثق ميزة "تبديل الوجه"، إلا أن المطالبات باللغة الطبيعية يمكن أن توجه النموذج لنقل الموضوعات عبر المشاهد. تشمل حالات الاستخدام الموثقة تكوين المشهد، ودمج الموضوع، ونقل النمط عبر مراجع متعددة.

قدرات تحليل الصور في Grok AI: الفهم البصري مع Grok 4.3

تقع قدرات تحليل الصور في Grok AI في جزء منفصل من النظام عن واجهة برمجة تطبيقات Imagine. يستخدم فهم الصور Grok 4.3 من خلال نقطة النهاية https://api.x.ai/v1/responses، وليس نقطة نهاية توليد الصور (فهم الصور في xAI، 2026). إن الحفاظ على هذين النظامين منفصلين في هندستك المعمارية أمر مهم.

تحليل الصور في Grok AI: مواصفات الإدخال

يمكن أن يصل حجم كل صورة إلى 20MiB. التنسيقات المقبولة هي JPEG/JPG و PNG. تتيح معلمة "detail": "high" الاختيارية تحليلاً بصرياً أعمق للصور المعقدة حيث تهم التفاصيل الدقيقة، مثل المخططات الفنية أو مسح المستندات الكثيفة.

تدعم نقطة النهاية صوراً متعددة لكل طلب وتقبل أي مزيج من إدخالات الصور والنصوص بأي ترتيب. تعد هذه المرونة مفيدة لمهام المقارنة، حيث يمكنك إرسال صورتين لمنتج وطلب وصف الاختلافات من النموذج.

تحليل الصور في Grok: متطلبات معالجة البيانات

تنصح وثائق xAI المطورين صراحة بعدم تخزين سجل الطلبات/الاستجابة على الخادم عند إرسال الصور. بالنسبة للتطبيقات الحساسة للخصوصية، يعني هذا أن خط أنابيب معالجة الصور الخاص بك لا يجب أن يسجل حمولات الصور الأولية في حالة السكون. ابنِ استراتيجية التسجيل الخاصة بك حول البيانات الوصفية بدلاً من محتوى الصورة.

قدرات توليد الصور في Grok xAI و Flux: فصل الحقيقة عن الخيال

ارتباك قدرات توليد الصور في Grok xAI و Flux منتشر على نطاق واسع في مجتمعات المطورين. إليك الفصل الواقعي: Flux هي عائلة نماذج تم إنشاؤها بواسطة Black Forest Labs. وهي ليست جزءاً من xAI أو Grok. النظامان مختلفان تماماً من شركتين مختلفتين (كتالوج نماذج Atlas Cloud، 2026).

يستخدم توليد الصور في Grok نماذجه الخاصة: grok-imagine-image-quality و grok-imagine-image. لا يوجد محرك Flux يعمل تحت غطاء واجهة برمجة تطبيقات Imagine.

لماذا يستمر الارتباك؟ ربما لأن كلاً من Flux و Grok Imagine متاحان من خلال منصات التجميع مثل Atlas Cloud، حيث يظهران جنباً إلى جنب في نفس كتالوج النماذج. رؤيتهما مدرجتين معاً تدفع بعض المطورين إلى افتراض أنهما مرتبطان.

إذا كنت تريد نماذج Flux تحديداً، فإن Flux Kontext Dev متاح على Atlas Cloud بسعر USD0.025/صورة و Flux Kontext Dev Lora بسعر USD0.03/صورة. هذه خيارات نماذج منفصلة، وليست مكونات لـ Grok. قم بتقييمها بشكل مستقل بناءً على متطلبات الجودة والتكلفة الخاصة بك.

يظهر خلط Flux/Grok أيضاً في مقارنات الأداء عبر الإنترنت، حيث يقوم المختبرون أحياناً بتشغيل مطالبات Grok مقابل مخرجات Flux دون الكشف عن فرق النموذج. إذا كنت تقرأ مراجعة لـ "جودة صور Grok"، فتحقق مما إذا كان المؤلف قد تحقق من النموذج الذي استدعاه بالفعل.

كبسولة الاقتباس: Flux هي عائلة نماذج من قبل Black Forest Labs وليست تابعة لـ xAI أو واجهة برمجة تطبيقات Grok Imagine. يستخدم Grok نماذج خاصة بما في ذلك grok-imagine-image-quality (بسعر USD0.055/صورة) و grok-imagine-image (بسعر USD0.02/صورة). يتوفر Flux Kontext Dev بشكل منفصل على Atlas Cloud بسعر USD0.025/صورة كمنتج متميز.

قدرات توليد الصور NSFW في Grok xAI: ما تغطيه سياسة المحتوى في 2026

قدرات توليد الصور NSFW في Grok xAI لعام 2026 هي موضوع تقدم فيه الوثائق الرسمية الإطار دون تفاصيل شاملة. تتضمن كل استجابة لـ Imagine API حقل respect_moderation يشير إلى ما إذا كانت الصورة المولدة قد اجتازت مراجعة سياسة المحتوى الخاصة بـ xAI. لن يتم إرجاع الصور التي تفشل في المراجعة في شكل قابل للاستخدام.

موقف xAI واضح: "الوسائط التي يتم إنشاؤها تخضع لمراجعة سياسة المحتوى ولا تُستخدم للتدريب." يتم وصف واجهات برمجة تطبيقات Imagine بأنها "مصممة لأحمال عمل الإنتاج مع متطلبات أمنية وامتثال صارمة." يتوافق هذا التأطير مع ضوابط المحتوى على مستوى المؤسسات بدلاً من منصات التوليد المتساهلة.

لا تذكر وثائق المطورين فئات المحتوى المحظورة المحددة بتفاصيل دقيقة. للحصول على فهم كامل وحديث لما هو مسموح وما هو غير مسموح، تحتاج إلى مراجعة شروط خدمة xAI الرسمية مباشرة. تتغير سياسات المحتوى في هذا المجال بشكل متكرر، وقراءة شروط الخدمة أفضل من الاعتماد على ملخصات الطرف الثالث.

ما الذي يجب أن تبنيه حول هذا؟ صمم خط أنابيبك للتعامل مع رفض المراجعة بسلاسة. تحقق من حقل respect_moderation قبل تمرير الإخراج إلى المستخدمين، وقم بتنفيذ منطق احتياطي لعمليات التوليد المرفوضة. لا تفترض أن أي مطالبة ستجتاز المراجعة في الإنتاج.

كيفية الوصول إلى قدرات صور Grok xAI عبر Atlas Cloud

يوفر Atlas Cloud الوصول إلى Grok Imagine جنباً إلى جنب مع أكثر من 300 نموذج ذكاء اصطناعي منسق من خلال واجهة برمجة تطبيقات واحدة موحدة. بالنسبة للفرق التي ترغب في تقييم نماذج صور متعددة دون إدارة علاقات بائعين وحسابات فوترة متعددة، فإن هذا الوصول الموحد قيم عملياً.

مقارنة الأسعار: xAI المباشر مقابل Atlas Cloud

الميزةxAI المباشرAtlas Cloud
grok-imagine-image-qualityUSD0.05/صورة (1K) · USD0.07/صورة (2K)USD0.055/صورة
grok-imagine-imageUSD0.02/صورةغير مقدم
grok-imagine-videoUSD0.05/ثانية (480p) · USD0.07/ثانية (720p)غير مقدم
نماذج صور أخرىGrok Imagine فقط27+ نموذج من صورة إلى صورة بما في ذلك Flux Kontext Dev، GPT Image 2، Qwen، Seedream
تنسيق API (LLM فقط)xAI SDK / HTTPتنسيق OpenAI Chat Completions لنقاط نهاية LLM
الامتثالSOC 2, HIPAA, GDPRSOC 2, HIPAA
كتالوج النماذجGrok LLMs + Imagine + Voice300+ نموذج

يقدم Atlas Cloud نموذج grok-imagine-image-quality بنفس سعر USD0.055/صورة مثل xAI المباشر، مع فوترة موحدة، والوصول إلى أكثر من 300 نموذج تحت واجهة برمجة تطبيقات واحدة، وبنية تحتية للامتثال مُدارة. بالنسبة للفرق التي تبني خطوط أنابيب متعددة النماذج، فإن وجود Grok Imagine، و Flux Kontext Dev، و 25+ نموذج صور آخر تحت حساب واحد يزيل عبء إدارة البائعين.

تتبع نقاط نهاية LLM في Atlas Cloud تنسيق OpenAI Chat Completions، مما يبسط تكامل LLM للفرق التي تستخدم بالفعل أدوات متوافقة مع OpenAI. لاحظ أن هذا التنسيق المتوافق مع OpenAI ينطبق على نقاط نهاية LLM فقط. تستخدم نقاط نهاية الصور والفيديو حزمة xAI SDK أو HTTP المباشر، بما يتوافق مع متطلبات API الخاصة بـ xAI.

Atlas Cloud حاصل على شهادة SOC 2 ومتوافق مع HIPAA، ويعمل بنظام الدفع لكل استخدام بدون حد أدنى، ويوفر الوصول إلى أكثر من 27 نموذجاً من صورة إلى صورة بخلاف Grok Imagine، بما في ذلك Flux Kontext Dev بسعر USD0.025/صورة، و GPT Image 2 Edit، و Nano Banana 2، و Qwen Image 2.0، وسلسلة Seedream.

كبسولة الاقتباس: يتم تسعير نماذج Grok Imagine الخاصة بـ xAI على منصة xAI الخاصة بـ $0.05/صورة (1K) / $0.07/صورة (2K) لـ grok-imagine-image-quality، و $0.02/صورة لـ grok-imagine-image (يتم محاسبة عمليات التحرير لكل من صورة الإدخال والإخراج؛ الأرقام تستثني رسوم الإدخال لكل صورة). بشكل منفصل، يعيد مجمع الطرف الثالث Atlas Cloud بيع grok-imagine-image-quality بسعر $0.055/صورة (نص إلى صورة وتحرير، بنفس السعر) ويقدم Flux Kontext Dev كمنتج متميز بسعر $0.025/صورة.

الأسئلة المتكررة

هل يمتلك Grok AI إمكانات تحرير الصور في عام 2026؟

نعم. تدعم واجهة برمجة تطبيقات Grok Imagine تحرير الصور باللغة الطبيعية بسعر USD0.02/صورة، وتحرير الصور المتعددة لما يصل إلى 3 صور مصدر، ونقل النمط عبر ست جماليات، وسلاسل التحرير متعدد الأدوار. النموذج الموصى به للمشاريع الجديدة هو grok-imagine-image-quality بسعر USD0.055/صورة.

هل يمكنني استخدام OpenAI SDK لتحرير صور Grok؟

لا. طريقة images.edit() في OpenAI SDK غير متوافقة مع نقطة نهاية التحرير في xAI لأنها ترسل multipart/form-data بينما تتطلب xAI application/json. استخدم حزمة xAI SDK أو Vercel AI SDK أو طلبات HTTP مباشرة. لا يؤثر عدم التوافق هذا على نقاط نهاية LLM، بل على تحرير الصور فقط.

هل يدعم Grok Imagine تبديل الوجوه؟

لا توثق xAI "تبديل الوجه" كميزة مسمى. ومع ذلك، يمكن لتحرير الصور المتعددة لما يصل إلى 3 صور مصدر ومطالبات اللغة الطبيعية تحقيق سير عمل نقل الموضوع وتكوين المشهد. تعتمد النتائج على دقة المطالبة ودرجة اختلاف الوضع/الإضاءة بين الصور المصدر.

هل Flux جزء من واجهة برمجة تطبيقات Grok Imagine؟

لا. Flux هي عائلة نماذج من Black Forest Labs ولا علاقة لها بـ xAI أو Grok. يستخدم Grok نماذج خاصة: grok-imagine-image-quality و grok-imagine-image. Flux Kontext Dev هو نموذج منفصل متاح على منصات مثل Atlas Cloud بسعر USD0.025/صورة، ولكنه ليس منتجاً من Grok.

ما النموذج الذي يتعامل مع قدرات تحليل الصور في Grok؟

يستخدم فهم الصور Grok 4.3 من خلال نقطة النهاية https://api.x.ai/v1/responses. وهو يدعم تنسيقات JPEG و PNG حتى 20MiB لكل صورة، وصوراً متعددة لكل طلب، ومعلمة "detail": "high" اختيارية للتحليل البصري المعقد. لا تقم بتخزين سجل طلب/استجابة الصورة في جانب الخادم، وفقاً لوثائق xAI.

الخاتمة

تغطي واجهة برمجة تطبيقات Imagine الخاصة بـ Grok مساحة أكبر بكثير من أداة أساسية لتحويل النص إلى صورة. في عام 2026، يتمتع المطورون بالوصول إلى تحرير الصور باللغة الطبيعية، وتركيب الصور المتعددة، وستة أوضاع لنقل النمط، و14 نسبة عرض إلى ارتفاع، وإخراج بدقة 1K و2K، ونموذج فهم بصري منفصل في grok-4.3. إن إيقاف grok-imagine-image-pro في 15 مايو 2026 يعني أن جميع المشاريع الجديدة يجب أن تُبنى على grok-imagine-image-quality.

بضعة أشياء يجب أخذها في الاعتبار عند تقييمك. سيؤدي عدم التوافق في تحرير الصور مع OpenAI SDK إلى إيقاعك إذا لم تخطط له. تحرير الصور المتعددة ليس "تبديل وجه" بالاسم، ولكنه يتعامل مع نقل الموضوع التركيبي بالمطالبات الصحيحة. و Flux ليس Grok، بغض النظر عما قد توحي به مقالات المقارنة.

بالنسبة للفرق التي تريد Grok Imagine جنباً إلى جنب مع كتالوج نماذج أوسع تحت واجهة برمجة تطبيقات واحدة، توفر منصة نماذج الذكاء الاصطناعي الموحدة من Atlas Cloud الوصول إلى أكثر من 300 نموذج بما في ذلك Grok Imagine، و Flux Kontext Dev، و 25+ خياراً آخر من صورة إلى صورة، مع امتثال SOC 2 و HIPAA وتسعير الدفع لكل استخدام.

القدرات جاهزة للإنتاج. السؤال هو ما إذا كانت تناسب حالة الاستخدام الخاصة بك وميزانيتك.

أحدث النماذج

ابدأ من أكثر من 300 نموذج

استكشف جميع النماذج

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.