
تستضيف Atlas Cloud كلاً من ERNIE Image و ERNIE Image Turbo تحت Baidu API، وكلاهما بنظام الدفع حسب الاستخدام. يتصدر كل نموذج مجال المصادر المفتوحة في تصيير النصوص باللغتين الإنجليزية والصينية.
اصنع صورًا مذهلة جاهزة للإنتاج انطلاقًا من الأوصاف والمراجع باستخدام أحدث نماذج الذكاء الاصطناعي لتوليد الصور على Atlas Cloud.
Compare standard vs. our pricing across every Baidu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Baidu ERNIE Image Turbo Text-to-image | — | Start fromFree | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
تم تصميم ERNIE Image لسير العمل حيث يجب أن يكون النص مقروءًا داخل الصورة المُنشأة. تستخدمه الفرق لإنتاج أصول ثنائية اللغة، وتخطيطات منظمة، وتصميمات إبداعية مليئة بالنصوص على نطاق واسع دون الحاجة إلى فريق تصميم.
تستخدم فرق التسويق ERNIE Image لإنشاء ملصقات للحملات بنص إنجليزي وصيني مقروء في استدعاء API واحد، مما يستهدف كلا السوقين من نفس بنية الموجه (prompt). يعرض النموذج كلا النصين بدقة تتجاوز 0.96، بحيث تظهر العناوين والنصوص الأساسية نظيفة دون الحاجة إلى تصحيحات ما بعد الإنتاج. يجعل تسعير الدفع حسب الاستخدام من Atlas Cloud من العملي إنشاء العشرات من المتغيرات لكل حملة دون تكلفة تصميم لكل أصل.
تستخدم العلامات التجارية التي تدخل السوق الصينية ERNIE Image لإنشاء نماذج أولية لملصقات المنتجات والعبوات بنص ثنائي اللغة دقيق قبل الالتزام بإنتاج الطباعة. يتعامل النموذج مع الصينية المبسطة والصينية التقليدية والإنجليزية في نفس التخطيط، بما في ذلك النص الصغير على الملصقات وقوائم المكونات. عند دقة إخراج تبلغ 1024×1024، تتمتع النماذج الأولية بجودة إنتاج كافية لاستخدامها في موافقات العملاء والتقديمات التنظيمية.
يستخدم الناشرون واستوديوهات المحتوى ERNIE Image لإنشاء لوحات قصص مصورة مع فقاعات كلام ومربعات تعليق ونصوص لوحات دقيقة باللغتين الصينية أو الإنجليزية. يسجل النموذج أكثر من 0.96 على LongTextBench تحديدًا لهذا النوع من المخرجات الهيكلية للنصوص داخل الصور. يتوفر ERNIE Image Turbo على Atlas Cloud مجانًا، مما يجعل صياغة اللوحات بكميات كبيرة بدون تكلفة خلال مرحلة التكرار.
تبني فرق البيانات مسارات تحول البيانات المهيكلة إلى صور إنفوجرافيك مصنفة باستخدام دقة عرض النصوص في ERNIE Image. يتم عرض تسميات المخططات ومربعات وسيلة الشرح ورؤوس الأقسام بدقة بكلا اللغتين من خلال موجه (prompt) واحد، مما يلغي خطوة التصميم اليدوي بين إخراج البيانات والعرض المرئي. يقوم Prompt Enhancer المدمج تلقائيًا بإعادة كتابة أوصاف البيانات الموجزة إلى تعليمات تخطيط مفصلة.
تُنشئ فرق التسويق الموجهة نحو الأداء تصميمات إعلانية مخصصة للأسواق الناطقة بالصينية والإنجليزية من نفس موجز الحملة، باستخدام دعم اللغتين في ERNIE Image لإنتاج كلا المتغيرين اللغويين في مسار عمل واحد. يأتي كل تصميم مع نص دقيق داخل الصورة، مما يلغي الحاجة إلى تحرير أو إعادة تنضيد الصور المُنشأة. تُبقي فئة Turbo المجانية على Atlas Cloud تكاليف الاختبار عند الصفر بينما تُقيّم الفرق المتغيرات الإبداعية التي يجب توسيع نطاقها.
تستخدم فرق المنتجات والتصميم ERNIE Image لإنشاء لقطات شاشة لنماذج واجهة المستخدم مع نصوص نائبة واقعية يتم عرضها بدقة باللغتين الإنجليزية أو الصينية. يتعامل النموذج مع تسميات الأزرار ونصوص التنقل وحقول النماذج ونصوص النوافذ المنبثقة بدقة عالية، مما يجعل النماذج قابلة للاستخدام في العروض التقديمية دون الحاجة إلى التعديل اليدوي لطبقات النص. وهذا يقلل الوقت المستغرق من مفهوم الإطار السلكي إلى التصميم المرئي الجاهز لأصحاب المصلحة من ساعات إلى دقائق.
يحقق ERNIE Image درجة تزيد عن 0.96 على LongTextBench لتصيير النص الصيني، وهي الأعلى بين نماذج تحويل النص إلى صورة ذات الأوزان المفتوحة. تسجل معظم النماذج مفتوحة المصدر المنافسة درجات أقل بكثير من 0.3 في سيناريوهات النص الصيني، مما يجعلها غير موثوقة لأي سير عمل يتطلب لغة صينية مقروءة داخل الصور المُنشأة. يُعد ERNIE Image الخيار العملي إذا كان النص الصيني الدقيق في المخرجات مطلبًا صارمًا.
نعم. يعالج ERNIE Image كلا النصين في استدعاء توليد واحد، مع الحفاظ على دقة عالية لكل منهما بشكل مستقل. يعد هذا مفيداً للملصقات ثنائية اللغة والتغليف والأصول التسويقية التي تتطلب أن تكون كلتا اللغتين مقروءتين في نفس التصميم. تتجاوز درجات LongTextBench لكل من اللغتين الإنجليزية والصينية 0.96.
يتضمن ERNIE Image أداة Prompt Enhancer خفيفة الوزن تقوم تلقائيًا بإعادة كتابة المطالبات (prompts) القصيرة المدخلة إلى أوصاف أكثر ثراءً وتنظيماً قبل تمريرها إلى نموذج الانتشار (diffusion model). هذا يعني أنه يمكنك إرسال مطالبات موجزة والحصول على مخرجات أكثر تفصيلاً ودقة دون الحاجة إلى هندسة مطالبات واسعة النطاق. يتم تشغيل Prompt Enhancer كجزء من مسار الإنشاء في كل استدعاء لواجهة برمجة التطبيقات (API).
يستخدم ERNIE Image Turbo تقنية DMD (تقطير نموذج الانتشار) والتعلم المعزز لضغط الاستدلال من 50 خطوة إلى 8 خطوات، مما يوفر تحسنًا في السرعة يزيد عن 6 أضعاف. يتوفر Turbo مجانًا على Atlas Cloud وهو مناسب للتكرار السريع وإنشاء المسودات. يعمل النموذج القياسي بالجودة الكاملة لأصول الإنتاج النهائية مثل الملصقات التجارية والرسومات التحريرية.
نعم. تم إصدار ERNIE Image بموجب ترخيص Apache 2.0، والذي يسمح بالاستخدام التجاري والتعديل والتوزيع. يمكن استخدام الصور المُنشأة في الإعلانات والتعبئة والتغليف والمنشورات والتطبيقات التجارية الأخرى. يُرجى مراجعة شروط الترخيص الكاملة في مستودع GitHub الخاص بـ ERNIE Image لمعرفة أي شروط محددة.
أدلة وشروحات وتحديثات المنتج لمساعدتك على تحقيق أقصى استفادة من Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.