
Atlas Cloud, Baidu API के अंतर्गत ERNIE Image और ERNIE Image Turbo को होस्ट करता है, दोनों उपयोग के आधार पर भुगतान वाले हैं। प्रत्येक मॉडल अंग्रेजी और चीनी में टेक्स्ट रेंडरिंग के लिए ओपन-सोर्स में अग्रणी है।
Atlas Cloud पर अत्याधुनिक AI इमेज जनरेशन मॉडल का उपयोग करके प्रॉम्प्ट और रेफरेंस से शानदार, प्रोडक्शन-रेडी विज़ुअल तैयार करें।
Compare standard vs. our pricing across every Baidu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Baidu ERNIE Image Turbo Text-to-image | — | Start fromFree | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
ERNIE Image को ऐसे वर्कफ़्लो के लिए बनाया गया है जहाँ जनरेट की गई छवि के अंदर टेक्स्ट पढ़ने योग्य होना चाहिए। टीमें बिना किसी डिज़ाइन टीम के बड़े पैमाने पर द्विभाषी एसेट, संरचित लेआउट और टेक्स्ट-हैवी क्रिएटिव तैयार करने के लिए इसका उपयोग करती हैं।
मार्केटिंग टीमें एक ही API कॉल में पठनीय अंग्रेजी और चीनी टेक्स्ट के साथ अभियान पोस्टर तैयार करने के लिए ERNIE Image का उपयोग करती हैं, जो एक ही प्रॉम्प्ट संरचना से दोनों बाजारों को लक्षित करती हैं। मॉडल दोनों लिपियों को 0.96 से अधिक सटीकता पर प्रस्तुत करता है, जिससे हेडलाइन और मुख्य कॉपी पोस्ट-प्रोडक्शन सुधारों के बिना साफ-सुथरी निकलती हैं। Atlas Cloud की भुगतान-प्रति-उपयोग (pay-as-you-go) मूल्य निर्धारण प्रणाली प्रति-एसेट डिज़ाइन लागत के बिना प्रति अभियान दर्जनों संस्करण तैयार करने को व्यावहारिक बनाती है।
चीनी बाज़ार में प्रवेश करने वाले ब्रांड प्रिंट उत्पादन के लिए प्रतिबद्ध होने से पहले सटीक द्विभाषी पाठ के साथ उत्पाद लेबल और पैकेजिंग मॉकअप उत्पन्न करने के लिए ERNIE Image का उपयोग करते हैं। मॉडल एक ही लेआउट में सरलीकृत चीनी, पारंपरिक चीनी और अंग्रेजी को संभालता है, जिसमें लेबल और घटक सूचियों पर छोटे पाठ भी शामिल हैं। 1024×1024 आउटपुट रिज़ॉल्यूशन पर, मॉकअप उत्पादन-गुणवत्ता वाले होते हैं जो ग्राहक अनुमोदन और विनियामक सबमिशन में उपयोग के लिए पर्याप्त हैं।
प्रकाशक और कंटेंट स्टूडियो ERNIE Image का उपयोग चीनी या अंग्रेजी में सटीक स्पीच बबल, कैप्शन बॉक्स और पैनल टेक्स्ट के साथ कॉमिक पैनल जनरेट करने के लिए करते हैं। यह मॉडल इस प्रकार के स्ट्रक्चर्ड टेक्स्ट-इन-इमेज आउटपुट के लिए विशेष रूप से LongTextBench पर 0.96 से अधिक स्कोर करता है। Atlas Cloud पर ERNIE Image Turbo मुफ़्त है, जिससे इटरेशन चरण के दौरान उच्च-मात्रा वाले पैनल ड्राफ्टिंग की लागत शून्य हो जाती है।
डेटा टीमें ERNIE Image की टेक्स्ट रेंडरिंग सटीकता का उपयोग करके संरचित डेटा को लेबल किए गए इन्फोग्राफिक इमेज में बदलने के लिए पाइपलाइन बनाती हैं। चार्ट लेबल, कॉलआउट बॉक्स और सेक्शन हेडर एक ही प्रॉम्प्ट से दोनों भाषाओं में सटीक रूप से रेंडर होते हैं, जिससे डेटा आउटपुट और विज़ुअल के बीच मैनुअल डिज़ाइन का चरण समाप्त हो जाता है। बिल्ट-इन Prompt Enhancer स्वचालित रूप से संक्षिप्त डेटा विवरणों को विस्तृत लेआउट निर्देशों में फिर से लिखता है।
परफॉर्मेंस मार्केटिंग टीमें एक ही कैंपेन ब्रीफ़ से चीनी और अंग्रेजी भाषी बाज़ारों के लिए स्थानीयकृत विज्ञापन क्रिएटिव बनाती हैं, और एक ही पाइपलाइन में दोनों भाषा संस्करण तैयार करने के लिए ERNIE Image के द्विभाषी समर्थन का उपयोग करती हैं। प्रत्येक क्रिएटिव सटीक इन-इमेज टेक्स्ट के साथ आता है, जिससे जेनरेट की गई छवियों को संपादित करने या फिर से टाइपसेट करने की आवश्यकता समाप्त हो जाती है। Atlas Cloud पर मुफ्त Turbo टियर परीक्षण लागत को शून्य पर रखता है जबकि टीमें यह मूल्यांकन करती हैं कि किन क्रिएटिव वेरिएंट्स को स्केल करना है।
उत्पाद और डिज़ाइन टीमें ERNIE Image का उपयोग करके यथार्थवादी प्लेसहोल्डर कॉपी के साथ UI मॉकअप स्क्रीनशॉट जनरेट करती हैं, जो अंग्रेज़ी या चीनी में सटीक रूप से रेंडर किए जाते हैं। मॉडल बटन लेबल, नेविगेशन टेक्स्ट, फ़ॉर्म फ़ील्ड और मोडल कॉपी को उच्च निष्ठा के साथ संभालता है, जिससे मॉकअप को मैन्युअल टेक्स्ट लेयर संपादन के बिना प्रस्तुतियों में उपयोग किया जा सकता है। यह वायरफ्रेम कॉन्सेप्ट और हितधारकों के लिए तैयार दृश्य के बीच के समय को घंटों से घटाकर मिनटों में कर देता है।
चीनी टेक्स्ट रेंडरिंग के लिए LongTextBench पर ERNIE Image का स्कोर 0.96 से अधिक है, जो ओपन-वेट टेक्स्ट-टू-इमेज मॉडल में सबसे अधिक है। अधिकांश प्रतिस्पर्धी ओपन-सोर्स मॉडल चीनी टेक्स्ट परिदृश्यों में 0.3 से काफी नीचे स्कोर करते हैं, जिससे वे किसी भी ऐसे वर्कफ़्लो के लिए अविश्वसनीय हो जाते हैं जिसमें जनरेट की गई छवियों के अंदर पठनीय चीनी टेक्स्ट की आवश्यकता होती है। यदि आउटपुट में सटीक चीनी टेक्स्ट एक अनिवार्य आवश्यकता है, तो ERNIE Image एक व्यावहारिक विकल्प है।
हाँ। ERNIE Image एक ही जनरेशन कॉल में दोनों लिपियों को संभालता है, और स्वतंत्र रूप से प्रत्येक के लिए उच्च सटीकता बनाए रखता है। यह द्विभाषी पोस्टर, पैकेजिंग और मार्केटिंग सामग्री के लिए उपयोगी है, जिन्हें एक ही लेआउट में पढ़ने योग्य दोनों भाषाओं की आवश्यकता होती है। अंग्रेजी और चीनी दोनों के लिए LongTextBench स्कोर 0.96 से ऊपर हैं।
ERNIE Image में एक हल्का Prompt Enhancer शामिल है जो छोटे इनपुट प्रॉम्प्ट्स को डिफ्यूजन मॉडल में पास करने से पहले स्वचालित रूप से अधिक समृद्ध, अधिक संरचित विवरणों में फिर से लिख देता है। इसका मतलब है कि आप संक्षिप्त प्रॉम्प्ट भेज सकते हैं और व्यापक प्रॉम्प्ट इंजीनियरिंग के बिना अधिक विस्तृत, सटीक आउटपुट प्राप्त कर सकते हैं। Prompt Enhancer हर API कॉल पर जनरेशन पाइपलाइन के हिस्से के रूप में चलता है।
ERNIE Image Turbo अनुमान (inference) को 50 चरणों से घटाकर 8 करने के लिए DMD (डिफ्यूजन मॉडल डिस्टिलेशन) और रीइन्फोर्समेंट लर्निंग का उपयोग करता है, जिससे गति में 6 गुना से अधिक का सुधार होता है। Turbo, Atlas Cloud पर निःशुल्क है और त्वरित पुनरावृत्ति (rapid iteration) तथा ड्राफ्ट जनरेशन के लिए उपयुक्त है। मानक मॉडल व्यावसायिक पोस्टर और संपादकीय ग्राफिक्स जैसी अंतिम उत्पादन संपत्तियों के लिए पूर्ण गुणवत्ता पर चलता है।
हाँ। ERNIE Image को Apache 2.0 लाइसेंस के तहत जारी किया गया है, जो व्यावसायिक उपयोग, संशोधन और वितरण की अनुमति देता है। उत्पन्न छवियों का उपयोग विज्ञापन, पैकेजिंग, प्रकाशनों और अन्य व्यावसायिक अनुप्रयोगों में किया जा सकता है। किसी भी विशिष्ट शर्त के लिए ERNIE Image के GitHub रिपॉजिटरी पर पूर्ण लाइसेंस शर्तों की समीक्षा करें।
Atlas Cloud का भरपूर लाभ उठाने में मदद करने वाली गाइड, ट्यूटोरियल और प्रोडक्ट अपडेट।
Join the Discord community for the latest model updates, prompts, and support.