
Atlas Cloud โฮสต์ ERNIE Image และ ERNIE Image Turbo ภายใต้ Baidu API โดยทั้งคู่ใช้ระบบจ่ายตามการใช้งานจริง แต่ละโมเดลเป็นผู้นำด้านโอเพ่นซอร์สสำหรับการเรนเดอร์ข้อความในภาษาอังกฤษและภาษาจีน
สร้างภาพที่สวยตระการตาและพร้อมใช้งานจริงจากพรอมต์และภาพอ้างอิง ด้วยโมเดล AI สร้างภาพที่ล้ำสมัยที่สุดบน Atlas Cloud
Compare standard vs. our pricing across every Baidu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Baidu ERNIE Image Turbo Text-to-image | — | Start fromFree | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
ERNIE Image ถูกสร้างขึ้นสำหรับเวิร์กโฟลว์ที่ข้อความจะต้องสามารถอ่านได้ภายในภาพที่สร้างขึ้น ทีมต่างๆ ใช้เพื่อสร้างสินทรัพย์สองภาษา เค้าโครงที่มีโครงสร้าง และงานสร้างสรรค์ที่มีข้อความจำนวนมากในระดับขนาดใหญ่โดยไม่ต้องมีทีมออกแบบ
ทีมการตลาดใช้ ERNIE Image เพื่อสร้างโปสเตอร์แคมเปญที่มีข้อความภาษาอังกฤษและภาษาจีนที่อ่านง่ายในการเรียกใช้ API เพียงครั้งเดียว โดยกำหนดเป้าหมายทั้งสองตลาดจากโครงสร้างพรอมต์ (prompt) เดียวกัน โมเดลเรนเดอร์สคริปต์ทั้งสองด้วยความแม่นยำสูงกว่า 0.96 ทำให้พาดหัวข่าวและเนื้อหาข้อความมีความคมชัดโดยไม่ต้องมีการแก้ไขในขั้นตอนโพสต์โปรดักชัน การกำหนดราคาแบบจ่ายตามการใช้งานจริงของ Atlas Cloud ทำให้สามารถสร้างแคมเปญได้หลายสิบรูปแบบในทางปฏิบัติ โดยไม่มีต้นทุนการออกแบบต่อชิ้นงาน
แบรนด์ที่เข้าสู่ตลาดจีนใช้ ERNIE Image เพื่อสร้างแบบจำลองฉลากผลิตภัณฑ์และบรรจุภัณฑ์ที่มีข้อความสองภาษาที่ถูกต้องก่อนเข้าสู่ขั้นตอนการพิมพ์จริง โมเดลนี้จัดการภาษาจีนตัวย่อ ภาษาจีนตัวเต็ม และภาษาอังกฤษในเลย์เอาต์เดียวกัน รวมถึงข้อความขนาดเล็กบนฉลากและรายการส่วนผสม ที่ความละเอียดเอาต์พุต 1024×1024 แบบจำลองมีคุณภาพระดับการผลิตเพียงพอที่จะใช้ในการขออนุมัติจากลูกค้าและการยื่นเอกสารตามข้อบังคับ
ผู้จัดพิมพ์และสตูดิโอสร้างคอนเทนต์ใช้ ERNIE Image เพื่อสร้างช่องการ์ตูนที่มีบอลลูนคำพูด กล่องคำบรรยาย และข้อความในช่องที่แม่นยำในภาษาจีนหรือภาษาอังกฤษ โมเดลนี้ได้คะแนนสูงกว่า 0.96 บน LongTextBench โดยเฉพาะสำหรับเอาต์พุตข้อความในรูปภาพที่มีโครงสร้างประเภทนี้ ERNIE Image Turbo บน Atlas Cloud ให้บริการฟรี ซึ่งทำให้การร่างช่องการ์ตูนในปริมาณมากไม่มีค่าใช้จ่ายในช่วงระหว่างขั้นตอนการทำซ้ำ
ทีมข้อมูลสร้างไปป์ไลน์ที่แปลงข้อมูลที่มีโครงสร้างเป็นภาพอินโฟกราฟิกพร้อมป้ายกำกับ โดยใช้ความแม่นยำในการเรนเดอร์ข้อความของ ERNIE Image ป้ายกำกับแผนภูมิ กล่องข้อความ และส่วนหัวของหัวข้อจะถูกเรนเดอร์อย่างแม่นยำในทั้งสองภาษาจาก prompt เพียงอันเดียว ซึ่งช่วยลดขั้นตอนการออกแบบด้วยตนเองระหว่างการส่งออกข้อมูลและการสร้างภาพ Prompt Enhancer ในตัวจะเขียนคำอธิบายข้อมูลสั้นๆ ใหม่เป็นคำแนะนำเค้าโครงโดยละเอียดโดยอัตโนมัติ
ทีมการตลาดเชิงประสิทธิภาพสร้างผลงานโฆษณาที่ปรับให้เข้ากับท้องถิ่นสำหรับตลาดที่พูดภาษาจีนและภาษาอังกฤษจากบรีฟแคมเปญเดียวกัน โดยใช้การรองรับสองภาษาของ ERNIE Image เพื่อผลิตทั้งสองรูปแบบภาษาในไปป์ไลน์เดียว ผลงานสร้างสรรค์แต่ละชิ้นมาพร้อมกับข้อความในรูปภาพที่แม่นยำ ช่วยลดความจำเป็นในการแก้ไขหรือจัดเรียงประเภทรูปภาพที่สร้างขึ้นใหม่ ระดับบริการ Turbo ฟรีบน Atlas Cloud ช่วยให้ต้นทุนการทดสอบเป็นศูนย์ในขณะที่ทีมงานประเมินว่าผลงานสร้างสรรค์รูปแบบใดที่ควรขยายขนาด
ทีมผลิตภัณฑ์และการออกแบบใช้ ERNIE Image เพื่อสร้างภาพหน้าจอแบบจำลอง UI พร้อมข้อความจำลองที่สมจริงซึ่งแสดงผลอย่างถูกต้องในภาษาอังกฤษหรือภาษาจีน โมเดลนี้จัดการป้ายกำกับปุ่ม ข้อความการนำทาง ฟิลด์แบบฟอร์ม และข้อความโมดอลที่มีความละเอียดสูง ทำให้สามารถนำแบบจำลองไปใช้ในงานนำเสนอได้โดยไม่ต้องแก้ไขเลเยอร์ข้อความด้วยตนเอง สิ่งนี้ช่วยลดเวลาจากแนวคิดโครงร่างไปสู่ภาพกราฟิกที่พร้อมนำเสนอต่อผู้มีส่วนได้ส่วนเสียจากหลายชั่วโมงเหลือเพียงไม่กี่นาที
ERNIE Image ทำคะแนนได้สูงกว่า 0.96 บน LongTextBench สำหรับการเรนเดอร์ข้อความภาษาจีน ซึ่งสูงที่สุดในบรรดาโมเดลแปลงข้อความเป็นรูปภาพแบบโอเพนเวท (open-weight) โมเดลโอเพนซอร์สคู่แข่งส่วนใหญ่ทำคะแนนได้ต่ำกว่า 0.3 มากในสถานการณ์ที่มีข้อความภาษาจีน ทำให้ไม่น่าเชื่อถือสำหรับเวิร์กโฟลว์ใดๆ ที่ต้องการภาษาจีนที่อ่านออกได้ในรูปภาพที่สร้างขึ้น ERNIE Image คือตัวเลือกที่ใช้งานได้จริงหากข้อความภาษาจีนที่ถูกต้องในผลลัพธ์คือข้อกำหนดที่จำเป็น
ใช่ ERNIE Image สามารถจัดการทั้งสองสคริปต์ในการเรียกใช้การสร้างเพียงครั้งเดียว โดยรักษาความแม่นยำสูงสำหรับแต่ละสคริปต์อย่างอิสระ สิ่งนี้มีประโยชน์สำหรับโปสเตอร์สองภาษา บรรจุภัณฑ์ และเนื้อหาทางการตลาดที่ต้องการให้ทั้งสองภาษาอ่านได้ในเลย์เอาต์เดียวกัน คะแนน LongTextBench สำหรับทั้งภาษาอังกฤษและภาษาจีนนั้นสูงกว่า 0.96
ERNIE Image ประกอบด้วย Prompt Enhancer ที่มีน้ำหนักเบา ซึ่งจะเขียนพรอมต์อินพุตสั้นๆ ใหม่โดยอัตโนมัติให้เป็นคำอธิบายที่สมบูรณ์และมีโครงสร้างมากขึ้น ก่อนที่จะส่งไปยังโมเดลแบบแพร่กระจาย (diffusion model) ซึ่งหมายความว่าคุณสามารถส่งพรอมต์แบบสั้นและได้รับผลลัพธ์ที่ละเอียดและแม่นยำยิ่งขึ้นโดยไม่ต้องทำวิศวกรรมพรอมต์ (prompt engineering) ขั้นสูง Prompt Enhancer จะทำงานเป็นส่วนหนึ่งของไปป์ไลน์การสร้างในทุกๆ การเรียกใช้งาน API
ERNIE Image Turbo ใช้ DMD (Diffusion Model Distillation) และการเรียนรู้แบบเสริมกำลัง (Reinforcement Learning) เพื่อบีบอัดการอนุมานจาก 50 ขั้นตอนเหลือเพียง 8 ขั้นตอน ส่งผลให้ความเร็วเพิ่มขึ้นมากกว่า 6 เท่า Turbo เปิดให้ใช้งานฟรีบน Atlas Cloud และเหมาะสำหรับการทำซ้ำอย่างรวดเร็วและการสร้างฉบับร่าง โมเดลมาตรฐานจะทำงานที่คุณภาพสูงสุดสำหรับชิ้นงานที่ผลิตขั้นสุดท้าย เช่น โปสเตอร์เชิงพาณิชย์และกราฟิกสำหรับบทความ
ใช่ ERNIE Image เผยแพร่ภายใต้ใบอนุญาต Apache 2.0 ซึ่งอนุญาตให้ใช้งานเชิงพาณิชย์ ดัดแปลง และแจกจ่ายได้ รูปภาพที่สร้างขึ้นสามารถนำไปใช้ในการโฆษณา บรรจุภัณฑ์ สิ่งพิมพ์ และแอปพลิเคชันเชิงพาณิชย์อื่นๆ โปรดตรวจสอบข้อกำหนดใบอนุญาตฉบับเต็มได้ที่พื้นที่เก็บข้อมูล GitHub ของ ERNIE Image สำหรับเงื่อนไขเฉพาะเจาะจงใดๆ
คู่มือ บทแนะนำ และอัปเดตผลิตภัณฑ์ ที่ช่วยให้คุณใช้ Atlas Cloud ได้อย่างเต็มประสิทธิภาพ
Join the Discord community for the latest model updates, prompts, and support.