Grok Imagine API for xAI Image, Video, and Audio

Grok Imagine API memberi pengembang pembuatan gambar, video, dan audio dari xAI dalam satu suite. API ini menghasilkan gambar hingga 2K dengan rendering teks multibahasa, plus video hingga 15 detik dengan audio asli yang tersinkronisasi dan pengeditan berbasis referensi. Di Atlas Cloud, satu kunci menjalankan setiap mode Grok Imagine, sehingga Anda dapat beralih di antara gambar, video, dan audio tanpa pengaturan terpisah, mulai dari $0,02 per gambar dan $0,05 per detik.

Jelajahi Model Terkemuka

Atlas Cloud menyediakan model kreatif terdepan dan terbaru di industri untuk Anda.

NEW

teks-ke-audio

xAI TTS v1

xAI TTS v1 is a high-fidelity text-to-speech model that converts text into natural, expressive speech with sub-second latency, supporting 20 languages and 80+ voices with fine-grained delivery control.

Grok Imagine Video v1.5 Image-to-Video

xAI Grok Imagine Video v1.5 animates a starting frame image with natural-language motion prompts at 480p/720p/1080P.

Grok Imagine Image Quality Text-to-Image

xAI Grok Imagine generates polished visuals from natural-language prompts at 1K or 2K resolution, with 14 aspect ratios.

Grok Imagine Image Quality Edit

xAI Grok Imagine edits one or more reference images with natural-language instructions at 1K or 2K resolution. Supports single image and multi-image (<IMAGE_0>, <IMAGE_1>) reference editing.

Grok Imagine Video Text-to-Video

xAI Grok Imagine Video generates short videos (1-15s) from natural-language prompts at 480p or 720p.

Grok Imagine Video Image-to-Video

xAI Grok Imagine Video animates a starting frame image with natural-language motion prompts at 480p or 720p.

Grok Imagine Video Reference-to-Video

xAI Grok Imagine Video generates videos guided by 1-7 reference images that contribute people, objects, or styles. Output up to 10s at 480p or 720p.

Grok Imagine Video Extend

xAI Grok Imagine Video continues an existing 2-15s mp4 with a 2-10s prompt-driven extension. Output matches input, capped at 720p.

Grok Imagine Video Edit

xAI Grok Imagine Video edits an mp4 with natural-language instructions. Output retains source duration, capped at 8.7s. Billed per second of the input video (output duration == input duration).

Grok Imagine Image Edit

xAI Grok Imagine edits one or more reference images with natural-language instructions at 1K or 2K resolution. Supports single image and multi-image (<IMAGE_0>, <IMAGE_1>) reference editing.

Grok Imagine Image Text-to-Image

xAI Grok Imagine generates images from natural-language prompts at 1K or 2K resolution, with 14 aspect ratios.

From

$0.02/GAMBAR

Kecepatan puncak

Biaya terendah

Modalitas	Deskripsi
Grok Imagine Image Quality T2I API(Text to Image)	Grok Imagine Image Quality T2I API memberdayakan pengembang untuk mengubah prompt teks menjadi gambar fotorealistik pada resolusi hingga 2K. Dengan detail yang sangat tajam, rendering teks multibahasa, dan kepatuhan prompt yang lebih ketat, API ini menghasilkan visual berkualitas merek yang dioptimalkan untuk gambar utama (hero images), materi iklan, dan render produk.
Grok Imagine Image Quality Edit API(Image to Image)	Grok Imagine Image Quality Edit API memberdayakan pengembang untuk menyempurnakan dan menata ulang gambar yang ada menggunakan input referensi. Dengan pencahayaan alami, tekstur yang kaya, dan fisika yang dapat dipercaya, API ini menghasilkan pengeditan fotorealistis yang dioptimalkan untuk rendering produk, kampanye pemasaran, dan visual tingkat merek.
Grok Imagine Video Text-to-Video API	Grok Imagine Video Text-to-Video API memberdayakan pengembang untuk menghasilkan video sinematik langsung dari perintah teks dengan resolusi hingga 720p. Dengan durasi yang dapat dikonfigurasi hingga 15 detik, rasio aspek yang fleksibel, dan sintesis audio asli, API ini menghasilkan urutan video fotorealistik yang dioptimalkan untuk konten sosial, kreatif periklanan, dan penceritaan visual yang imersif.
Grok Imagine Video Image-to-Video API	Grok Imagine Video Image-to-Video API memberdayakan pengembang untuk menganimasikan gambar diam menjadi klip video dinamis menggunakan gambar sumber dan perintah teks. Dengan gambar sumber yang ditambatkan sebagai bingkai pertama, pembuatan gerakan alami, dan keluaran audio yang disinkronkan, API ini menghasilkan animasi fotorealistik yang dioptimalkan untuk pameran produk, animasi potret, dan alur kerja yang menghidupkan adegan.
Grok Imagine Video Reference-to-Video	Grok Imagine Video Reference-to-Video API memberdayakan pengembang untuk membuat video yang dipandu oleh hingga 7 gambar referensi, menggabungkan karakter, objek, atau gaya visual tertentu tanpa menetapkan bingkai awal. Dengan pelestarian identitas yang konsisten di semua bingkai, durasi fleksibel hingga 10 detik, dan ketepatan komposisi yang kuat, API ini menghasilkan video berkualitas merek yang dioptimalkan untuk uji coba virtual, penempatan produk, dan penceritaan yang konsisten dengan karakter.
Grok Imagine Video Edit API (Video-to-Video)	Grok Imagine Video Edit API memberdayakan pengembang untuk memodifikasi video yang ada menggunakan instruksi bahasa alami. Dengan preservasi adegan bersetia tinggi, perubahan berbasis prompt yang ditargetkan, dan output yang mempertahankan durasi asli serta rasio aspek hingga 720p, API ini menghasilkan pengeditan video presisi yang dioptimalkan untuk alur kerja pascaproduksi, kampanye pemasaran, dan penyempurnaan kreatif iteratif.

Fitur Utama Grok Imagine API

Jelajahi apa yang ditawarkan oleh Grok Imagine API, mulai dari pembuatan gambar 2K dengan teks multibahasa hingga video multimodal dengan audio sinkronisasi bawaan dan mode kreatif.

Perenderan Resolusi Ultra-Tinggi menggunakan API Kualitas Gambar Grok Imagine

Grok Imagine Image Quality API memberikan pembuatan gambar dengan resolusi hingga 2K dan detail yang sangat tajam di setiap hasilnya. Dengan mempertahankan tekstur halus dan komposisi rumit dalam skala besar, pengguna dapat menghasilkan visual yang tetap tajam bahkan saat ditampilkan dalam format ekstra besar. Ini adalah solusi utama untuk hero image, materi iklan, dan render produk tingkat merek.

Perenderan Teks Multibahasa

Grok Imagine Image Quality API menawarkan rendering teks terbaik di kelasnya dalam berbagai bahasa langsung di dalam gambar yang dihasilkan. Dengan mereproduksi tipografi, skrip, dan karakter secara akurat dalam bahasa apa pun, pengguna dapat menyematkan teks yang mudah dibaca ke dalam visual mereka tanpa pengeditan pasca manual. Ini adalah solusi utama untuk materi iklan, kampanye pemasaran yang dilokalkan, dan visual berkualitas merek.

Pembuatan Gambar Fotorealistis

Grok Imagine API menghasilkan output fotorealistik yang menampilkan pencahayaan alami, tekstur yang kaya, dan fisika yang dapat dipercaya di setiap adegan. Dengan mensimulasikan optik dunia nyata dan perilaku material, pengguna dapat menghasilkan gambar yang secara visual tidak dapat dibedakan dari fotografi profesional. Ini adalah solusi utama untuk render produk, gambar hero, dan visual merek kelas atas.

Kontrol Prompt Presisi dan Pengeditan Berbasis Referensi

Grok Imagine Image Quality API mendukung kepatuhan prompt yang lebih ketat di samping pengeditan gambar lanjutan yang didukung oleh input referensi. Dengan menafsirkan instruksi mendetail dan mencocokkan isyarat gaya dari referensi yang diunggah, pengguna dapat menyempurnakan dan menata ulang visual dengan akurasi tinggi. Ini adalah solusi utama untuk materi iklan, render produk, dan visual kelas merek yang konsisten.

Pembuatan Audio Video Native

Menghasilkan musik, efek suara, dan dialog tersinkronisasi secara otomatis dengan setiap klip, sehingga audio dan gerakan tetap selaras dalam satu proses. Klip tidak memerlukan langkah audio terpisah dan siap untuk digunakan.

Pembuatan Video Multimodal

Ini mencakup teks ke video, gambar ke video, referensi ke video, dan pengeditan video dalam satu rangkaian. Anda dapat berpindah antara tugas pembuatan dan pengeditan tanpa perlu menukar model atau integrasi.

Kontrol Gerakan dan Konsistensi

Grok Imagine Video API menghasilkan gerakan alami dengan fisika yang stabil dan subjek yang konsisten di seluruh frame. Hal ini mengurangi kedipan dan artefak pada klip yang lebih panjang, menjaga karakter dan pemandangan tetap koheren dari awal hingga akhir.

Perbandingan Model dengan Satu Prompt

Prompt

Candid street portrait photography of an elderly man in his 60s-70s, weathered face with deep wrinkles and expressive furrowed brow, long wild flowing grey-brown hair reaching shoulders, thick unkempt grey beard, mouth slightly open showing imperfect teeth, wearing small round John Lennon-style wire-frame sunglasses with dark lenses, wearing a teal/dark green Hard Rock Cafe graphic t-shirt with colorful print, holding a paper cup in hand, shot with telephoto lens, shallow depth of field, subject in sharp focus, bokeh background with blurred green and colorful elements suggesting an outdoor festival or market setting, natural outdoor lighting, slightly overcast, HDR-style post processing with rich color saturation and contrast, photojournalism / documentary street photography style, close-up portrait framing, chest-up composition, ultra detailed skin texture, every hair strand visible, shot on Sony A7R / Canon 5D Mark IV style rendering

Generated by Grok Imagine

Generated by Nano Banana 2

Generated by GPT Image-2

Prompt

Ultra-high resolution editorial beauty portrait, extreme close-up of a young woman's face, filling entire frame from forehead to chin, striking blue-green piercing eyes with intense gaze looking directly at camera, wet dark hair plastered across forehead and face in chaotic strands, dramatic split-tone makeup art — left side of face covered in deep cobalt blue metallic body paint or pigment powder, right side warm amber/copper toned skin, scattered gold glitter particles across cheeks, nose bridge, and lips catching light in specular bokeh highlights, full parted lips slightly open, glossy red-coral lip color, hint of teeth visible, lighting: dual-color dramatic studio lighting — cool blue rim light from left, warm amber/orange key light from right, creating extreme contrast split across the face centerline, skin texture rendered at microscopic level — every pore, fine hair, water droplet, glitter particle hyper-visible, photography specs: shot on Phase One IQ4 150MP medium format camera, Hasselblad 120mm macro lens, f/2.8 aperture, tack-sharp focus on eyes and lip area, micro-texture rendering on skin surface, post-processing: Capture One ultra-detail masking, luminosity contrast enhancement, color split-toning warm-cool duality, no smoothing, no skin retouching — raw pore-level detail preserved, --style: ultra-realistic hyperdetail beauty editorial, Vogue Italia / W Magazine aesthetic, 8K resolution, 16-bit color depth

Generated by Grok Imagine

Generated by Qwen Image 2.0

Generated by Nano Banana 2

Apa yang Dapat Anda Lakukan dengan Model Grok Imagine

Temukan apa yang dapat Anda bangun dengan Grok Imagine API, mulai dari visual merek yang fotorealistis dan poster iklan multibahasa hingga pameran video produk, animasi potret, dan pengeditan berbasis referensi.

Visual Merek Fotorealistik

Grok Imagine Image Quality API memungkinkan kreator dan pengembang untuk menghasilkan visual fotorealistik yang menampilkan pencahayaan alami, tekstur kaya, dan fisika yang dapat dipercaya. Ideal bagi tim pemasaran dan studio desain yang mengejar hasil setara kualitas studio, API ini merender resolusi 2K yang tajam dan detail material yang nyata—mendukung gambar utama (hero images), materi iklan, dan render produk kelas atas.

Desain Poster dan Iklan Multibahasa

Untuk konten kreatif yang didistribusikan secara global, Grok Imagine Image Quality API menghasilkan gambar dengan rendering teks terbaik di kelasnya, tipografi multibahasa yang akurat, dan integrasi karakter yang bersih secara langsung ke dalam karya seni. Kasus penggunaan ini cocok untuk agensi periklanan, spesialis lokalisasi, dan perancang merek yang memproduksi visual yang memerlukan teks yang terbaca dan sesuai dengan merek yang disematkan ke dalam gambar akhir.

Pengeditan Gambar Berbasis Referensi

Grok Imagine Image Quality API memberdayakan desainer untuk menyempurnakan dan menata ulang visual yang ada melalui kepatuhan prompt yang lebih ketat, masukan berbasis referensi, dan kontrol komposisi yang akurat. Ideal untuk produksi kreatif berulang dan alur kerja konsistensi merek, API ini mempertahankan koherensi gaya di seluruh pengeditan—mendukung penyempurnaan konsep, variasi desain, dan aset akhir yang disempurnakan untuk kampanye komersial.

Presentasi Produk Sinematik

Grok Imagine Video Text-to-Video API memungkinkan kreator dan pengembang untuk menghasilkan urutan video sinematik dari satu prompt teks, lengkap dengan audio bawaan dan resolusi hingga 720p. Ideal untuk tim pemasaran dan studio konten yang mengejar output video siap produksi, API ini merender gerakan dinamis, pergerakan kamera yang alami, dan suara yang disinkronkan—mendukung kampanye merek, konten media sosial, dan narasi periklanan yang imersif.

Animasi Potret dan Produk

Bagi kreator yang ingin menghidupkan visual statis, API Image-to-Video Grok Imagine Video mengubah gambar diam menjadi klip video yang mengalir dan fotorealistis, dengan gambar sumber dijadikan sebagai bingkai pertama. Kasus penggunaan ini cocok untuk merek e-commerce, seniman digital, dan tim periklanan yang memproduksi pameran produk animasi, animasi potret, dan konten yang menghidupkan adegan yang menuntut kesinambungan visual dari aset aslinya.

Retouching Video Non-Destruktif

Untuk tim pascaproduksi dan agensi kreatif yang memerlukan modifikasi yang tepat dan tertarget pada rekaman yang ada, Grok Imagine Video Edit API menerapkan instruksi bahasa alami ke video yang sudah ada sambil mempertahankan adegan, gerakan, dan komposisi aslinya. Kasus penggunaan ini cocok untuk editor video, produser pemasaran, dan tim merek yang menyempurnakan rekaman kampanye—memungkinkan penambahan properti, perubahan pakaian, dan penataan ulang visual tanpa mengganggu struktur dasar video.

Perbandingan Model

Lihat bagaimana model dari berbagai penyedia dibandingkan — bandingkan performa, harga, dan keunggulan unik untuk membuat keputusan yang tepat.

Model	Batas Gambar Referensi	Jumlah Output	Resolusi	Rasio aspek
Grok Imagine Image Quality	8	1~4	2K, 1K	Auto, 1:1, 3:2, 2:3, 3:4, 4:3, 9:16, 16:9, 9:19.5, 19.5:9, 9:20, 20:9, 1:2, 2:1
Nano Banana 2	14	1	4K, 2K, 1K	1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
Nano Banana Pro	10	1	4K, 2K, 1K	1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
Seedream 5.0 Lite	14	1~15	2K~4K+	1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9
Qwen-Image	3	1~6	512P~2K	Width[512, 2048]px, Height[512, 2048]px

Cara Menggunakan Grok Imagine di Atlas Cloud

Mulai dalam hitungan menit — ikuti langkah-langkah sederhana berikut untuk mengintegrasikan dan men-deploy model melalui platform Atlas Cloud.

Buat Akun Atlas Cloud

Daftar di atlascloud.ai dan selesaikan verifikasi. Pengguna baru mendapatkan kredit gratis untuk menjelajahi platform dan menguji model.

Mengapa Menggunakan Grok Imagine di Atlas Cloud

Gabungkan model Grok Imagine canggih dengan platform akselerasi GPU Atlas Cloud untuk performa, skalabilitas, dan pengalaman pengembangan yang tak tertandingi.

Performa & Fleksibilitas

Latensi Rendah:
Inferensi yang dioptimalkan GPU untuk respons real-time.

API Terpadu:
Satu integrasi untuk Grok Imagine, GPT, Gemini, dan DeepSeek.

Harga Transparan:
Billing per token, mendukung mode Serverless.

Enterprise & Skala

Pengalaman Developer:
SDK, analitik data, alat fine-tuning, dan template tersedia lengkap.

Keandalan:
Ketersediaan 99.99%, kontrol izin RBAC, logging kepatuhan.

Keamanan & Kepatuhan:
Sertifikasi SOC 2 Type II, kepatuhan HIPAA, kedaulatan data AS.

Pertanyaan Umum Grok Imagine API

Grok Imagine Image Quality adalah model pengeditan gambar dan teks-ke-gambar berketepatan tinggi dari xAI, dirancang untuk memberikan visual fotorealistik dengan rendering teks yang lebih kuat, kepatuhan pada prompt yang lebih ketat, dan detail yang lebih kaya daripada model Grok Imagine Image standar.

Model ini mendukung pembuatan gambar hingga resolusi 2K, dengan detail yang sangat tajam, pencahayaan alami, tekstur yang kaya, dan fisika realistis yang cocok untuk gambar hero, materi iklan, dan render produk.

Grok Imagine Image Quality menawarkan rendering teks terbaik di kelasnya dengan dukungan multibahasa yang lebih kuat, menghasilkan tipografi yang dapat dibaca secara langsung di dalam gambar yang dihasilkan — ideal untuk poster, grafik media sosial, dan materi iklan kreatif.

Quality Mode trades slightly higher latency for noticeably better output—more accurate compositions, stronger text rendering, and greater realism—making it the recommended choice for final visuals such as ads, hero images, and client deliverables.

API ini mendukung 16:9 (layar lebar), 9:16 (seluler/stories), 1:1 (media sosial), 4:3, 3:2, dan format potret yang setara—mencakup semua format platform utama untuk materi iklan, konten sosial, dan produksi sinematik.

Text-to-Video dan Image-to-Video mendukung durasi hingga 15 detik, Reference-to-Video hingga 10 detik, dan Video Edit mempertahankan panjang rekaman asli dengan batas maksimal 8,7 detik. Semua mode menghasilkan output dalam format 720p HD atau 480p, dan format 720p direkomendasikan untuk output materi iklan kreatif dan kualitas merek.

Ya. Grok Imagine Video API dilengkapi dengan pembuatan audio native, yang secara otomatis menghasilkan efek suara tersinkronisasi, musik latar, dan audio ambien yang disesuaikan dengan konten visual—tidak memerlukan alur kerja pascaproduksi yang terpisah.

Ya. Grok Imagine Video Reference-to-Video API menerima hingga 7 gambar referensi untuk mempertahankan identitas, pakaian, dan komposisi adegan yang konsisten di seluruh video—ideal untuk uji coba virtual, penempatan produk, dan penceritaan dengan karakter yang konsisten.

Jelajahi Lebih Banyak Seri

Seedance 2.0

API Seedance 2.0 memberi Anda akses produksi ke model video multimodal milik ByteDance — input quad-modal (teks, gambar, video, audio) dan sistem "Universal Reference" terkemuka di industri yang mengunci komposisi, pergerakan kamera, dan aksi karakter di berbagai bidikan. Integrasikan kontrol tingkat sutradara dengan satu panggilan API, tarif tetap $0,09/dtk, kunci instan, dan tanpa daftar tunggu — didukung oleh waktu aktif dan kepatuhan tingkat perusahaan. Seedance 2.0 Native 4K kini telah hadir!

Lihat Seri

Grok Imagine

Lihat Seri

Gemini Omni Flash

Gemini Omni API menghadirkan model pembuatan dan pengeditan video multimodal dari Google DeepMind, yang diperkenalkan di Google I/O 2026, ke stack Anda. Gemini Omni memadukan mesin penalaran Gemini dengan media generatif, menerima kombinasi apa pun dari teks, gambar, video, dan audio untuk menghasilkan output yang konsisten dan berlandaskan pengetahuan. Sempurnakan hasil lewat percakapan alami — ganti objek, tulis ulang adegan, dan ubah gaya, sementara fisika, karakter, dan kontinuitas tetap terjaga. Atlas Cloud menyediakan seluruh lini Gemini Omni Flash — text-to-video, image-to-video dengan hingga 7 gambar referensi, dan reference-to-video — melalui satu API terpadu dengan harga per detik yang transparan mulai dari $0.112 tanpa langganan. Mulai bangun hari ini.

Lihat Seri

GPT Image 2

API GPT Image 2 memberi pengembang akses ke model gambar terbaru OpenAI, penerus GPT Image 1.5. Model ini menghasilkan dan mengedit gambar dengan rendering teks yang akurat di seluruh skrip Latin dan CJK, ditambah komposisi yang kuat untuk poster, mockup, dan infografis. Di Atlas Cloud, Anda dapat mengaksesnya melalui satu API terpadu bersama 300+ model, dengan kredit gratis, waktu operasi 99,99%, dan tanpa memerlukan verifikasi organisasi OpenAI.

Lihat Seri

Google

Model kreatif paling kuat dari Google semuanya tersedia di Atlas Cloud. Veo 3.1 menghadirkan pembuatan video sinematik, Nano Banana 2 memberdayakan pembuatan gambar dengan fidelitas tinggi, dan Gemini membawa kecerdasan multimodal ke setiap alur kerja. Akses rangkaian lengkap model Google melalui satu API key dengan ketersediaan Day-0 dan harga bayar sesuai pemakaian (pay-as-you-go).

Lihat Seri

Seedance 2.0 Mini

Seedance 2.0 Mini menghadirkan pembuatan video multimodal dari ByteDance ke alur kerja di mana kecepatan dan biaya adalah hal yang paling utama. Model ini memberikan kemampuan inti dari Seedance 2.0 dengan penggunaan sumber daya yang lebih ringan — pembuatan yang lebih cepat, biaya per video yang lebih rendah, dan integrasi API yang sama dengan yang sudah Anda gunakan. Untuk tim yang menjalankan pipeline bervolume tinggi atau pembuatan prototipe dalam skala besar, Mini adalah pilihan default yang praktis.

Lihat Seri

ByteDance

Dari pembuatan video sinematik hingga penciptaan gambar dengan fidelitas tinggi, model paling kuat dari ByteDance kini tersedia di Atlas Cloud. Jalankan Seedance dan Seedream dalam skala besar dengan harga inferensi terendah dan tanpa biaya overhead infrastruktur.

Lihat Seri

Alibaba

Atlas Cloud menyatukan seluruh jajaran model Alibaba di bawah satu API: Qwen untuk tugas bahasa dan gambar, Wan untuk pembuatan video hingga 1080p. Akses setiap model dengan sistem bayar sesuai pemakaian (pay-as-you-go) tanpa berlangganan. Alibaba API tersedia melalui satu URL dasar (base URL) menggunakan klien yang kompatibel dengan OpenAI Anda saat ini.

Lihat Seri

OpenAI

Atlas Cloud memberi Anda akses ke seluruh jajaran OpenAI API, mulai dari GPT Image 2 untuk pembuatan gambar hingga Sora 2 untuk video. Setiap model tersedia dengan sistem bayar sesuai penggunaan (pay-as-you-go) tanpa komitmen bulanan. Lakukan integrasi hanya dengan satu pertukaran URL dasar menggunakan API yang kompatibel dengan OpenAI.

Lihat Seri

xAI

Bangun pipeline gambar dan video yang lengkap menggunakan xAI API di Atlas Cloud. Hasilkan pada resolusi 2K, edit dengan gambar referensi, dan animasikan gambar menjadi klip yang disinkronkan dengan audio.

Lihat Seri

Kwaivgi

Kwaivgi API dengan harga 15% di bawah harga standar. Atlas Cloud memberikan akses Day-0 ke rilis Kling terbaru dengan harga pay-as-you-go (bayar sesuai pemakaian) dan tanpa batasan pengguna (seat limits). Satu akun, satu kunci, setiap model Kling dari tingkat standar hingga master.

Lihat Seri

Seedream 5.0 Pro

API Seedream 5.0 Pro memberi pengembang model pengeditan gambar yang dapat dikontrol dari ByteDance di Atlas Cloud. Ini menempatkan editan secara presisi dengan jangkar dan koordinat, memisahkan gambar menjadi lapisan yang dapat diedit, menggabungkan banyak referensi, dan mencocokkan warna dan bahan secara persis, dengan teks multibahasa pada 2K dan 3K. Di Atlas Cloud, Anda dapat mengaksesnya melalui satu kunci!

Lihat Seri

Satu API untuk semua AI multimedia.

Jelajahi semua model

Grok Imagine API for xAI Image, Video, and Audio

Jelajahi Model Terkemuka

xAI TTS v1

Grok Imagine Video v1.5 Image-to-Video

Grok Imagine Image Quality Text-to-Image

Grok Imagine Image Quality Edit

Grok Imagine Video Text-to-Video

Grok Imagine Video Image-to-Video

Grok Imagine Video Reference-to-Video

Grok Imagine Video Extend

Grok Imagine Video Edit

Grok Imagine Image Edit

Grok Imagine Image Text-to-Image

Kecepatan puncak

Fitur Utama Grok Imagine API

Perenderan Resolusi Ultra-Tinggi menggunakan API Kualitas Gambar Grok Imagine

Perenderan Teks Multibahasa

Pembuatan Gambar Fotorealistis

Kontrol Prompt Presisi dan Pengeditan Berbasis Referensi

Pembuatan Audio Video Native

Pembuatan Video Multimodal

Kontrol Gerakan dan Konsistensi

Perbandingan Model dengan Satu Prompt

Apa yang Dapat Anda Lakukan dengan Model Grok Imagine

Visual Merek Fotorealistik

Desain Poster dan Iklan Multibahasa

Pengeditan Gambar Berbasis Referensi

Presentasi Produk Sinematik

Animasi Potret dan Produk

Retouching Video Non-Destruktif

Perbandingan Model

Cara Menggunakan Grok Imagine di Atlas Cloud

Buat Akun Atlas Cloud

Mengapa Menggunakan Grok Imagine di Atlas Cloud

Performa & Fleksibilitas

Enterprise & Skala

Pertanyaan Umum Grok Imagine API

Jelajahi Lebih Banyak Seri

Seedance 2.0

Grok Imagine

Gemini Omni Flash

GPT Image 2

Google

Seedance 2.0 Mini

ByteDance

Alibaba

OpenAI

xAI

Kwaivgi

Seedream 5.0 Pro

Satu API untuk semua AI multimedia.

Join our Discord community