Wir haben jede Zeile der Dokumentation zu den Bildbearbeitungsfunktionen von Grok xAI gelesen. Hier erfahren Sie, was Grok tatsächlich kann

Ja. Grok Imagine unterstützt die Bearbeitung in natürlicher Sprache, 3-Bild-Komposition, sechs Stilübertragungen sowie Video. Entwicklerpreise und Integrationsleitfaden für 2026.

Wir haben jede Zeile der Dokumentation zu den Bildbearbeitungsfunktionen von Grok xAI gelesen. Hier erfahren Sie, was Grok tatsächlich kann

title: Verfügt Grok xAI im Jahr 2026 tatsächlich über Bildbearbeitung? Update vom Mai

description: Ja. Grok Imagine unterstützt Bearbeitung per natürlicher Sprache, 3-Bild-Compositing, sechs Stilübertragungen und Video. Entwicklerpreise und Integrationsleitfaden für 2026.

Slug: grok-xai-image-editing-capabilities

H1: Wir haben jede Zeile der Dokumentation zu Grok xAIs Bildbearbeitung gelesen. Das kann Grok wirklich

Ja, Grok AI verfügt im Jahr 2026 definitiv über Bildbearbeitungsfunktionen. Die Imagine-API von xAI unterstützt die Bearbeitung mittels natürlicher Sprache und das Compositing von bis zu 3 Quellbildern. Die Preise beginnen bei USD0.02 pro Bild für das Standardmodell grok-imagine-image und bei USD0.05 pro Bild (1K; USD0.07 bei 2K) für das qualitativ hochwertigere Modell grok-imagine-image-quality. Beachten Sie, dass Bildbearbeitungen sowohl für das Eingabebild als auch für das generierte Ausgabebild berechnet werden, sodass sich die effektiven Kosten pro Bearbeitung aus der Summe beider ergeben (xAI Docs, 2026). Dieser Leitfaden behandelt alle Funktionen, Parameter und Preisdetails, die Entwickler zur Evaluierung der Plattform benötigen.

Verfügt Grok AI im Jahr 2026 über Bildbearbeitungsfunktionen?

Grok AI bietet 2026 tatsächlich Bildbearbeitungsfunktionen, die umfangreicher sind, als viele Entwickler erwarten. Laut der offiziellen Dokumentation von xAI (xAI Imagine Overview, Mai 2026) unterstützt die Plattform Bildbearbeitung zu USD0.02/Bild, Multi-Bild-Bearbeitung mit bis zu 3 Quellbildern, Bildgenerierung bis zu 2K-Auflösung und Bild-zu-Video-Konvertierung zu USD0.05/Sekunde.

Der Funktionsumfang ist in diesem Jahr deutlich gewachsen. xAI dokumentiert nun neben den grundlegenden Bildwerkzeugen auch Videobearbeitung, Videoerweiterung und Referenz-zu-Video-Workflows. Die Plattform verfügt über SOC 2 Type II-, HIPAA-Eligible- und DSGVO-Konformitätszertifizierungen, was sie für Projekte in regulierten Branchen geeignet macht. Laut xAI-Dokumentation "unterliegen generierte Medien einer Inhaltsüberprüfung und werden nicht für das Training verwendet" – eine wichtige Verpflichtung zum Datenschutz für Unternehmensteams.

Wenn Sie sich fragen, ob Grok AI im Jahr 2026 Bildbearbeitungsfunktionen hat, lautet die Antwort: Ja, und die Möglichkeiten gehen weit über die einfache Text-zu-Bild-Generierung hinaus.

Zitierkapsel: Die Imagine-API von xAI unterstützt (Stand: 12. Mai 2026) Bildbearbeitung zu USD0.02/Bild mit bis zu 3 Referenzbildern pro Anfrage und einer Ausgabe in 1K/2K-Auflösung. Die Plattform ist SOC 2 Type II zertifiziert und HIPAA-fähig, womit sie sich für produktive Unternehmens-Workloads eignet.

Grok xAI Bildgenerierungsfunktionen: Modelle, Preise und API-Parameter (2026)

Das Thema Grok-AI-Bildgenerierungsfunktionen 2026 dreht sich um eine wichtige Änderung: grok-imagine-image-pro wurde zum 15. Mai 2026 eingestellt. Laut der Modell-Seite von xAI (xAI Models, 2026) sollten alle neuen Anfragen das Modell grok-imagine-image-quality zu USD0.055/Bild nutzen. Das Standardmodell grok-imagine-image bleibt für kostenbewusste Workloads zu USD0.02/Bild verfügbar.

Was bietet Ihnen die Generierungs-API konkret? Hier ist die Aufschlüsselung der Parameter.

Grok xAI Bildgenerierung: Seitenverhältnisse und Auflösungsoptionen

Das Modell grok-imagine-image-quality unterstützt 14 verschiedene Seitenverhältnisse: 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 2:1, 1:2, 19.5:9, 9:19.5, 20:9, 9:20 und auto. Die Auflösungsoptionen sind 1K oder 2K. Das Verhältnis "auto" lässt das Modell die beste Anpassung aus dem Prompt ableiten, was für allgemeine Generierungsaufgaben gut funktioniert (xAI Image Generation, Mai 2026).

Stapelverarbeitung (Batch) und Ausgabeformate

Benötigen Sie mehrere Bilder aus einem Prompt? Die Methode sample_batch() akzeptiert einen n-Parameter, um mehrere Variationen in einem einzigen API-Aufruf zurückzugeben. Jede Antwort kann Bilder als temporäre URLs oder als base64-kodierte Daten liefern. Wenn Sie URLs verwenden, laden Sie diese zeitnah herunter, da xAI keine langfristige Verfügbarkeit garantiert.

Jede Antwort enthält auch ein Feld

text
1respect_moderation
. Überprüfen Sie dieses, bevor Sie die Ausgabe weiterverarbeiten. Es gibt an, ob das generierte Bild die Inhaltsüberprüfung bestanden hat.

Gleichzeitige Grok-Bildgenerierungsanfragen

Für Pipelines mit hohem Durchsatz verwenden Sie den

text
1AsyncClient
von Python in Kombination mit
text
1asyncio.gather()
, um parallele Anfragen für verschiedene Prompts auszulösen. Dies ist das in der xAI-Dokumentation empfohlene Muster für Parallelität.

Zitierkapsel: Stand 14. Mai 2026 unterstützt das Modell grok-imagine-image-quality von xAI 14 Seitenverhältnisse (einschließlich 19.5:9 und 9:19.5 für mobile Formate), 1K- und 2K-Auflösung sowie die Stapelgenerierung über die Methode sample_batch() mit einem n-Parameter. Die Ausgabe enthält ein Feld

text
1respect_moderation
zur Validierung der Inhaltsrichtlinien.

So funktioniert die Grok xAI Bildbearbeitung: Stilübertragung, Multi-Turn-Bearbeitung und mehr

Die Grok-xAI-Bildbearbeitungsfunktionen, die die meisten Entwickler unterschätzen, sind die Stilübertragungsoptionen und Multi-Turn-Bearbeitungsketten. Der Bearbeitungs-Endpunkt von xAI akzeptiert ein Quellbild entweder als öffentliche URL oder als base64-kodierten Daten-URI und wendet dann eine Anweisung in natürlicher Sprache an, um es zu transformieren (xAI Image Editing, Mai 2026).

Grok xAI Bildbearbeitung: Stilübertragungsoptionen

Mit grok-imagine-image-quality können Sie sechs dokumentierte Stilübertragungen anfordern: Ölgemälde mit impressionistischer Technik, Bleistiftskizze, Pop-Art, Anime, Aquarell und ultra-realistische Fotografie. Dies sind keine einfachen Filter-Overlays. Das Modell interpretiert den strukturellen Inhalt Ihres Quellbildes und rendert es im Zielstil neu.

Multi-Turn-Bearbeitungsketten

Hier wird es für komplexe Workflows interessant. Sie können Bearbeitungen verketten, indem Sie die Ausgabe eines API-Aufrufs als Quellbildeingabe für den nächsten verwenden. Das Modell speichert den Status der Sitzung nicht serverseitig, daher verwaltet Ihre Anwendung die Bildübergabe. Dieser Multi-Turn-Ansatz ermöglicht es Ihnen, iterative Bearbeitungs-Pipelines zu erstellen: Beginnen Sie mit einer groben Komposition, verfeinern Sie die Beleuchtung und wenden Sie dann einen Stil an – alles durch aufeinanderfolgende API-Aufrufe.

xAI Bildbearbeitungs-API: Inkompatibilität mit dem OpenAI SDK

Dies ist ein wichtiger Integrationshinweis. Die Methode

text
1images.edit()
des OpenAI SDK funktioniert nicht mit dem Bearbeitungs-Endpunkt von xAI. Das OpenAI SDK sendet
text
1multipart/form-data
, aber die API von xAI erfordert
text
1application/json
. Verwenden Sie stattdessen das xAI SDK, das Vercel AI SDK oder direkte HTTP-Anfragen. Teams, die dieses Detail ignorieren, werden Stunden damit verbringen, einen vermeintlichen Authentifizierungsfehler zu debuggen, bei dem es sich tatsächlich um einen Content-Type-Konflikt handelt.

Die meisten Integrationsanleitungen für die xAI-Bildbearbeitung lassen die Inkompatibilität mit dem OpenAI SDK komplett aus, aber dies ist der häufigste Fehlerpunkt bei der Integration. Das Problem sind nicht die Berechtigungen oder API-Schlüssel, sondern das Anfrageformat. Der Wechsel auf direktes HTTP oder das xAI SDK löst das Problem sofort.

Zitierkapsel: Der Bildbearbeitungs-Endpunkt von xAI akzeptiert Quellbilder als öffentliche URLs oder base64-Daten-URIs und unterstützt sechs Stilübertragungen über grok-imagine-image-quality. Die Methode

text
1images.edit()
des OpenAI SDK ist ausdrücklich inkompatibel, da sie
text
1multipart/form-data
sendet, während xAI
text
1application/json
benötigt. Entwickler müssen das xAI SDK, das Vercel AI SDK oder direkte HTTP-Anfragen nutzen.

Grok xAI Bildbearbeitungsfunktionen und Face-Swap: Was Entwickler wirklich bauen können

Das Thema "Grok xAI Bildbearbeitungsfunktionen Face-Swap" ist eines der meistgesuchten rund um die Imagine-API, und die ehrliche Antwort erfordert etwas Differenzierung. xAI dokumentiert in seiner Entwicklerdokumentation keine Funktion namens "Face-Swap" (xAI Multi-Image Editing, 2026). Was jedoch dokumentiert ist, ist die Multi-Bild-Bearbeitung, die bis zu 3 Quellbilder pro Anfrage verarbeitet.

Was können Sie also tatsächlich bauen?

Multi-Bild-Bearbeitung für die Subjektübertragung

Der Multi-Bild-Bearbeitungs-Endpunkt akzeptiert bis zu 3 Quellbilder in einer einzigen Anfrage. Die Bilder werden in der Reihenfolge verarbeitet, in der sie gesendet werden. Das Seitenverhältnis entspricht standardmäßig dem des ersten Eingabebildes, kann aber mit dem Parameter

text
1aspect_ratio
überschrieben werden. Dokumentierte Anwendungsfälle sind das Kombinieren von Motiven aus verschiedenen Fotos, das Übertragen von Stilen über Bilder hinweg und das Komponieren von Szenen aus mehreren Referenzen.

Ein Entwickler kann ein Porträtfoto als Bild 1 und eine Zielszenen-Vorlage als Bild 2 senden und einen Prompt in natürlicher Sprache schreiben wie: "Platziere die Person aus dem ersten Bild in die Szene aus dem zweiten Bild." Das Modell übernimmt die Verschmelzung. xAI nennt dies nicht "Face-Swap", aber das kompositorische Ergebnis kann je nach Formulierung des Prompts ähnliche Ergebnisse liefern.

Bei unseren Tests von Multi-Bild-Bearbeitungs-Workflows spielt die Spezifität des Prompts eine große Rolle. Vage Prompts wie "Füge diese Bilder zusammen" führen zu inkonsistenten Ergebnissen. Explizite Prompts, die die Platzierung des Motivs, die Angleichung der Beleuchtung und die Beibehaltung des Hintergrunds beschreiben, liefern wesentlich bessere Kompositionen. Wenn Sie den Endpunkt wie eine Photoshop-Anweisung in natürlicher Sprache behandeln, erzielen Sie die besten Ergebnisse.

Einschränkungen beim Grok-Face-Swap: Was die Bildbearbeitung nicht kann

Erwarten Sie keine pixelgenaue Übertragung von Gesichtszügen bei dramatisch unterschiedlichen Posen oder Beleuchtungsbedingungen. Das Modell ist ein generatives System, kein forensisches Werkzeug für Gesichtserkennung. Für Produktionsanwendungen, die eine strikte Identitätsbewahrung erfordern, müssen Sie durch Tests evaluieren, ob die Ausgabequalität Ihren Standards entspricht.

Zitierkapsel: Der Multi-Bild-Bearbeitungs-Endpunkt von xAI akzeptiert bis zu 3 Quellbilder pro Anfrage, wobei das Seitenverhältnis standardmäßig dem des ersten Eingabebildes entspricht. Obwohl xAI keine "Face-Swap"-Funktion dokumentiert, können Prompts in natürlicher Sprache das Modell anweisen, Motive zwischen Szenen zu übertragen. Dokumentierte Anwendungsfälle sind Szenenkomposition, Motivkombination und Stilübertragung über mehrere Referenzen hinweg.

Grok AI Bildanalyse-Funktionen: Visuelles Verständnis mit Grok 4.3

Die Grok-AI-Bildanalyse-Funktionen befinden sich in einem separaten Teil des Stacks als die Imagine-API. Das Bildverständnis nutzt grok-4.3 über den Endpunkt

text
1https://api.x.ai/v1/responses
, nicht den Bildgenerierungs-Endpunkt (xAI Image Understanding, 2026). Es ist wichtig, diese beiden Systeme in Ihrer Architektur getrennt zu halten.

Grok AI Bildanalyse: Eingabespezifikationen

Jedes Bild kann bis zu 20 MiB groß sein. Akzeptierte Formate sind JPEG/JPG und PNG. Der optionale Parameter

text
1"detail": "high"
ermöglicht eine tiefere visuelle Analyse für komplexe Bilder, bei denen feine Details wichtig sind, wie z. B. bei technischen Diagrammen oder dichten Dokumentenscans.

Der Endpunkt unterstützt mehrere Bilder pro Anfrage und akzeptiert eine beliebige Mischung aus Bild- und Texteingaben in beliebiger Reihenfolge. Diese Flexibilität ist nützlich für Vergleichsaufgaben, bei denen Sie beispielsweise zwei Produktbilder senden und das Modell bitten können, die Unterschiede zu beschreiben.

Grok Bildanalyse: Anforderungen an die Datenverarbeitung

Die Dokumentation von xAI rät Entwicklern ausdrücklich davon ab, den Anfrage-/Antwortverlauf auf dem Server zu speichern, wenn Bilder gesendet werden. Für datenschutzsensible Anwendungen bedeutet dies, dass Ihre Bildverarbeitungs-Pipeline keine rohen Bild-Payloads dauerhaft protokollieren sollte. Bauen Sie Ihre Protokollierungsstrategie eher auf Metadaten als auf den Bildinhalt auf.

Grok xAI Bildgenerierungsfunktionen und Flux: Fakten von Fiktion trennen

Die Verwirrung um die Grok-xAI-Bildgenerierungsfunktionen und Flux ist in Entwickler-Communities weit verbreitet. Hier ist die faktische Trennung: Flux ist eine Modellfamilie, die von Black Forest Labs entwickelt wurde. Sie ist kein Teil von xAI oder Grok. Die beiden Systeme sind völlig verschieden und stammen von unterschiedlichen Unternehmen (Atlas Cloud Model Catalog, 2026).

Die Bildgenerierung von Grok nutzt eigene proprietäre Modelle: grok-imagine-image-quality und grok-imagine-image. Es gibt keine Flux-Engine, die im Hintergrund der Imagine-API läuft.

Warum hält sich die Verwirrung? Wahrscheinlich, weil sowohl Flux als auch Grok Imagine über Aggregator-Plattformen wie Atlas Cloud verfügbar sind, wo sie nebeneinander im gleichen Modellkatalog erscheinen. Das Auflisten der beiden führt bei einigen Entwicklern zu der Annahme, sie seien verwandt.

Wenn Sie speziell Flux-Modelle wünschen, ist "Flux Kontext Dev" auf Atlas Cloud für USD0.025/Bild und "Flux Kontext Dev Lora" für USD0.03/Bild verfügbar. Dies sind separate Modellauswahlen, keine Komponenten von Grok. Evaluieren Sie diese unabhängig basierend auf Ihren Qualitäts- und Kostenanforderungen.

Die Vermischung von Flux und Grok taucht auch in Online-Benchmark-Vergleichen auf, wo Tester manchmal Grok-Prompts gegen Flux-Ausgaben laufen lassen, ohne den Modellunterschied offenzulegen. Wenn Sie eine Bewertung der "Grok-Bildqualität" lesen, prüfen Sie, ob der Autor verifiziert hat, welches Modell er tatsächlich aufgerufen hat.

Zitierkapsel: Flux ist eine Modellfamilie von Black Forest Labs und steht in keiner Verbindung zu xAI oder der Grok Imagine-API. Grok verwendet proprietäre Modelle, darunter grok-imagine-image-quality (USD0.055/Bild) und grok-imagine-image (USD0.02/Bild). Flux Kontext Dev ist separat auf Atlas Cloud für USD0.025/Bild als eigenständiges Produkt verfügbar.

Grok xAI NSFW-Bildgenerierungsfunktionen: Was die Inhaltsrichtlinie 2026 abdeckt

Das Thema Grok-xAI-NSFW-Bildgenerierungsfunktionen 2026 ist ein Bereich, in dem die offizielle Dokumentation den Rahmen vorgibt, ohne ins Detail zu gehen. Jede Antwort der Imagine-API enthält ein Feld

text
1respect_moderation
, das angibt, ob das generierte Bild die Inhaltsüberprüfung von xAI bestanden hat. Bilder, die die Moderation nicht bestehen, werden nicht in verwertbarer Form zurückgegeben.

Die Haltung von xAI ist klar: "Generierte Medien unterliegen der Inhaltsüberprüfung und werden nicht für das Training verwendet." Die Imagine-APIs werden als "für produktive Workloads mit strengen Sicherheits- und Compliance-Anforderungen gebaut" beschrieben. Diese Formulierung entspricht eher unternehmensweiten Inhaltskontrollen als freizügigen Generierungsplattformen.

Die Entwicklerdokumentation zählt spezifische verbotene Inhaltskategorien nicht im Detail auf. Für ein vollständiges, aktuelles Verständnis dessen, was erlaubt ist und was nicht, müssen Sie die offiziellen Nutzungsbedingungen von xAI direkt einsehen. Inhaltsrichtlinien in diesem Bereich ändern sich häufig, und das Lesen der Nutzungsbedingungen ist besser, als sich auf Zusammenfassungen Dritter zu verlassen.

Was sollten Sie darauf aufbauen? Gestalten Sie Ihre Pipeline so, dass sie mit Moderations-Ablehnungen reibungslos umgeht. Prüfen Sie das Feld

text
1respect_moderation
, bevor Sie die Ausgabe an Ihre Benutzer weitergeben, und implementieren Sie eine Fallback-Logik für abgelehnte Generierungen. Gehen Sie nicht davon aus, dass jeder Prompt in der Produktion die Moderation besteht.

So greifen Sie über Atlas Cloud auf die Grok xAI Bildfunktionen zu

Atlas Cloud bietet über eine einzige einheitliche API Zugriff auf Grok Imagine sowie auf über 300 kuratierte KI-Modelle. Für Teams, die mehrere Bildmodelle evaluieren möchten, ohne mehrere Anbieterbeziehungen und Abrechnungskonten zu verwalten, ist dieser einheitliche Zugriff äußerst wertvoll.

Preisvergleich: xAI direkt vs. Atlas Cloud

FeaturexAI DirectAtlas Cloud
grok-imagine-image-qualityUSD0.05/Bild (1K) · USD0.07/Bild (2K)USD0.055/Bild
grok-imagine-imageUSD0.02/BildNicht angeboten
grok-imagine-videoUSD0.05/Sek. (480p) · USD0.07/Sek. (720p)Nicht angeboten
Andere BildmodelleNur Grok Imagine27+ Bild-zu-Bild-Modelle inkl. Flux Kontext Dev, GPT Image 2, Qwen, Seedream
API-Format (nur LLM)xAI SDK / HTTPOpenAI Chat Completions-Format für LLM-Endpunkte
ComplianceSOC 2, HIPAA, DSGVOSOC 2, HIPAA
ModellkatalogGrok LLMs + Imagine + Voice300+ Modelle

Atlas Cloud bietet grok-imagine-image-quality zum gleichen Preis von USD0.055/Bild wie xAI direkt an, inklusive konsolidierter Abrechnung, Zugriff auf 300+ Modelle unter einer API und verwalteter Compliance-Infrastruktur. Für Teams, die Multi-Modell-Pipelines aufbauen, beseitigt das Vorhandensein von Grok Imagine, Flux Kontext Dev und über 25 weiteren Bildmodellen unter einem Konto den erheblichen Verwaltungsaufwand für Anbieter.

Die LLM-Endpunkte von Atlas Cloud folgen dem OpenAI Chat Completions-Format, was die LLM-Integration für Teams vereinfacht, die bereits OpenAI-kompatible Tools verwenden. Beachten Sie, dass dieses OpenAI-kompatible Format nur für LLM-Endpunkte gilt. Bild- und Video-Endpunkte verwenden das xAI SDK oder direktes HTTP, im Einklang mit den API-Anforderungen von xAI.

Atlas Cloud ist SOC 2 zertifiziert und HIPAA-konform, arbeitet mit Pay-as-you-go-Preisen ohne Mindestumsätze und bietet Zugriff auf über 27 Bild-zu-Bild-Modelle jenseits von Grok Imagine, einschließlich Flux Kontext Dev zu USD0.025/Bild, GPT Image 2 Edit, Nano Banana 2, Qwen Image 2.0 und der Seedream-Serie.

Zitierkapsel: Die proprietären Grok Imagine-Modelle von xAI kosten auf der eigenen Plattform USD0.05/Bild (1K) / USD0.07/Bild (2K) für grok-imagine-image-quality und USD0.02/Bild für grok-imagine-image (Bearbeitungen werden sowohl für das Eingabe- als auch für das Ausgabebild berechnet; die Zahlen exklusive der Eingabegebühr pro Bild). Der Drittanbieter-Aggregator Atlas Cloud verkauft grok-imagine-image-quality separat für USD0.055/Bild (Text-zu-Bild und Bearbeitung, gleicher Tarif) und bietet Flux Kontext Dev als eigenständiges Produkt für USD0.025/Bild an.

Häufig gestellte Fragen (FAQ)

Verfügt Grok AI im Jahr 2026 über Bildbearbeitungsfunktionen?

Ja. Die Grok Imagine-API unterstützt Bildbearbeitung per natürlicher Sprache für USD0.02/Bild, Multi-Bild-Bearbeitung mit bis zu 3 Quellbildern, Stilübertragung über sechs Ästhetiken und Multi-Turn-Bearbeitungsketten. Das empfohlene Modell für neue Projekte ist grok-imagine-image-quality zu USD0.055/Bild.

Kann ich das OpenAI SDK für die Grok-Bildbearbeitung verwenden?

Nein. Die Methode

text
1images.edit()
des OpenAI SDK ist inkompatibel mit dem Bearbeitungs-Endpunkt von xAI, da sie
text
1multipart/form-data
sendet, während xAI
text
1application/json
erfordert. Verwenden Sie das xAI SDK, das Vercel AI SDK oder direkte HTTP-Anfragen. Diese Inkompatibilität betrifft nur die Bildbearbeitung, nicht die LLM-Endpunkte.

Unterstützt Grok Imagine "Face-Swap"?

xAI dokumentiert kein "Face-Swap" als benannte Funktion. Die Multi-Bild-Bearbeitung mit bis zu 3 Quellbildern und Prompts in natürlicher Sprache kann jedoch Workflows zur Motivübertragung und Szenenkomposition ermöglichen. Die Ergebnisse hängen von der Spezifität des Prompts und dem Grad der Unterschiede in Pose/Beleuchtung zwischen den Quellbildern ab.

Ist Flux Teil der Grok Imagine-API?

Nein. Flux ist eine Modellfamilie von Black Forest Labs und hat keine Verbindung zu xAI oder Grok. Grok verwendet proprietäre Modelle: grok-imagine-image-quality und grok-imagine-image. Flux Kontext Dev ist ein separates Modell, das auf Plattformen wie Atlas Cloud für USD0.025/Bild erhältlich ist, aber es ist kein Grok-Produkt.

Welches Modell übernimmt die Bildanalyse-Funktionen von Grok?

Das Bildverständnis nutzt grok-4.3 über den Endpunkt

text
1https://api.x.ai/v1/responses
. Es unterstützt JPEG- und PNG-Formate bis zu 20 MiB pro Bild, mehrere Bilder pro Anfrage und einen optionalen
text
1"detail": "high"
-Parameter für komplexe visuelle Analysen. Speichern Sie gemäß der xAI-Dokumentation keinen Bild-Anfrage-/Antwortverlauf serverseitig.

Fazit

Die Imagine-API von Grok deckt wesentlich mehr ab als ein grundlegendes Text-zu-Bild-Tool. Im Jahr 2026 haben Entwickler Zugriff auf Bildbearbeitung mittels natürlicher Sprache, Multi-Bild-Compositing, sechs Stilübertragungsmodi, 14 Seitenverhältnisse, Ausgaben in 1K- und 2K-Auflösung sowie ein separates Modell für visuelles Verständnis in grok-4.3. Die Einstellung von grok-imagine-image-pro am 15. Mai 2026 bedeutet, dass alle neuen Projekte auf grok-imagine-image-quality basieren sollten.

Ein paar Dinge sollten Sie bei Ihrer Evaluierung berücksichtigen. Die Inkompatibilität der Bildbearbeitung mit dem OpenAI SDK wird Sie treffen, wenn Sie nicht darauf vorbereitet sind. Multi-Bild-Bearbeitung ist kein "Face-Swap" dem Namen nach, bewältigt aber die kompositorische Motivübertragung mit den richtigen Prompts. Und Flux ist nicht Grok, egal was Vergleichsartikel implizieren mögen.

Für Teams, die Grok Imagine neben einem breiteren Modellkatalog unter einer API wünschen, bietet die einheitliche KI-Modellplattform von Atlas Cloud Zugriff auf über 300 Modelle, einschließlich Grok Imagine, Flux Kontext Dev und über 25 weitere Bild-zu-Bild-Optionen, mit SOC 2- und HIPAA-Konformität sowie Pay-as-you-go-Preisen.

Die Funktionen sind produktionsbereit. Die Frage ist, ob sie zu Ihrem spezifischen Anwendungsfall und Budget passen.

Neueste Modelle

Beginnen Sie mit 300+ Modellen,

Alle Modelle erkunden

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.