画像編集は、制作ワークフローの大半を占める作業です。チームはまず製品ショット、ブランド画像、あるいはキャラクターデザインから着手し、その後、バリエーションの作成、背景の差し替え、新しいシーンへの配置といった作業が必要になります。
リファレンス画像(参照画像)対応モデルは、こうした作業に最適です。プロンプトと画像を入力すると、モデルが重要な要素を維持しつつ、残りの部分を変換してくれます。本ガイドでは、Atlas Cloudで提供されている最高峰の画像編集モデルを比較し、それぞれの適材適所を紹介します。
最終更新日:2026年4月29日
リファレンス対応モデルで生成できる画像の例:



AI画像編集とは何か(2026年版)
現在のAI画像編集は、単なるインペインティングにとどまりません。リファレンス画像モデル(「Image-to-Image」や「Canny/Depthガイド付き生成」とも呼ばれます)を活用すれば、1回のAPIコールでスタイルの変更、構図の再設定、画像の拡張が可能になります。
- スタイル転送: ある画像の画風を新しい被写体に適用する。
- キャラクターの一貫性: 異なるポーズやシーンでも同じキャラクターを維持する。
- 製品バリエーション: 製品を新しい環境や照明設定で提示する。
- ブランド一貫性のある生成: 一連の制作物全体でビジュアルアイデンティティを統一する。
- テキスト統合: 高精度で忠実なテキストを画像上に直接レンダリングする(GPT Image 2独自の機能)。
APIの仕組みはシンプルです。プロンプトと1枚のリファレンス画像を送るだけで、両方の条件を満たした画像が生成されます。
リファレンス画像による編集の仕組み
モデルはプロンプトとリファレンス画像の2つの入力を受け取ります。両方をエンコードした後、リファレンスを条件付けのシグナルとして使い、新しい画像を生成します。プロンプトで「何を変化させるか」を指示し、リファレンスで「どの視覚的アンカーを維持するか」を伝えます。
追従性は固定ではありません。顔の特徴、シルエット、カラーパレット、素材感などを強く維持するものもあれば、リファレンスをあくまでガイドとして緩やかに扱うものもあります。結果はモデル、プロンプト、そしてソース画像の具体的な内容によって左右されます。
これらのシステムは、ピクセルをそのままコピーするわけではありません。高レベルの構造と認識可能な特徴を保持しつつ、テクスチャ、照明、背景の細部、小さな局所的な形状は再生成されます。そのため、クリーンなリファレンス画像を用意することで、モデルに安定したターゲットを与えることができます。
総合比較表
| モデル | 開発元 | 価格/画像 | 最大参照数 | 一貫性 | 最適な用途 |
|---|---|---|---|---|---|
| GPT Image 2 | OpenAI | ~USD0.01-0.41 | 10枚 | エリート | 複雑な論理、テキストレンダリング、空間推論 |
| Flux 2 Pro | Black Forest | USD0.03-0.05 | 1枚 | 強力 | ブランドの一貫性を保った生成、製品バリエーション |
| Nano Banana 2 | USD0.08-0.16 | 14枚 | 優秀 | キャラクターシリーズ、スタイライズされたバリエーション、4K詳細 | |
| Seedream v5.0 Lite | ByteDance | USD0.032 | 14枚 | 良好 | 大量生産のバリエーション、高速生成 |
| Imagen 4 Ultra | Google DeepMind | USD0.06 | テキストのみ | N/A | プレミアムなヒーロー画像(参照入力なし) |
| Z-Image Turbo | Z-AI | USD0.01 | テキストのみ | N/A | スピード重視の生成(参照入力なし) |
Atlas Cloudでは、これらすべてのモデルを1つのAPIキーで利用可能です。パラメータを1つ変更するだけで、モデルを切り替えることができます。
用途別ランキング
複雑な推論とテキストに最適:GPT Image 2
GPT Image 2は、ラインナップの中で最もインテリジェントなモデルです。「思考」を行う潜在空間を利用しているため、複雑な空間的指示を推論し、完璧なタイポグラフィをレンダリングできます。
活用例:香水ボトルを保持したまま背景を変更し、特定のフォントで「520 Limited Edition」というラベルを壁に配置する。
キャラクターの一貫性に最適:Nano Banana 2
Nano Banana 2は、継続的に登場するキャラクターに最適な選択肢です。顔立ち、服装、アクセサリーを新しいシーン全体で安定して維持します。
そのため、物語コンテンツ、マスコット、アバター、商品モックアップに有用です。Nano Banana 2の料金は、1KでUSD0.08、2KでUSD0.12、4KでUSD0.16となっています。
ブランドの一貫した制作に最適:Flux 2 Pro
Flux 2 Proは、ブランドワークにおいて最も安全なデフォルト選択です。適切なリファレンス画像があれば、色、照明、視覚的トーンを多数の出力にわたって一貫させることができます。
大量バリエーションに最適:Seedream v5.0 Lite
Seedream v5.0 Liteは大量のバッチ処理に適しています。数百のバリエーションを生成するのに十分な速度があり、コスト効率も優れています。
Seedream v5.0 Liteは、製品のバリエーション、ライフスタイルシーン、A/Bテスト用のアセット制作に適しています。
最高品質(参照なし)に最適:Imagen 4 Ultra
Imagen 4 Ultraはリファレンス画像を使用しません。参照による制御が不要で、高品質なヒーロー画像を必要とする場合にImagen 4 Ultraを使用してください。
個別モデルの解説
GPT Image 2
モデルID: openai/gpt-image-2/edit
価格: 段階別(解像度による)
用途: 正確な指示への追従。
プロンプト例: リファレンスと同じ製品だが、大理石のカウンターの上に配置する。背後の壁にエレガントなゴールドの文字で「Maison Francis Kurkdjian」と追加する。
Nano Banana 2
モデルID: google/nano-banana-2/edit
価格: 1KでUSD0.08、2KでUSD0.12、4KでUSD0.16
リファレンスサポート: あり(1枚)
最大解像度: 4K
Nano Banana 2は、アイデンティティの一貫性を維持するために設計されています。様々なポーズ、衣装、シーンでキャラクターを維持できます。
プロンプト例:
1リファレンスと同じキツネのマスコット、学校の廊下で手を振っている、赤いバックパック、クリーンな児童書スタイルプロンプト例:
1リファレンスと同じアニメスタイルのバリスタ、夜のカフェのシーン、コーヒーを注いでいる、暖かいネオン照明、顔と衣装のデザインを維持用途:
- 物語コンテンツ: 一人のキャラクターを多くのシーンで再利用
- 商品モックアップ: キャラクターをシャツ、マグカップ、ポスター、パッケージに配置
- アバターバリエーション: スタイルや表情を変えてもアバターを一貫させる
- ゲームアセットのプロトタイプ: 1つのコンセプト画像からポーズ、衣装、スタンスをテスト
100枚パックは1KティアでUSD8です。コストよりも一貫性が重要な場合に使用してください。
詳細はNano Banana 2ガイドとNano Banana 2プロンプトガイドを参照してください。
Seedream v5.0 Lite
モデルID: bytedance/seedream-v5.0-lite/edit
価格: USD0.032/画像
リファレンスサポート: あり(1枚)
最大解像度: 4704x2016
Seedream v5.0 Liteはバッチ処理モデルです。多くの成果物を素早く必要とする場合に適しています。
プロンプト例:
1リファレンスと同じランニングシューズを街の歩道で撮影、アスレチックキャンペーン風、強い日光、シャープな小売向け詳細プロンプト例:
1リファレンスと同じドリンクボトルをピクニックシーンで、夏のカラーパレット、背景の友人はソフトフォーカス、広告向けの構図用途:
- 製品写真バリエーション: 同じ製品、異なる設定や照明
- ライフスタイルシーンのバリエーション: 同じコンセプト、異なる被写体や季節
- ローカライズされたコンテンツ: 同じキャンペーンコンセプト、地域別のスタイル
- A/Bテスト用アセット: 1つのコア画像から多数のバージョンを生成
詳細はSeedream v5.0 Liteガイドを参照してください。
APIアクセス:リファレンス画像による編集
ワークフローは3つの編集モデルすべてで共通です。Atlas Cloudに登録してAPIキーを作成すれば、USD1分の無料クレジットが付与されます。これで3モデルすべてのテストが可能です。

Pythonでのコードパターンは以下の通りです:
python1import requests 2import time 3 4 5API_KEY = "your-atlas-cloud-api-key" 6BASE_URL = "https://api.atlascloud.ai/api/v1" 7 8 9# リファレンス付き画像生成 -- Flux 2 Pro, Nano Banana 2, Seedream v5.0 Liteすべて共通 10response = requests.post( 11 f"{BASE_URL}/model/generateImage", 12 headers={ 13 "Authorization": f"Bearer {API_KEY}", 14 "Content-Type": "application/json" 15 }, 16 json={ 17 "model": "black-forest-labs/flux-2-pro/text-to-image", 18 "prompt": "the same product photographed in a sunlit kitchen scene, morning light, cozy lifestyle aesthetic", 19 "reference_image_url": "https://your-cdn.com/product-hero.jpg", 20 "width": 1024, 21 "height": 1024 22 } 23) 24 25 26result = response.json() 27 28 29# 結果のポーリング 30while True: 31 status = requests.get( 32 f"{BASE_URL}/model/prediction/{result['request_id']}/get", 33 headers={"Authorization": f"Bearer {API_KEY}"} 34 ).json() 35 if status["status"] == "completed": 36 print(f"Image: {status['output']['image_url']}") 37 break 38 time.sleep(3)
モデルを切り替えるには、
1model
実践的なワークフローパターン
パターン1:ブランドアセットパイプライン(Flux 2 Pro)
週に50枚のソーシャルメディア用画像を同じスタイルで生成する必要がある場合。
- 解決策:Flux 2 Proを使用。色、照明、素材の質感(ガラスやシルクなど)を多出力にわたって保持します。
- コスト:50枚 x USD 0.05 = 週あたりUSD 2.50。
パターン2:キャラクターライブラリ(Nano Banana 2)
アプリ用に100のシーンで1つのマスコットを登場させる必要がある場合。
- 解決策:Nano Banana 2を使用。他の公開APIよりも優れた顔立ちや服装の維持を実現します。
- コスト:100枚 x USD 0.08 = 合計USD 8.00。
パターン3:論理・テキスト重視の編集(GPT Image 2)
製品上の特定のテキストや複雑な空間的指示(例:「ボトルを花の背後に配置し、手前には置かないで」)が必要な場合。
- 解決策:GPT Image 2を使用。「推論エンジン」が「OUD velvet mood」のようなテキストの綴りを正しくし、論理的に配置します。
- コスト:100枚 x USD 0.053(ミディアムティア) = 合計USD 5.30。
パターン4:バリエーションバッチ(Seedream v5.0 Lite)
ECチームがA/Bテスト用に製品写真のライフスタイルバリエーションを500枚必要とする場合。
- 解決策:Seedream v5.0 Liteを使用。大量のバッチ処理に向いており、低コストで運用可能です。
- コスト:500枚 x USD 0.032 = USD 16.00。
リファレンス画像編集を利用すべきでないケース
- ピクセル単位のインペインティング:シミの除去など、画像の残りの部分に触れずに小さな領域だけを変更したい場合は、専用のインペインティングツールを使用してください。
- 単一ピクセルのカラーマッチング:AIの照明生成によりカラーコードがわずかに変化することがあります。厳密なブランドカラー準拠が必要な場合は、ポストプロセッシングで調整してください。
- 単純な背景削除:白背景にするだけなら、背景削除専用ツールを使ってください。GPT Image 2のような強力な推論モデルを使うのは、予算と機能の無駄遣いになります。
よくある質問
キャラクターの一貫性が最も高いのは?
Nano Banana 2です。アイデンティティ維持に特化して設計されています。ただし、キャラクターがテキストや複雑な機械とインタラクションする必要がある場合はGPT Image 2が優れています。
複数のリファレンス画像を一度に使えますか?
現在、Atlas Cloud上のほとんどのモデルはリクエストごとに1枚のリファレンス画像を受け付けます。スタイルを混ぜ合わせたい場合は、あらかじめ「合成」リファレンス画像を1枚作成しておくことを推奨します。
GPT Image 2は他のモデルと何が違いますか?
単にスタイルを「コピー」するのではなく、コンテンツを「理解」します。例えば、「香水ボトル」がガラス製であることを理解しているため、背景を変えた際にも自然な反射を再計算します。
USD 1の無料クレジットで何ができる?
- Seedream v5.0 Lite: 約31枚
- Flux 2 Pro: 約20〜33枚
- GPT Image 2 (Medium): 約18枚
- Nano Banana 2: 約12枚
結論
- AIに画像内の「理解」や「読み書き」を求めるなら:GPT Image 2
- 高級ブランドワークで最高レベルの審美的な品質を求めるなら:Flux 2 Pro
- キャラクターやIP(知的財産)の一貫性を求めるなら:Nano Banana 2
- 大量生産のコストを最小限に抑えるなら:Seedream v5.0 Lite
Atlas Cloudを使えば、複数のモデルを簡単にテストできます。1つのAPIキーと一元化された請求システムで、パラメータを変更するだけでモデルを切り替え可能です。
────────────────────────────────────────────────────────────






