HiDream O1 1.5 Image API for Pixel-Native Creation

HiDream O1 1.5 Image API は、HiDream.ai の統合基盤モデルをあなたのスタックに提供し、テキストから画像生成、単一画像編集、被写体主導のパーソナライゼーションを 1 つのピクセルレベルシステム上で実行します。6 種類のアスペクト比プリセットに対応し、ガイダンスと推論ステップを調整することで、プロンプトへの高い忠実度を実現できます。Atlas Cloud は、OpenAI 互換の単一エンドポイントを通じてこれを提供し、1 画像あたり $0.044 の明確な従量課金制で利用できます。今すぐ開発を始めましょう。

主要モデルを探索(2)

NEW

テキストから画像

HiDream O1 1.5 Text-to-Image

説明がありません。

HiDream O1 1.5 Edit

説明がありません。

From

$0.044/画像

Every HiDream O1 1.5 Image API Endpoint, Side by Side

Compare what each route of the HiDream O1 1.5 Image API takes in, renders out, and charges per call.

Modality	Description
HiDream O1 1.5 Text-to-Image API (Text To Image)	Turn a written prompt of up to 2,500 characters into a fully composed image across six presets, from a 512x512 square to 16:9 landscape, with PNG, JPEG, or WebP output. Denoising steps range from 1 to 100 and guidance scale from 1.0 to 20.0, so each request can trade speed against how tightly the result follows your prompt. At $0.044 per image, it fits e-commerce mockups, advertising concepts, and game art produced at volume.
HiDream O1 1.5 Edit API (Image Editing)	Feed one reference image URL alongside your instruction and this endpoint rewrites that image, or pass several URLs for subject-driven personalization across a set. It shares the same six size presets, 1 to 100 inference steps, and 1.0 to 20.0 guidance range as the text-to-image route, returning PNG, JPEG, or WebP. Billed at $0.044 per image, it handles product retouching, background swaps, and consistent character edits.

Modality

Description

HiDream O1 1.5 Text-to-Image API (Text To Image)

Turn a written prompt of up to 2,500 characters into a fully composed image across six presets, from a 512x512 square to 16:9 landscape, with PNG, JPEG, or WebP output. Denoising steps range from 1 to 100 and guidance scale from 1.0 to 20.0, so each request can trade speed against how tightly the result follows your prompt. At $0.044 per image, it fits e-commerce mockups, advertising concepts, and game art produced at volume.

HiDream O1 1.5 Edit API (Image Editing)

Feed one reference image URL alongside your instruction and this endpoint rewrites that image, or pass several URLs for subject-driven personalization across a set. It shares the same six size presets, 1 to 100 inference steps, and 1.0 to 20.0 guidance range as the text-to-image route, returning PNG, JPEG, or WebP. Billed at $0.044 per image, it handles product retouching, background swaps, and consistent character edits.

HiDream O1 1.5 Image API に組み込まれた精度と制御性

HiDream O1 1.5 Image API は、テキストからの画像生成、指示ベースの編集、被写体主導のパーソナライズを、1 つの pixel-native モデルに統合します。正確なバイリンガルテキストを描画し、guidance、sampling steps、出力形式を開発者が直接制御できます。

HiDream O1 1.5 Image API による Text-to-Image

最大 2,500 文字のプロンプトを送信すると、モデルはピクセル、テキスト、タスク条件を 1 つの共有空間でエンコードする単一の pixel-native transformer を通じて、完成画像としてレンダリングします。外部 VAE や別個の text encoder が処理経路に入らないため、密度の高い複数節の説明でも、細部と構図が安定します。コンセプトアート、マーケティングビジュアル、製品モックアップの信頼できる基盤になります。

バイリンガルテキストとレイアウトのレンダリング

構図の中に判読可能な文字を配置できる画像モデルは多くありませんが、HiDream O1 1.5 は中国語、英語、混在言語の文字列、数値データを、手作業のレタッチを省けるほどきれいにレンダリングします。pixel-native 設計により複数領域のレイアウトを扱え、latent-space モデルで文字がぼやけたり崩れたりしがちな場面でも、見出し、キャプション、ラベルを鮮明に保ちます。デザイナーは、テキストまでそのまま公開できるポスター、パッケージ、ソーシャル向けグラフィックを作成できます。

HiDream O1 1.5 Image API による In-Context Editing

1 つの参照画像 URL と、「イヤホンを削除する」のような自然言語の指示を渡すと、edit endpoint が周囲の構図を保ったまま変更を適用します。生成と編集を同じモデルが担うため、照明、スタイル、変更しない領域は一から作り直されるのではなく、一貫性を保ちます。チームは、承認済みのビジュアルを全面的に作り直すことなく反復改善するために利用できます。

被写体主導のパーソナライズ

複数の参照画像 URL を指定すると、モデルは被写体を捉え、そのアイデンティティをまったく新しいシーン、ポーズ、背景へと引き継ぎます。この subject-driven モードでは、画像ごとの fine-tuning なしに、キャラクター、製品、ブランドマスコットを生成間で認識可能なまま保てます。同じ人物や対象を各所に登場させる必要があるキャンペーン、ストーリーボード、ゲームアセットに適しています。

1 つのキーでフル制御、Pay-As-You-Go

実際にどれほどの制御が必要ですか？ guidance_scale は 1.0 から 20.0、inference steps は 1 から 100 まで調整でき、6 種類のアスペクト比プリセットから選択し、PNG、JPEG、WebP として書き出せます。すべての呼び出しは 1 つの OpenAI-compatible endpoint 経由で実行され、料金は画像 1 枚あたり $0.044 の明瞭な pay-as-you-go 課金で、サブスクリプションは不要です。今すぐ構築を始めましょう。

HiDream O1 1.5 Image API vs 主要モデル：1つのプロンプト、3つのレンダリング

同一のプロンプトを HiDream O1 1.5 Image API と競合する2つの画像モデルに送信し、それぞれが同じ言葉を構図、ライティング、細部表現としてどう解釈するかを比較します。

プロンプト

地中海の港町にある活気あふれる朝の魚市場。木製の屋台には、その日の新鮮な魚介が手書きチョークの価格板で並び、縞模様のエプロンを着た若い魚屋の女性が笑いながら身ぶりの途中で銀色のイワシを空中に放り投げている。低い黄金色のサイドライトが濡れた石畳ときらめく魚の鱗をかすめ、深い望遠圧縮により屋台が背後の柔らかく霧がかった港へと重なって見える。温かなテラコッタの壁と冷たい銀色の魚に対比するティールの雨戸のカラーパレット。くっきりしたチョーク文字と風化した木目。率直なドキュメンタリー報道写真、35mm、ワイド 16:9 アスペクト比、フルブリード

Generated with HiDream O1 1.5 on Atlas Cloud

Generated with Nano Banana Pro on Atlas Cloud

Generated with Seedream v4.5 on Atlas Cloud

プロンプト

実をつけたセクロピアの枝をめぐって口論の最中を捉えられた2羽のコンゴウインコ。翼は真紅とコバルトの炸裂のように広がり、1羽は羽ばたきの途中で逆さまに転がっている。半透明の羽を透かして光る柔らかな曇天のジャングル光に逆光で照らされ、400mm 望遠で撮影されているため、幾層にも重なる霧がかった熱帯雨林が背景へ圧縮されている。右三分の一を淡い空の広いネガティブスペースが満たし、深いエメラルドの葉群を背景に補色関係の赤い羽毛が際立つ。羽枝とくちばしの質感はかみそりのようにシャープに描写。博物誌的な野生動物写真、ワイド 16:9 アスペクト比、フルブリード

Generated with HiDream O1 1.5 on Atlas Cloud

Generated with Nano Banana Pro on Atlas Cloud

Generated with Seedream v4.5 on Atlas Cloud

HiDream O1 1.5 Image APIでプロンプトから本番制作まで

Eコマース、広告、ゲームアート、ソーシャルキャンペーンまで、HiDream O1 1.5 Image APIは、1つのプロンプトまたは一連の参照素材から、画像生成、編集、被写体の一貫性を保ったパーソナライズを、1画像あたり一律$0.044で実現します。

Eコマース向け商品ビジュアル

小売チームは、テキストプロンプトから商品カットやライフスタイルシーンを1画像あたり$0.044で生成でき、6種類のアスペクト比プリセットから選択できます。写真撮影やスタジオでの納品待ちなしに、カタログ用ビジュアルを用意できます。

HiDream O1 1.5 Image APIで制作する広告クリエイティブ

横長、縦長、正方形の各フレーミングで、厳密に構成され、映画的なライティングで描画されたキャンペーンポスターやバナーを制作できます。代理店はヒーロークリエイティブを一度の作業で反復し、そのまま本番利用できるアートをクライアントに納品できます。

精密な写真編集

1枚の参照画像と編集プロンプトを渡すだけで、写真の構図とライティングを維持しながら、スタイル変更、レタッチ、再構成を行えます。デザイナーは本格的なエディターを使わずに、背景の修正や要素の差し替えができます。

HiDream O1 1.5 Image APIで一貫したキャラクター表現

複数の参照画像を入力すると、モデルはまったく新しいシーンでもキャラクター、商品、マスコットの一貫性を保ちます。スタジオは、モデルの特徴を維持したまま使い回せるブランドアセットやキャンペーンシリーズを構築できます。

ゲームアートとコンセプトデザイン

ゲームチームが環境、プロップ、キャラクターコンセプトを必要とする場合、モデルはguidance scaleとinference stepsで調整された詳細なアートを返します。アートディレクターはスタジオの制作時間を投入する前に、ビジュアルの方向性を探索できます。

HiDream O1 1.5 Image APIによるソーシャルキャンペーン

多忙なコンテンツカレンダーを運用していますか？マーケターは、正方形、縦長、横長の各プリセットで、投稿、ストーリーズ、サムネイル向けの目を引くグラフィックをすばやく作成できます。各画像は、予測可能な一律$0.044で生成されます。

HiDream O1 1.5 Image API と競合画像モデルの比較

HiDream O1 1.5 Image API が、組み込み推論、バイリンガルテキスト、オープンウェイト、画像あたりのコストにおいて、Alibaba および ByteDance の画像モデルと比べてどの位置にあるかを確認できます。

モデル	プロバイダー	推論プロンプトエージェント	バイリンガルテキストレンダリング	オープンウェイト	価格（画像あたり）
HiDream O1 1.5 Text-to-Image	HiDream.ai	√	√	√	$0.044
HiDream O1 1.5 Edit	HiDream.ai	√	√	√	$0.044
Qwen Image 2.0	Alibaba (Qwen)	-	√	-	$0.035
Seedream v4.5	ByteDance	-	√	-	$0.04

Atlas Cloud で HiDream を使う方法

数分で始められます — 以下の簡単なステップに従って、Atlas Cloud プラットフォームでモデルを統合・デプロイしましょう。

Atlas Cloud アカウントを作成

atlascloud.ai でサインアップし、認証を完了します。新規ユーザーには無料クレジットが付与され、プラットフォームの探索やモデルのテストに使用できます。

Atlas CloudでHiDreamを使用する理由

高度なHiDreamモデルとAtlas CloudのGPU加速プラットフォームを組み合わせることで、比類のないパフォーマンス、スケーラビリティ、開発者エクスペリエンスを提供。

パフォーマンスと柔軟性

低レイテンシ：
リアルタイム推論のためのGPU最適化推論。

統合API：
1つの統合でHiDream、GPT、Gemini、DeepSeekを実行。

透明な料金：
サーバーレスオプション付きの予測可能なtoken単位の課金。

エンタープライズとスケール

開発者エクスペリエンス：
SDK、分析、ファインチューニングツール、テンプレート。

信頼性：
99.99%の稼働率、RBAC、コンプライアンス対応ロギング。

セキュリティとコンプライアンス：
SOC 2 Type II、HIPAA準拠、米国内のデータ主権。

HiDream O1 1.5 Image API のよくある質問と回答

HiDream O1 1.5 Image API は、Atlas Cloud 上の単一の OpenAI 互換エンドポイントを通じて、HiDream の統合画像生成モデルへプログラムからアクセスできる API です。ピクセルレベルの統合 transformer を基盤としており、複数の個別ツールを組み合わせる代わりに、1 つのモデルで text-to-image、編集、被写体ベースのパーソナライズを実現します。Day-0 で利用でき、従量課金制かつ呼び出しごとの透明な料金体系です。

単純な text-to-image 生成にとどまらず、このモデルは指示ベースの編集、複数の参照画像を使った被写体ベースのパーソナライズ、ポスターや商用グラフィック向けの正確な長文テキスト描画に対応します。構図の精度と画像内テキストの読みやすさが重要な、EC の商品ビジュアル、広告クリエイティブ、ゲームアートなどで活用されています。

はい。HiDream O1 1.5 は、中国語と英語のニュアンスを含むプロンプトを解釈できるように学習されており、多言語の画像内テキストも高い精度で描画します。そのため、モデルを切り替えずにローカライズされたビジュアルを提供したいチームに実用的です。

HiDream O1 1.5 Image API は 1 つの OpenAI 互換キーで呼び出せるため、ほとんどの既存 SDK は Atlas Cloud エンドポイントを指定するだけで利用できます。プロンプトと任意のパラメーターを含むリクエストを hidream-o1-1.5/text-to-image モデルに送信し、生成された画像を取得します。利用者側で別途モデルをホスティングしたり GPU インフラを用意したりする必要はありません。

プロンプトは最大 2,500 文字まで利用でき、1024x1024 の square_hd、512x512 の square に加えて、4:3 と 16:9 の portrait および landscape オプションなどのプリセットサイズを選べます。また、num_inference_steps はデフォルト 50 で 1〜100 の範囲で調整でき、guidance_scale はデフォルト 5.0 で 1.0〜20.0 の範囲に設定できます。出力形式は PNG、JPEG、WebP に対応しています。

既存画像に対して指示ベースの編集を行うには、reference_image_urls に単一の URL を渡します。シーンをまたいで一貫した被写体を保つパーソナライズを行うには、複数の URL を指定します。通常の text-to-image 生成では、このフィールドを空のままにします。編集ワークフロー向けには専用の hidream-o1-1.5/edit モデルが用意されており、同じ画像単価で利用できます。

HiDream O1 1.5 Image API は Atlas Cloud 上で 1 画像あたり $0.044 で提供され、text-to-image モデルと edit モデルは同じ料金です。請求は従量課金制で、呼び出しごとの料金が明確なため、サブスクリプションなしで生成した画像分だけ支払います。今すぐ構築を始められます。

Atlas Cloud では 1024x1024 の square_hd などのプリセットサイズを選択でき、モデルは latent space に圧縮するのではなく、統合 transformer によって生のピクセルから直接各画像を合成します。細部や画像内テキストがボトルネックからアップスケールされるのではなく生成されるため、HiDream はポスターや商品グラフィックにおける美しいタイポグラフィとシャープなエッジで知られています。

さらにファミリーを探索

Seedance 2.0

Seedance 2.0 APIは、ByteDanceのマルチモーダルビデオモデルへのプロダクションアクセスを提供します。これには、クアッドモーダル入力（テキスト、画像、ビデオ、オーディオ）と、ショット間で構図、カメラワーク、キャラクターのアクションを固定する業界最高水準の「Universal Reference」システムが含まれます。1回のAPIコールでディレクターレベルの制御を統合でき、一律$0.09/秒、即時キー発行、順番待ちリストなしで利用可能です。これらはエンタープライズクラスの稼働率とコンプライアンスによって裏付けられています。Seedance 2.0 Native 4Kが提供開始されました！

ファミリーを表示

Grok Imagine

Grok Imagine API は、開発者に xAI の画像、動画、音声生成を1つのスイートで提供します。多言語テキストレンダリングを備えた最大 2K の画像に加え、ネイティブで同期された音声とリファレンスベースの編集を備えた最大15秒の動画を生成します。Atlas Cloud 上では、1つのキーで Grok Imagine のすべてのモードを実行できるため、個別の設定なしで画像、動画、音声の間を移行できます。料金は画像1枚あたり0.02ドル、1秒あたり0.05ドルからです。

ファミリーを表示

Gemini Omni Flash

Gemini Omni API は、Google I/O 2026 で発表された Google DeepMind のマルチモーダル動画生成・編集モデルを、あなたのスタックで利用可能にします。Gemini Omni は Gemini の推論エンジンと生成メディアを融合し、テキスト・画像・動画・音声を自由に組み合わせた入力から、一貫性があり知識に裏付けられた出力を生成します。自然な対話で結果を磨き上げましょう。オブジェクトの差し替え、シーンの書き換え、スタイルの変更を行っても、物理法則、キャラクター、連続性はそのまま保たれます。Atlas Cloud は、テキストからの動画生成、最大 7 枚の参照画像に対応した画像からの動画生成、そして参照ベースの動画生成という Gemini Omni Flash の全ラインアップを、単一の統合 API で提供します。料金は $0.112 からの秒単位の透明な従量課金で、サブスクリプションは不要です。今すぐ開発を始めましょう。

ファミリーを表示

GPT Image 2

GPT Image 2 API は、GPT Image 1.5 の後継となる OpenAI の最新画像モデルへのアクセスを開発者に提供します。ラテン文字およびCJKスクリプト全体で正確なテキストレンダリングを使用して画像を生成および編集できるほか、ポスター、モックアップ、インフォグラフィック向けの強力なコンポジション（構図）機能を備えています。Atlas Cloud では、300以上のモデルと並んで1つの統合 API を通じてアクセスでき、無料クレジット、99.99% のアップタイムが提供され、OpenAI の組織検証は不要です。

ファミリーを表示

Google

Googleの最も強力なクリエイティブモデルはすべてAtlas Cloudで利用可能です。Veo 3.1はシネマティックな動画生成を実現し、Nano Banana 2は高忠実度な画像作成を強化し、Geminiはあらゆるワークフローにマルチモーダルなインテリジェンスをもたらします。Day-0の可用性と従量課金制（pay-as-you-go）の料金体系を備えた単一のAPI keyを通じて、Googleモデルスイート全体にアクセスできます。

ファミリーを表示

Seedance 2.0 Mini

Seedance 2.0 Mini は、速度とコストが最も重視されるワークフローに ByteDance のマルチモーダル動画生成をもたらします。より軽量なフットプリントで Seedance 2.0 のコア機能を提供し、より高速な生成、動画あたりのコスト削減、そしてすでに使用しているものと同じ API 統合を実現します。大容量のパイプラインを運用したり、大規模なプロトタイピングを行ったりするチームにとって、Mini は実用的なデフォルトの選択肢です。

ファミリーを表示

ByteDance

シネマティックな動画生成から高忠実度の画像作成まで、ByteDanceの最も強力なモデルがAtlas Cloudで利用可能になりました。最低水準の推論価格とゼロのインフラストラクチャオーバーヘッドで、SeedanceとSeedreamを大規模に実行できます。

ファミリーを表示

Alibaba

Atlas Cloudは、Alibabaの全モデルラインナップを単一のAPIに統合します。言語および画像タスク用のQwen、最大1080pの動画生成用のWanが利用可能です。すべてのモデルはサブスクリプション不要の従量課金制（pay-as-you-go）でアクセスできます。Alibaba APIは、既存のOpenAI互換クライアントを使用し、単一のベースURLを介して利用可能です。

ファミリーを表示

OpenAI

Atlas Cloudは、画像生成用のGPT Image 2から動画用のSora 2まで、OpenAI APIの全ラインナップへのアクセスを提供します。すべてのモデルは、月額の固定コミットメントなしの従量課金制でご利用いただけます。OpenAI互換APIを使用し、ベースURLを一つ変更するだけで簡単に組み込むことができます。

ファミリーを表示

xAI

Atlas Cloud 上で xAI API を使用して、完全な画像および動画パイプラインを構築します。2K解像度での生成、参照画像を使用した編集、そして画像を音声同期クリップへとアニメーション化することが可能です。

ファミリーを表示

Kwaivgi

Kwaivgi APIを標準価格より15%オフで提供。Atlas Cloudは、新しいKlingリリースへのDay-0アクセスを、従量課金制（Pay-as-you-go）およびシート数無制限で提供します。1つのアカウント、1つのキーで、スタンダードからマスター階層まで、すべてのKlingモデルをご利用いただけます。

ファミリーを表示

Seedream 5.0 Pro

Seedream 5.0 Pro API は、開発者に Atlas Cloud 上で ByteDance の制御可能な画像編集モデルを提供します。アンカーと座標を使用して編集を正確に配置し、画像を編集可能なレイヤーに分離し、複数の参照を融合し、正確な色と素材を一致させ、2K および 3K での多言語テキストをサポートします。Atlas Cloud では、単一のキーでアクセスできます！

ファミリーを表示

ひとつのAPIで、あらゆるメディアAIを。

すべてのモデルを探索