
Atlas Cloudは、Baidu APIの下でERNIE ImageおよびERNIE Image Turboをホストしており、どちらも従量課金制です。各モデルは、英語および中国語のテキストレンダリングにおいてオープンソースをリードしています。
Atlas Cloud の最先端 AI 画像生成モデルを使い、プロンプトと参照画像から、そのまま実用できる息をのむようなビジュアルを生み出します。
Compare standard vs. our pricing across every Baidu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Baidu ERNIE Image Turbo Text-to-image | — | Start fromFree | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
ERNIE Image は、生成された画像内のテキストが可読でなければならないワークフローのために構築されています。チームはこれを使用して、デザインチームなしで、バイリンガルなアセット、構造化されたレイアウト、およびテキストを多用するクリエイティブを大規模に制作できます。
マーケティングチームは ERNIE Image を使用し、単一の API コールで読みやすい英語と中国語のテキストを含むキャンペーンポスターを生成し、同じプロンプト構造から両方の市場をターゲットにしています。このモデルは両方の言語を 0.96 以上の精度でレンダリングするため、見出しや本文はポストプロダクションの修正なしで綺麗に仕上がります。Atlas Cloud の従量課金制により、アセットごとのデザインコストをかけることなく、キャンペーンごとに数十のバリエーションを生成することが実用的になります。
中国市場に参入するブランドは、印刷生産に移行する前に、ERNIE Imageを使用して正確なバイリンガルテキストを含む製品ラベルとパッケージのモックアップを生成します。このモデルは、ラベルや成分表の小さな文字を含め、簡体字中国語、繁体字中国語、英語を同じレイアウトで処理します。1024×1024の出力解像度では、モックアップはクライアントの承認や規制当局への提出に使用するのに十分な本番レベルの品質を備えています。
出版社やコンテンツスタジオは、ERNIE Imageを使用して、中国語または英語で正確な吹き出し、キャプションボックス、およびパネルテキストを備えたコミックパネルを生成しています。このモデルは、この種の構造化された画像内テキスト出力に特化したLongTextBenchで0.96以上のスコアを記録しています。Atlas Cloud上のERNIE Image Turboは無料であるため、イテレーション段階での大量のパネルのドラフト作成がコストゼロで行えます。
データチームは、ERNIE Imageのテキストレンダリング精度を活用して、構造化データをラベル付きのインフォグラフィック画像に変換するパイプラインを構築します。チャートのラベル、吹き出し、セクションのヘッダーは、単一のプロンプトから両方の言語で正確にレンダリングされ、データ出力から視覚化までの手作業による設計ステップを排除します。組み込みの Prompt Enhancer は、短いデータの説明を詳細なレイアウト指示に自動的に書き換えます。
パフォーマンスマーケティングチームは、同一のキャンペーンブリーフから中国語圏および英語圏の市場向けにローカライズされた広告クリエイティブを生成します。ERNIE Imageのバイリンガルサポートを利用して、単一のパイプラインで両方の言語バリアントを制作します。各クリエイティブには正確な画像内テキストが含まれており、生成された画像を編集または再組版する必要がなくなります。Atlas Cloudの無料Turboティアにより、チームがどのクリエイティブバリアントをスケールするかを評価する間のテストコストをゼロに抑えることができます。
製品およびデザインチームはERNIE Imageを使用して、英語または中国語で正確にレンダリングされたリアルなプレースホルダーテキストを含むUIモックアップのスクリーンショットを生成します。このモデルは、ボタンのラベル、ナビゲーションテキスト、フォームフィールド、およびモーダルのテキストを高忠実度で処理し、テキストレイヤーを手動で編集することなく、モックアップをプレゼンテーションでそのまま使用できるようにします。これにより、ワイヤーフレームのコンセプトからステークホルダー向けの視覚資料が完成するまでの時間が、数時間から数分に短縮されます。
ERNIE Image は、中国語テキストのレンダリングにおいて LongTextBench で0.96以上のスコアを記録しており、オープンウェイトのテキストから画像への生成モデルの中で最高となっています。競合するオープンソースモデルの多くは中国語テキストのシナリオにおいて0.3を大きく下回るスコアにとどまっており、生成された画像内に可読性の高い中国語を必要とするワークフローにおいて信頼性に欠けます。出力において正確な中国語テキストが必須要件である場合、ERNIE Image が実用的な選択肢となります。
はい。ERNIE Imageは、単一の生成呼び出しで両方の文字を処理し、それぞれ独立して高い精度を維持します。これは、同じレイアウト内で両方の言語を読みやすくする必要があるバイリンガルのポスター、パッケージ、およびマーケティング資料に有用です。英語と中国語の両方のLongTextBenchスコアは0.96を超えています。
ERNIE Imageには軽量なPrompt Enhancerが組み込まれており、短い入力プロンプトを拡散モデルに渡す前に、より豊富で構造化された記述に自動的に書き換えます。これにより、大規模なプロンプトエンジニアリングを行わずとも、短いプロンプトを送信するだけで、より詳細で正確な出力結果を得ることができます。このPrompt Enhancerは、API呼び出しのたびに生成パイプラインの一部として実行されます。
ERNIE Image Turboは、DMD(拡散モデル蒸留)と強化学習を使用して、推論を50ステップから8ステップに圧縮し、6倍以上の速度向上を実現します。TurboはAtlas Cloudで無料で利用でき、迅速なイテレーションやドラフト生成に適しています。標準モデルは最高画質で動作し、商業用ポスターやエディトリアルグラフィックなどの最終成果物に適しています。
はい。ERNIE ImageはApache 2.0ライセンスの下で公開されており、商用利用、改変、および再配布が許可されています。生成された画像は、広告、パッケージ、出版物、およびその他の商用アプリケーションに使用できます。特定の条件については、ERNIE ImageのGitHubリポジトリでライセンスの全条項をご確認ください。
Atlas Cloud を最大限に活用するためのガイド、チュートリアル、製品アップデート。
Join the Discord community for the latest model updates, prompts, and support.