Hero background 1Hero background 2Hero background 3

Hunyuan 3D Generation Models

Hunyuan3D is a state-of-the-art 3D generative foundation model from Tencent that turns text prompts and single images into high-quality, textured 3D meshes. Built on a two-stage pipeline—Hunyuan3D-DiT for shape generation via flow-matching diffusion and Hunyuan3D-Paint for multi-view texture synthesis—it produces clean geometry with full PBR materials ready for game engines, AR/VR, 3D printing, and DCC tools. Available in Pro (up to 1.5M faces, 4K PBR textures) and Rapid (2–3 minute lightweight generation) tiers, with both Text-to-3D and Image-to-3D entry points, Hunyuan3D is the premier AI 3D toolkit for game developers, e-commerce teams, and 3D content studios. Generations start at $0.02 each.

主要モデルを探索

Atlas Cloudは、業界をリードする最新のクリエイティブモデルを提供します。

Hunyuan 3D生成モデルの比較

モデルバージョンを横並びで比較 — 解像度、速度、料金、機能を一目で確認し、プロジェクトに最適なオプションを見つけましょう。

モデル説明
Hunyuan 3D Pro — Text To 3Dテキストプロンプトから高品質のテクスチャ付きメッシュを生成し、オプションのPBRマテリアルとカスタムポリゴン数をサポートします。1536³のボクセル解像度を持つ36億パラメータのバックボーンに支えられ、標準ジオメトリ、ローポリスタイライズド、スケッチ駆動、マルチビュー再構築の4つのモードをサポートします。レイテンシは3〜6分、最大3つの同時ジョブが可能です。
Hunyuan 3D Pro — Image To 3D単一の画像から高品質なテクスチャ付きメッシュを生成し、オプションのPBRマテリアルとカスタムポリゴン数(4万~150万)に対応。形状生成にHunyuan3D-DiT、4KテクスチャリングにHunyuan3D-Paintを使用。出力フォーマットはGLB、OBJ、FBX、STL、USDZ。レイテンシは3~6分、3つの同時ジョブに対応。
Hunyuan 3D Rapid — Text To 3Dテキストプロンプトからの高速で軽量なメッシュ生成(オプションのPBRマテリアル付き)。迅速なイテレーションのために調整された、蒸留および速度最適化されたバリアント:2〜3分のレイテンシ、固定された中程度のポリゴン数、1Kテクスチャ、およびMP4プレビューエクスポート。1つの同時実行ジョブ。
Hunyuan 3D Rapid — Image To 3D高速かつ軽量なパイプラインを通じて、1枚の写真をテクスチャ付きメッシュに変換します。同じ2〜3分のレイテンシ、固定のポリゴン予算、1Kテクスチャを備え、大量のカタログ処理や迅速なプロトタイピングに最適です。同時実行ジョブ数1。

Hunyuan 3Dモデルの主な特徴

先進的なモデルと Atlas Cloud の GPU アクセラレーションプラットフォームを組み合わせ、画像・動画生成において比類のない速度、拡張性、クリエイティブコントロールを実現します。

高忠実度ジオメトリ

高忠実度ジオメトリ

Hunyuan3D の形状ブランチは、36億パラメータのバックボーンを備え、1536³ のボクセル解像度で動作するフロー・マッチング拡散 Transformer を使用して、水密で詳細なジオメトリを生成します。Pro ティアでは、リアルタイムおよびオフラインのパイプラインを対象として、4万から150万のポリゴン(faces)を構成できます。これは、ゲーム対応アセットと高精細な VFX モデルのための究極のソリューションです。

PBRテクスチャ合成

PBRテクスチャ合成

Paintブランチは、マルチビュー拡散を使用してビューの一貫した表面を実現し、アルベド、ノーマル、メタリック、ラフネスなどの完全なPBRマテリアルセットを合成します。Proは最大4Kのテクスチャを生成し、Rapidはより軽いワークロード向けに1Kマップを提供します。これは、Unreal、Unity、およびBlenderでのフォトリアルなレンダリングのための究極のソリューションです。

テキストからの3D生成

テキストからの3D生成

Hunyuan 3Dは、英語または中国語で最大1024文字のプロンプトを受け付け、自然言語の記述を直接テクスチャ付きメッシュに変換します。参照画像は必要ありません。これは、テキストの指示書きからコンセプト探索と迅速なアセットのアイデア出しを行うための究極のソリューションです。

画像からの3D再構成

画像からの3D再構成

Hunyuan3Dは、単一の参照画像(JPG/PNG/WEBP、128〜5000 px、6 MB以下)から、テクスチャが適用された完全な3Dメッシュを再構築します。製品写真、コンセプトアート、スケッチを実用的な3Dモデルに変換するための究極のソリューションです。

マルチモーダル生成 (Pro)

マルチモーダル生成 (Pro)

Pro階層では、標準ジオメトリ、ローポリのスタイライズ出力、スケッチ駆動の合成、マルチビュー画像条件付けの4つの専用モードが提供されており、アセットに合わせてワークフローを調整できます。これは、単一のモデルからスタイライズされた出力と高精細な出力の両方を必要とするスタジオにとって究極のソリューションです。

本番環境対応のエクスポートと速度ティア

本番環境対応のエクスポートと速度ティア

出力はGLB、OBJ、FBX、STL、USDZ形式で提供され(RapidではMP4のターンテーブル動画も追加可能)、最大のディテールを求める場合はPro(3〜6分)、高速なイテレーションにはRapid(2〜3分)を選択できます。生成されたアセットをゲーム、Web、AR、および3Dプリントのパイプラインに直接組み込むための究極のソリューションです。

Hunyuan 3Dモデルでできること

このモデルファミリーで構築できる実用的なユースケースとワークフローを発見 — コンテンツ作成や自動化から本番グレードのアプリケーションまで。

アニメーション&VFXプレビジュアライゼーション

プロンプトやコンセプトアートから3Dアセットを迅速にブロックアウトし、手作業によるモデリングに移行する前に、プリビス、レイアウト、ルックデブ(look-development)を加速させます。

EコマースおよびAR製品ビジュアライゼーション

単一の製品写真をインタラクティブな3DモデルやUSDZ ARアセットに変換し、大量のカタログ処理と没入型のショッピング体験を実現します。

ゲームアセット作成

構成可能なポリゴン予算とPBRテクスチャを使用してキャラクター、プロップ、環境パーツを生成し、GLB/FBXをUnityまたはUnrealに直接エクスポートします。キャラクターワークフロー向けの自動リギング機能もサポートしています。

Atlas Cloud で Hunyuan 3D Generation Models を使う方法

数分で始められます — 以下の簡単なステップに従って、Atlas Cloud プラットフォームでモデルを統合・デプロイしましょう。

Atlas Cloud アカウントを作成

atlascloud.ai でサインアップし、認証を完了します。新規ユーザーには無料クレジットが付与され、プラットフォームの探索やモデルのテストに使用できます。

Atlas CloudでHunyuan 3D Generation Modelsを使用する理由

高度なHunyuan 3D Generation ModelsモデルとAtlas CloudのGPU加速プラットフォームを組み合わせることで、比類のないパフォーマンス、スケーラビリティ、開発者エクスペリエンスを提供。

パフォーマンスと柔軟性

低レイテンシ:
リアルタイム推論のためのGPU最適化推論。

統合API:
1つの統合でHunyuan 3D Generation Models、GPT、Gemini、DeepSeekを実行。

透明な料金:
サーバーレスオプション付きの予測可能なtoken単位の課金。

エンタープライズとスケール

開発者エクスペリエンス:
SDK、分析、ファインチューニングツール、テンプレート。

信頼性:
99.99%の稼働率、RBAC、コンプライアンス対応ロギング。

セキュリティとコンプライアンス:
SOC 2 Type II、HIPAA準拠、米国内のデータ主権。

Seed 3D に関するよくあるご質問

Seed3D V2.0は、粗密2段階のジオメトリ(シャープなエッジと正確なトポロジを実現)、統合されたPBRマテリアル生成(アルベド、ノーマル、メタリック、ラフネスをシングルパスで生成)、およびURDFフォーマットでのパーツレベルのアーティキュレーション出力を組み合わせた、唯一の商用3D生成モデルです。60名のプロフェッショナルな3Dモデラーによるブラインド評価において、ジオメトリ品質でTripo 3.0に対して92.8%の勝率を達成しました。これは、2026年中期時点で公開されているすべてのimage-to-3Dモデルの中で最高のベンチマークです。

V2.0はV1.0のすべての主要な弱点に対処しています。カスケード型のRGB優先/PBR分解パイプラインは、誤差の蓄積を排除する統合されたシングルパスモデルに置き換えられました。単一ステージのDiTは、エッジの軟化とトポロジーの歪みを解決する2ステージの粗密(coarse-to-fine)アーキテクチャに置き換えられました。さらに、パーツレベルの生成モジュールとシーン合成モジュールは完全に新しい機能です。ブラインドでの人間による評価において、V2.0はジオメトリ品質でV1.0に対して98.3%の勝率を達成しました。

はい。Seed3D V2.0は、UnityやUnreal Engineに直接インポートできる完全なPBRマテリアルマップを備えたFBXおよびGLB形式を出力します。coarse-to-fine(粗いものから細かいものへ)のジオメトリパイプラインにより、リアルタイムレンダリングに適したクリーンなトポロジが生成されます。ただし、ByteDanceは最終的な本番環境へのデプロイ前に人間によるレビューを推奨しています。これは、すべてのオブジェクトカテゴリにおけるジオメトリの詳細や、UVマッピングのエッジケースに関して、モデルにまだ制限があることを認識しているためです。

Atlas Cloud経由のSeed3D V2.0は、GLB、OBJ、USD、USDZの4つのフォーマットを出力し、単一の.zipアーカイブにまとめて提供されます。GLBはUnity / Unreal EngineおよびWeb 3Dワークフローで推奨されています。USDZはApple AR Quick LookおよびiOS/iPadOSのAR体験を対象としています。OBJおよびUSDは一般的なDCCパイプラインでの使用に適しています。すべてのフォーマットには、同一パスで生成された完全なPBRテクスチャマップが含まれています。

Seed3D V2.0 は、単一の統合されたモデルパスで4つの標準PBRチャンネルマップ(Albedo(ベースカラー)、Normal(表面ディテール)、Metallic(反射率)、Roughness(表面テクスチャ))を同時に生成し、すべてのマテリアルプロパティにわたって物理的な一貫性を確保します。

さらにファミリーを探索

Seedance 2.0 Models

Seedance 2.0(by Bytedance) is a multimodal video generation model that redefines "controllable creation," moving beyond the limitations of text or start/end frames. It supports quad-modal inputs—text, image, video, and audio—and introduces an industry-leading "Universal Reference" system. By precisely replicating the composition, camera movement, and character actions from reference assets, Seedance 2.0 solves critical issues with character consistency and physical coherence, empowering creators to act as true "directors" with deep control over their output.

ファミリーを表示

Grok-Imagine Models

Grok Imagine Image Quality is xAI's latest AI image generation model, delivering studio-grade visuals with up to 2K resolution and razor-sharp detail. It offers best-in-class text rendering across multiple languages, photorealistic outputs with natural lighting, rich textures, and believable physics, plus tighter prompt following and image editing with reference inputs for precise creative control. Ideal for hero images, ad creatives, product renders, and brand-grade visuals.

ファミリーを表示

Gemini Omni

Gemini Omni (by Google DeepMind) is a video generation and editing model launched on May 20, 2026 at Google I/O that redefines the standard for "reasoning-driven creation," built specifically to solve the core challenge of AI video: making output that actually understands what you mean, not just what you type. It fuses Gemini's reasoning engine with generative capability, accepting any mix of images, text, video, and audio to produce consistent, knowledge-grounded output. Unlike models that start from scratch each time, Omni lets you edit through natural conversation — swapping objects, rewriting scenes, shifting styles — while keeping physics, characters, and continuity intact across every turn.

ファミリーを表示

GPT Image 2 Models

GPT Image 2 is a state-of-the-art multimodal foundation model engineered for exceptional text-to-image generation with unprecedented photorealism and creative versatility. Developed by OpenAI as the evolution of the DALL-E lineage, it transforms detailed natural language descriptions into hyper-realistic imagery at up to 4K resolution. With proprietary "Neural Rendering Engine" technology for precise visual control, GPT Image 2 delivers studio-quality results with accurate anatomy, lighting, and composition—making it the premier AI tool for professional creators, enterprises, and developers demanding production-ready visual assets.

ファミリーを表示

Google Models on Atlas Cloud | Gemini, Nano Bananas & Veo

Googleの最も強力なクリエイティブモデルはすべてAtlas Cloudで利用可能です。Veo 3.1はシネマティックな動画生成を実現し、Nano Banana 2は高忠実度な画像作成を強化し、Geminiはあらゆるワークフローにマルチモーダルなインテリジェンスをもたらします。Day-0の可用性と従量課金制(pay-as-you-go)の料金体系を備えた単一のAPI keyを通じて、Googleモデルスイート全体にアクセスできます。

ファミリーを表示

ByteDance Models on Atlas Cloud | Seedance & Seedream

シネマティックな動画生成から高忠実度の画像作成まで、ByteDanceの最も強力なモデルがAtlas Cloudで利用可能になりました。最低水準の推論価格とゼロのインフラストラクチャオーバーヘッドで、SeedanceとSeedreamを大規模に実行できます。

ファミリーを表示

Alibaba Models on Atlas Cloud | Wan & Qwen

Atlas Cloudは、Alibabaの全モデルラインナップを単一のAPIに統合します。言語および画像タスク用のQwen、最大1080pの動画生成用のWanが利用可能です。すべてのモデルはサブスクリプション不要の従量課金制(pay-as-you-go)でアクセスできます。Alibaba APIは、既存のOpenAI互換クライアントを使用し、単一のベースURLを介して利用可能です。

ファミリーを表示

MAI Image 2.5 Models

MAI-Image-2.5 は、商用デザイン、製品写真、ブランド向けコンテンツ作成のために構築された、Microsoft の最新のフォトリアルな画像生成および編集モデルファミリーです。テキストから画像への生成および画像編集の両方で、標準および Flash バリアントが利用可能であり、1画像あたり 0.03 ドルからという競争力のある価格設定で、クラス最高の Arena ELO スコアを提供します。正確なテキストレンダリング、外科手術のような精密な編集機能、および自然なポートレート生成を備えた MAI-Image-2.5 は、ポストプロセスのオーバーヘッドなしで本番環境レベルの品質のビジュアルを必要とするチーム向けに設計されています。

ファミリーを表示

Wan2.7 Models

Launching this March, Wan2.7 is the latest powerhouse in the Qwen ecosystem, delivering a massive upgrade in visual fidelity, audio synchronization, and motion consistency over version 2.6. This all-in-one AI video generator supports advanced features like first-and-last frame control, 3x3 grid synthesis, and instruction-based video editing. Outperforming competitors like Jimeng, Wan2.7 offers superior flexibility with support for real-person image inputs, up to five video references, and 1080P high-definition outputs spanning 2 to 15 seconds, making it the premier choice for professional digital storytelling and high-end content marketing.

ファミリーを表示

Nano Banana2 Models

Nano Banana 2 (by Google), is a generative image model that perfectly balances lightning-fast rendering with exceptional visual quality. With an improved price-performance ratio, it achieves breakthrough micro-detail depiction, accurate native text rendering, and complex physical structure reconstruction. It serves as a highly efficient, commercial-grade visual production tool for developers, marketing teams, and content creators.

ファミリーを表示

Hunyuan 3D Generation Models

Hunyuan3D is a state-of-the-art 3D generative foundation model from Tencent that turns text prompts and single images into high-quality, textured 3D meshes. Built on a two-stage pipeline—Hunyuan3D-DiT for shape generation via flow-matching diffusion and Hunyuan3D-Paint for multi-view texture synthesis—it produces clean geometry with full PBR materials ready for game engines, AR/VR, 3D printing, and DCC tools. Available in Pro (up to 1.5M faces, 4K PBR textures) and Rapid (2–3 minute lightweight generation) tiers, with both Text-to-3D and Image-to-3D entry points, Hunyuan3D is the premier AI 3D toolkit for game developers, e-commerce teams, and 3D content studios. Generations start at $0.02 each.

ファミリーを表示

Midjourney Models

Midjourney is a proprietary AI image and video generation platform developed by Midjourney, Inc. (San Francisco). Founded in 2021 by David Holz, it has become the aesthetic gold standard in generative AI — transforming text prompts into cinematic, painterly visuals at native 2K resolution. The latest V8.1 architecture, rebuilt from scratch on GPU-native PyTorch, delivers 4–5× faster generation, true 2048×2048 output without upscaling artifacts, and a signature visual style that remains unmatched by competitors. With the addition of Video V1, Midjourney extends its aesthetic into motion — animating still images into atmospheric 5-second cinematic clips. From brand campaigns to film pre-visualization to game concept art, Midjourney is the premier AI creative tool for professionals who demand both speed and artistry.

ファミリーを表示

ひとつのAPIで、あらゆるメディアAIを。

すべてのモデルを探索

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.