HiDream O1 1.5 Image API for Pixel-Native Creation

The HiDream O1 1.5 Image API brings HiDream.ai's unified foundation model to your stack, running text-to-image, single-image editing, and subject-driven personalization on one pixel-level system. Tune guidance and inference steps for strong prompt fidelity across six aspect ratio presets. Atlas Cloud delivers it through one OpenAI-compatible endpoint with transparent pay-as-you-go pricing at $0.044 per image. Start building today.

探索领先模型(2)

NEW

文生图

HiDream O1 1.5 Text-to-Image

暂无描述

HiDream O1 1.5 Edit

暂无描述

From

$0.044/张

Every HiDream O1 1.5 Image API Endpoint, Side by Side

Compare what each route of the HiDream O1 1.5 Image API takes in, renders out, and charges per call.

Modality	Description
HiDream O1 1.5 Text-to-Image API (Text To Image)	Turn a written prompt of up to 2,500 characters into a fully composed image across six presets, from a 512x512 square to 16:9 landscape, with PNG, JPEG, or WebP output. Denoising steps range from 1 to 100 and guidance scale from 1.0 to 20.0, so each request can trade speed against how tightly the result follows your prompt. At $0.044 per image, it fits e-commerce mockups, advertising concepts, and game art produced at volume.
HiDream O1 1.5 Edit API (Image Editing)	Feed one reference image URL alongside your instruction and this endpoint rewrites that image, or pass several URLs for subject-driven personalization across a set. It shares the same six size presets, 1 to 100 inference steps, and 1.0 to 20.0 guidance range as the text-to-image route, returning PNG, JPEG, or WebP. Billed at $0.044 per image, it handles product retouching, background swaps, and consistent character edits.

Modality

Description

HiDream O1 1.5 Text-to-Image API (Text To Image)

Turn a written prompt of up to 2,500 characters into a fully composed image across six presets, from a 512x512 square to 16:9 landscape, with PNG, JPEG, or WebP output. Denoising steps range from 1 to 100 and guidance scale from 1.0 to 20.0, so each request can trade speed against how tightly the result follows your prompt. At $0.044 per image, it fits e-commerce mockups, advertising concepts, and game art produced at volume.

HiDream O1 1.5 Edit API (Image Editing)

Feed one reference image URL alongside your instruction and this endpoint rewrites that image, or pass several URLs for subject-driven personalization across a set. It shares the same six size presets, 1 to 100 inference steps, and 1.0 to 20.0 guidance range as the text-to-image route, returning PNG, JPEG, or WebP. Billed at $0.044 per image, it handles product retouching, background swaps, and consistent character edits.

HiDream O1 1.5 Image API 内置精度与控制能力

HiDream O1 1.5 Image API 将文本生成图像、基于指令的编辑和主体驱动的个性化统一在一个像素原生模型中，可渲染准确的双语文本，并让开发者直接控制 guidance、采样步数和输出格式。

使用 HiDream O1 1.5 Image API 进行 Text-to-Image

发送最长 2,500 个字符的提示词，模型会通过单一的像素原生 transformer 将其渲染为完整图像，并在同一个共享空间中编码像素、文本和任务条件。由于生成路径中没有外部 VAE 或独立文本编码器，即使是信息密集、包含多个从句的描述，细节和构图也能保持稳定。因此，它非常适合作为概念艺术、营销视觉和产品样机的可靠基础。

双语文本与版式渲染

很少有图像模型能在构图中放置清晰可读的文字，而 HiDream O1 1.5 可以清晰渲染中文、英文、混合语言字符串和数字数据，足以省去手动修图。像素原生设计能够处理多区域版式，让标题、说明文字和标签保持锐利；而潜空间模型往往会让字体模糊或乱码。设计师可以快速起草海报、包装和社交媒体图形，其中文字可直接用于交付。

HiDream O1 1.5 Image API 的 In-Context Editing

当你传入一个参考图像 URL，并附上一条自然语言指令，例如 remove the earphones，edit endpoint 会在保留周围构图的同时应用修改。生成和编辑由同一个模型完成，因此光照、风格和未改动区域能够保持一致，而不是从头重建。团队可以用它在已获批准的视觉素材上快速迭代，而无需重新设计。

主体驱动的个性化

通过传入多个参考图像 URL，模型可以锁定某个主体，并在全新的场景、姿势和背景中延续其身份特征。这种主体驱动模式无需针对每张图像进行微调，就能让角色、产品或品牌吉祥物在不同生成结果中保持可识别性。它适用于需要同一形象反复出现的营销活动、故事板和游戏资产。

一个 Key，全面控制，按量付费

你到底需要多少控制能力？可以将 guidance_scale 从 1.0 调整到 20.0，将 inference steps 从 1 调整到 100，选择六种画幅预设之一，并导出为 PNG、JPEG 或 WebP。每次调用都通过一个 OpenAI-compatible endpoint 执行，价格透明，为每张图像 $0.044，按量计费且无需订阅。立即开始构建。

HiDream O1 1.5 Image API 对比领先模型：同一提示词，三种渲染

将同一个提示词同时发送给 HiDream O1 1.5 Image API 和两个竞品图像模型，然后比较它们如何把相同文字理解为构图、光照与细节表现。

提示词

地中海港口小镇里一个热闹的清晨鱼市，木质摊位前摆着手写粉笔价目板，写着当天的新鲜渔获，一位系着条纹围裙的年轻鱼贩正大笑着做出手势，将一条银色沙丁鱼抛向空中，低角度金色侧光掠过湿漉漉的鹅卵石路面和闪亮的鱼鳞，深度长焦压缩效果将摊位层层叠叠地推向后方柔和薄雾中的港湾，青绿色百叶窗、温暖陶土色墙面与冷调银色鱼身构成的色彩组合，清晰的粉笔字迹和风化木纹，抓拍式纪实报道摄影，35mm，宽幅 16:9 画幅，满版出血

Generated with HiDream O1 1.5 on Atlas Cloud

Generated with Nano Banana Pro on Atlas Cloud

Generated with Seedream v4.5 on Atlas Cloud

提示词

一对猩红金刚鹦鹉在结满果实的号角树枝头争吵的瞬间，翅膀展开成一片猩红与钴蓝的爆发，其中一只鸟在振翅中倒翻过来，柔和阴天的丛林逆光透过半透明羽毛发出微光，使用 400mm 长焦拍摄，将层层薄雾中的雨林压缩到背景里，右侧三分之一画面由浅色天空形成充足留白，红色羽毛与深翡翠绿 foliage 形成互补对照，羽枝与鸟喙纹理锐利呈现，自然史野生动物摄影，宽幅 16:9 画幅，满版出血

Generated with HiDream O1 1.5 on Atlas Cloud

Generated with Nano Banana Pro on Atlas Cloud

Generated with Seedream v4.5 on Atlas Cloud

借助 HiDream O1 1.5 Image API，从提示词走向生产落地

在电商、广告、游戏美术和社交营销活动中，HiDream O1 1.5 Image API 可将一个提示词或一组参考图转化为生成、编辑以及主体一致的个性化图像，统一价格为每张图 $0.044。

电商产品视觉图

零售团队只需输入文本提示词，即可按每张图 $0.044 生成产品图和生活方式场景，并可从六种宽高比预设中选择。无需拍摄或等待影棚交付，即可上线商品目录视觉素材。

基于 HiDream O1 1.5 Image API 的广告创意

制作广告海报和横幅，生成构图严谨、电影感布光的画面，覆盖横版、竖版和方形版式。代理机构可一次性迭代核心创意，然后向客户交付可直接用于生产的美术素材。

精准照片编辑

一张参考图加上一段编辑提示词，即可让模型在保留照片结构和光照的同时进行风格重塑、修饰或重新构图。设计师无需完整编辑工具，也能修正背景或替换元素。

借助 HiDream O1 1.5 Image API 保持角色一致

输入多张参考图后，模型可在全新场景中保持角色、产品或吉祥物的一致性。工作室能够构建可复用的品牌资产和始终保持形象一致的系列营销素材。

游戏美术与概念设计

当游戏团队需要环境、道具或角色概念图时，模型可根据 guidance scale 和 inference steps 返回细节丰富的美术图。美术总监可在投入工作室时间之前探索不同视觉方向。

基于 HiDream O1 1.5 Image API 的社交营销活动

内容日历排得很满？营销人员可快速生成适用于帖子、故事和缩略图的吸睛视觉素材，覆盖方形、竖版和横版预设，每张图价格统一且可预测，为 $0.044。

HiDream O1 1.5 Image API 与竞品图像模型的对比

了解 HiDream O1 1.5 Image API 在内置推理、双语文本、开放权重和单张图片成本方面，相比 Alibaba 和 ByteDance 图像模型的表现。

模型	提供方	推理提示词代理	双语文本渲染	开放权重	价格（每张图）
HiDream O1 1.5 Text-to-Image	HiDream.ai	√	√	√	$0.044
HiDream O1 1.5 Edit	HiDream.ai	√	√	√	$0.044
Qwen Image 2.0	Alibaba (Qwen)	-	√	-	$0.035
Seedream v4.5	ByteDance	-	√	-	$0.04

如何在 Atlas Cloud 上使用 HiDream

几分钟即可上手 — 按照以下简单步骤，通过 Atlas Cloud 平台集成和部署模型。

创建 Atlas Cloud 账户

在 atlascloud.ai 注册并完成验证。新用户可获得免费额度，用于探索平台和测试模型。

为何在 Atlas Cloud 使用 HiDream

将先进的 HiDream 模型与 Atlas Cloud 的 GPU 加速平台相结合，提供无与伦比的性能、可扩展性和开发体验。

性能与灵活性

低延迟：
GPU 优化推理，实现实时响应。

统一 API：
一次集成，畅用 HiDream、GPT、Gemini 和 DeepSeek。

透明定价：
按 Token 计费，支持 Serverless 模式。

企业与规模

开发者体验：
SDK、数据分析、微调工具和模板一应俱全。

可靠性：
99.99% 可用性、RBAC 权限控制、合规日志。

安全与合规：
SOC 2 Type II 认证、HIPAA 合规、美国数据主权。

HiDream O1 1.5 Image API 常见问题解答

HiDream O1 1.5 Image API 让开发者可以通过 Atlas Cloud 上单一的 OpenAI-compatible endpoint，以编程方式访问 HiDream 的统一图像生成模型。它基于像素级统一 transformer 构建，可由一个模型完成 text-to-image、编辑以及基于主体的个性化生成，无需组合多套独立工具。支持 Day-0 访问，按量付费，并提供透明的按次调用定价。

除了直接的 text-to-image 生成外，该模型还支持基于指令的编辑、跨多张参考图的主体驱动个性化，以及用于海报和商业图形的高精度长文本渲染。团队常将它用于电商产品视觉、广告创意和游戏美术等场景，在这些场景中，精准构图和图中文字的可读性同样重要。

支持。HiDream O1 1.5 经过训练，可理解中文和英文中的细微提示词语义，并能以较高准确度渲染多语言图中文字。因此，对于需要交付本地化视觉内容、又不想在多个模型之间切换的团队来说，它非常实用。

你可以使用一个 OpenAI-compatible key 调用 HiDream O1 1.5 Image API，因此大多数现有 SDK 只需指向 Atlas Cloud endpoint 即可使用。向 hidream-o1-1.5/text-to-image model 发送包含提示词和任意可选参数的请求，然后读取生成的图像即可。你侧无需单独托管模型或准备 GPU 基础设施。

提示词最长可达 2,500 个字符，并可从预设尺寸中选择，包括 1024x1024 的 square_hd、512x512 的 square，以及 4:3 和 16:9 的竖版与横版选项。你还可以将 num_inference_steps 在 1 到 100 之间调整，默认值为 50；将 guidance_scale 设置在 1.0 到 20.0 之间，默认值为 5.0；并返回 PNG、JPEG 或 WebP。

在 reference_image_urls 中传入单个 URL，可对现有图像执行基于指令的编辑；传入多个 URL，则可驱动个性化生成，在不同场景中保持主体一致。若进行标准 text-to-image 生成，请将该字段留空。针对编辑工作流，还提供专用的 hidream-o1-1.5/edit model，按图像计费价格相同。

在 Atlas Cloud 上，HiDream O1 1.5 Image API 的价格为每张图像 $0.044，text-to-image 和 edit models 采用相同费率。计费方式为按量付费，并提供透明的按次调用定价，因此你只需为实际生成的图像付费，无需订阅。立即开始构建。

在 Atlas Cloud 上，你可以选择预设尺寸，例如 1024x1024 的 square_hd；该模型通过统一 transformer 直接从原始像素合成每张图像，而不是压缩到 latent space 中。由于细节和图中文字是直接生成的，而不是从瓶颈结果放大得到的，HiDream 以海报和产品图形中的清晰排版与锐利边缘而著称。

探索更多系列

Seedance 2.0

Seedance 2.0 API 为您提供 ByteDance 多模态视频模型的生产级访问权限——支持四模态输入（文本、图像、视频、音频），以及行业领先的“Universal Reference”（通用参考）系统，可在不同镜头间锁定构图、运镜和角色动作。只需一次 API 调用即可集成导演级控制，固定费率为 $0.09/秒，即时获取密钥，无需排队——由企业级正常运行时间和合规性提供保障。Seedance 2.0 原生 4K 现已上线！

查看系列

Grok Imagine

Grok Imagine API 为开发者提供 xAI 的图像、视频和音频生成一站式套件。它可以生成分辨率高达 2K 且支持多语言文本渲染的图像，以及长达 15 秒且带有原生同步音频和基于参考图像编辑功能的视频。在 Atlas Cloud 上，只需一个密钥即可运行每个 Grok Imagine 模式，因此您可以在图像、视频和音频之间无缝切换，无需单独设置，每张图像 0.02 美元起，每秒 0.05 美元起。

查看系列

Gemini Omni Flash

Gemini Omni API 将 Google DeepMind 在 Google I/O 2026 上发布的多模态视频生成与编辑模型带入你的技术栈。Gemini Omni 将 Gemini 的推理引擎与生成式媒体融合，可接受文本、图像、视频和音频的任意组合输入，生成一致且以知识为依据的输出。通过自然对话不断打磨结果：替换物体、重写场景、切换风格，同时保持物理规律、角色形象和画面连贯性不变。Atlas Cloud 通过统一的 API 提供完整的 Gemini Omni Flash 系列——文生视频、支持最多 7 张参考图的图生视频，以及参考图生视频——按秒计费、价格透明，低至 $0.112 起，且无需订阅。立即开始构建。

查看系列

GPT Image 2

GPT Image 2 API 为开发者提供了访问 OpenAI 最新图像模型的途径，它是 GPT Image 1.5 的继任者。该模型可生成和编辑图像，能够在拉丁和 CJK 文字上实现准确的文本渲染，并在海报、样机和信息图表方面具备强大的排版能力。在 Atlas Cloud 上，您可以通过一个统一的 API 与 300 多个模型一起访问它，并享受免费额度、99.99% 的正常运行时间，且无需 OpenAI 组织验证。

查看系列

Google

Google最强大的创意模型现已在Atlas Cloud上全面可用。Veo 3.1提供电影级别的视频生成，Nano Banana 2支持高保真图像创建，而Gemini为每个工作流带来多模态智能。通过单一API key即可访问完整的Google模型套件，提供Day-0可用性和按需付费（pay-as-you-go）定价。

查看系列

Seedance 2.0 Mini

Seedance 2.0 Mini 将 ByteDance 的多模态视频生成技术引入到对速度和成本要求极高的工作流中。它以更轻量的占用空间提供 Seedance 2.0 的核心能力——更快的生成速度、更低的单条视频成本，并且使用您现有的同款 API 集成。对于运行高吞吐量流水线或进行大规模原型设计的团队来说，Mini 是最实用的默认选择。

查看系列

ByteDance

从电影级视频生成到高保真图像创建，ByteDance 最强大的模型现已在 Atlas Cloud 上线。以最低的推理定价和零基础设施开销，大规模运行 Seedance 和 Seedream。

查看系列

Alibaba

Atlas Cloud 将 Alibaba 的全系模型阵容整合至同一个 API 中：Qwen 用于语言和图像任务，Wan 用于高达 1080p 的视频生成。所有模型均采用按需付费模式，无需订阅。您可以使用现有的 OpenAI 兼容客户端，通过单一的 base URL 访问 Alibaba API。

查看系列

OpenAI

Atlas Cloud 为您提供访问完整 OpenAI API 产品线的权限，从用于图像生成的 GPT Image 2 到用于视频的 Sora 2。每个模型均采用按需付费模式，无月度消费限制。使用兼容 OpenAI 的 API，只需简单替换基础 URL 即可轻松接入。

查看系列

xAI

在 Atlas Cloud 上使用 xAI API 构建完整的图像和视频处理工作流。以 2K 分辨率生成、使用参考图像进行编辑，并将图像动画化为音画同步的视频片段。

查看系列

Kwaivgi

Kwaivgi API 价格低于标准定价 15%。Atlas Cloud 提供对最新 Kling 版本的零日（Day-0）访问权限，采用按需付费定价且无席位限制。一个账户，一个密钥，畅享从标准版到大师版的所有 Kling 模型。

查看系列

Seedream 5.0 Pro

Seedream 5.0 Pro API 为开发者在 Atlas Cloud 上提供了字节跳动的可控图像编辑模型。它通过锚点和坐标精确定位编辑，将图像分离为可编辑图层，融合多个参考，并精准匹配颜色和材质，支持 2K 和 3K 分辨率的多语言文本。在 Atlas Cloud 上，您只需一个密钥即可访问！

查看系列

一个 API，畅享全模态 AI。

探索全部模型