Open and Advanced Large-Scale Image Generative Models.

Open and Advanced Large-Scale Image Generative Models.
แต่ละครั้งจะใช้ $0.084 ด้วย $10 คุณสามารถรันได้ประมาณ 119 ครั้ง
คุณสามารถทำต่อได้:
import requests
import time
# Step 1: Start image generation
generate_url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "google/nano-banana-pro/edit-developer",
"prompt": "A beautiful landscape with mountains and lake",
"width": 512,
"height": 512,
"steps": 20,
"guidance_scale": 7.5,
}
generate_response = requests.post(generate_url, headers=headers, json=data)
generate_result = generate_response.json()
prediction_id = generate_result["data"]["id"]
# Step 2: Poll for result
poll_url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
def check_status():
while True:
response = requests.get(poll_url, headers={"Authorization": "Bearer $ATLASCLOUD_API_KEY"})
result = response.json()
if result["data"]["status"] == "completed":
print("Generated image:", result["data"]["outputs"][0])
return result["data"]["outputs"][0]
elif result["data"]["status"] == "failed":
raise Exception(result["data"]["error"] or "Generation failed")
else:
# Still processing, wait 2 seconds
time.sleep(2)
image_url = check_status()ติดตั้งแพ็คเกจที่จำเป็นสำหรับภาษาของคุณ
pip install requestsคำขอ API ทั้งหมดต้องมีการยืนยันตัวตนผ่าน API key คุณสามารถรับ API key ได้จากแดชบอร์ด Atlas Cloud
export ATLASCLOUD_API_KEY="your-api-key-here"import os
API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
"Content-Type": "application/json",
"Authorization": f"Bearer {API_KEY}"
}อย่าเปิดเผย API key ของคุณในโค้ดฝั่งไคลเอนต์หรือที่เก็บข้อมูลสาธารณะ ให้ใช้ตัวแปรสภาพแวดล้อมหรือพร็อกซีฝั่งเซิร์ฟเวอร์แทน
import requests
url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "your-model",
"prompt": "A beautiful landscape"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())ส่งคำขอสร้างแบบอะซิงโครนัส API จะส่งคืน prediction ID ที่คุณสามารถใช้ตรวจสอบสถานะและดึงผลลัพธ์ได้
/api/v1/model/generateImageimport requests
url = "https://api.atlascloud.ai/api/v1/model/generateImage"
headers = {
"Content-Type": "application/json",
"Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
"model": "google/nano-banana-pro/edit-developer",
"input": {
"prompt": "A beautiful landscape with mountains and lake"
}
}
response = requests.post(url, headers=headers, json=data)
result = response.json()
print(f"Prediction ID: {result['id']}")
print(f"Status: {result['status']}"){
"id": "pred_abc123",
"status": "processing",
"model": "model-name",
"created_at": "2025-01-01T00:00:00Z"
}สำรวจ prediction endpoint เพื่อตรวจสอบสถานะปัจจุบันของคำขอ
/api/v1/model/prediction/{prediction_id}import requests
import time
prediction_id = "pred_abc123"
url = f"https://api.atlascloud.ai/api/v1/model/prediction/{prediction_id}"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
while True:
response = requests.get(url, headers=headers)
result = response.json()
status = result["data"]["status"]
print(f"Status: {status}")
if status in ["completed", "succeeded"]:
output_url = result["data"]["outputs"][0]
print(f"Output URL: {output_url}")
break
elif status == "failed":
print(f"Error: {result['data'].get('error', 'Unknown')}")
break
time.sleep(3)processingคำขอยังอยู่ระหว่างการประมวลผลcompletedการสร้างเสร็จสมบูรณ์แล้ว ผลลัพธ์พร้อมใช้งานsucceededการสร้างสำเร็จแล้ว ผลลัพธ์พร้อมใช้งานfailedการสร้างล้มเหลว ตรวจสอบฟิลด์ error{
"data": {
"id": "pred_abc123",
"status": "completed",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.png"
],
"metrics": {
"predict_time": 8.3
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}
}อัปโหลดไฟล์ไปยังที่เก็บข้อมูล Atlas Cloud และรับ URL ที่คุณสามารถใช้ในคำขอ API ของคุณ ใช้ multipart/form-data ในการอัปโหลด
/api/v1/model/uploadMediaimport requests
url = "https://api.atlascloud.ai/api/v1/model/uploadMedia"
headers = { "Authorization": "Bearer $ATLASCLOUD_API_KEY" }
with open("image.png", "rb") as f:
files = {"file": ("image.png", f, "image/png")}
response = requests.post(url, headers=headers, files=files)
result = response.json()
download_url = result["data"]["download_url"]
print(f"File URL: {download_url}"){
"data": {
"download_url": "https://storage.atlascloud.ai/uploads/abc123/image.png",
"file_name": "image.png",
"content_type": "image/png",
"size": 1024000
}
}พารามิเตอร์ต่อไปนี้ยอมรับในเนื้อหาคำขอ
ไม่มีพารามิเตอร์ที่ใช้ได้
{
"model": "google/nano-banana-pro/edit-developer"
}API จะส่งคืนการตอบกลับ prediction พร้อม URL ของผลลัพธ์ที่สร้างขึ้น
{
"id": "pred_abc123",
"status": "completed",
"model": "model-name",
"outputs": [
"https://storage.atlascloud.ai/outputs/result.png"
],
"metrics": {
"predict_time": 8.3
},
"created_at": "2025-01-01T00:00:00Z",
"completed_at": "2025-01-01T00:00:10Z"
}Atlas Cloud Skills เชื่อมต่อโมเดล AI กว่า 300+ เข้ากับผู้ช่วยเขียนโค้ด AI ของคุณโดยตรง ติดตั้งด้วยคำสั่งเดียว จากนั้นใช้ภาษาธรรมชาติเพื่อสร้างรูปภาพ วิดีโอ และสนทนากับ LLM
npx skills add AtlasCloudAI/atlas-cloud-skillsรับ API key จากแดชบอร์ด Atlas Cloud และตั้งค่าเป็นตัวแปรสภาพแวดล้อม
export ATLASCLOUD_API_KEY="your-api-key-here"เมื่อติดตั้งแล้ว คุณสามารถใช้ภาษาธรรมชาติในผู้ช่วย AI ของคุณเพื่อเข้าถึงโมเดล Atlas Cloud ทั้งหมด
Atlas Cloud MCP Server เชื่อมต่อ IDE ของคุณกับโมเดล AI กว่า 300+ ผ่าน Model Context Protocol ใช้งานได้กับไคลเอนต์ที่รองรับ MCP ทุกตัว
npx -y atlascloud-mcpเพิ่มการกำหนดค่าต่อไปนี้ลงในไฟล์ตั้งค่า MCP ของ IDE ของคุณ
{
"mcpServers": {
"atlascloud": {
"command": "npx",
"args": [
"-y",
"atlascloud-mcp"
],
"env": {
"ATLASCLOUD_API_KEY": "your-api-key-here"
}
}
}
}ไม่มี Schemaเสียงและภาพ ทั้งหมดในครั้งเดียว
โมเดล AI ปฏิวัติวงการของ ByteDance ที่สร้างเสียงและวิดีโอที่ซิงค์กันอย่างสมบูรณ์แบบพร้อมกันจากกระบวนการเดียวที่รวมเป็นหนึ่ง สัมผัสประสบการณ์การสร้างเสียงและภาพพื้นเมืองที่แท้จริงด้วยการซิงค์ริมฝีปากที่แม่นยำระดับมิลลิวินาทีในกว่า 8 ภาษา
Explore curated prompt templates to unlock the full potential of Nano Banana AI. Click to copy any prompt and start creating immediately.

turn this photo into a character figure. Behind it, place a box with the character's image printed on it, and a computer showing the Blender modeling process on its screen. In front of the box, add a round plastic base with the character figure standing on it. set the scene indoors if possible

Generate a highly detailed photo of a girl cosplaying this illustration, at Comiket. Exactly replicate the same pose, body posture, hand gestures, facial expression, and camera framing as in the original illustration. Keep the same angle, perspective, and composition, without any deviation

Transform the the person in the photo into an action figure, styled after [CHARACTER_NAME] from [SOURCE / CONTEXT]. Next to the figure, display the accessories including [ITEM_1], [ITEM_2], and [ITEM_3]. On the top of the toy box, write "[BOX_LABEL_TOP]", and underneath it, "[BOX_LABEL_BOTTOM]". Place the box in a [BACKGROUND_SETTING] environment. Visualize this in a highly realistic way with attention to fine details.

Transform the person in the photo into the style of a Funko Pop figure packaging box, presented in an isometric perspective. Label the packaging with the title 'ZHOGUE'. Inside the box, showcase the figure based on the person in the photo, accompanied by their essential items (such as cosmetics, bags, or others). Next to the box, also display the actual figure itself outside of the packaging, rendered in a realistic and lifelike style.

turn this illustration of a perfume into a realistic version, Frosted glass bottle with a marble cap

Transform the person from image 1 into a Q-version character design based on the face shape from image 2

convert this photo into a architecture model. Behind the model, there should be a cardboard box with an image of the architecture from the photo on it. There should also be a computer, with the content on the computer screen showing the Blender modeling process of the figurine. In front of the cardboard box, place a cardstock and put the architecture model from the photo I provided on it. I hope the PVC material can be clearly presented. It would be even better if the background is indoors.
Optimized for speed with generation times under 2 seconds for most tasks, making it perfect for real-time applications and rapid prototyping workflows.
Leveraging Google's advanced AI architecture to produce highly detailed, photorealistic images with accurate lighting, textures, and compositions.
Revolutionary 2D-to-3D conversion capabilities enabling creation of multiple viewpoints from a single image, opening new possibilities for content creation.
เข้าร่วมกับผู้สร้างภาพยนตร์ ผู้โฆษณา และผู้สร้างสรรค์ทั่วโลกที่กำลังปฏิวัติการสร้างเนื้อหาวิดีโอด้วยเทคโนโลยีล้ำสมัยของ Seedance 1.5 Pro
| Field | Description |
|---|---|
| Model Name | Nano Banana Pro (also known as Gemini 3 Pro Image) |
| Developer | Google DeepMind |
| Release Date | November 20, 2025 |
| Model Type | Multimodal Reasoning and Image Generation |
| Related Links | Official Product Page, Model Card (PDF) |
Nano Banana Pro, officially designated as Gemini 3 Pro Image, represents the next generation in Google's series of highly-capable, natively multimodal models. It is designed for professional asset production, integrating the advanced reasoning capabilities of the Gemini 3 Pro foundation model with a sophisticated image generation engine. The primary goal of Nano Banana Pro is to provide users with studio-quality precision and control, enabling the creation of complex, high-fidelity visuals from textual and image-based prompts. Its core contribution lies in its ability to understand and execute intricate instructions, maintain character and scene consistency, and render legible text directly within generated images, setting a new standard for professional creative workflows.
Nano Banana Pro introduces several technical breakthroughs that distinguish it from prior models:
Nano Banana Pro's architecture is fundamentally based on the Gemini 3 Pro model. While specific architectural details are not fully disclosed, the following technical information is available:
Nano Banana Pro is intended for professional and creative applications that require a high degree of precision, control, and visual fidelity. It is well-suited for a variety of downstream tasks and application scenarios:
Nano Banana Pro's performance has been evaluated through extensive human evaluations and benchmarked against other leading image generation models. The results, measured in Elo scores, demonstrate its strong capabilities across a wide range of tasks.
A technical report also notes a performance dichotomy: while the model produces subjectively superior visual quality by hallucinating plausible details, it can lag behind specialist models in traditional quantitative metrics due to the stochastic nature of generative models.
| Capability | Gemini 3 Pro Image | Gemini 2.5 Flash Image | GPT-Image 1 | Seedream v4 4k | Flux Pro Kontext Max |
|---|---|---|---|---|---|
| Text Rendering | 1198 ± 18 | 997 ± 10 | 1150 ± 14 | 1019 ± 13 | 854 ± 13 |
| Stylization | 1098 ± 11 | 933 ± 7 | 1069 ± 9 | 991 ± 9 | 908 ± 11 |
| Multi-Turn | 1186 ± 19 | 1045 ± 24 | 1079 ± 32 | 990 ± 32 | 889 ± 37 |
| General Image Editing | 1127 ± 13 | 996 ± 8 | 1011 ± 13 | 965 ± 12 | 902 ± 13 |
| Character Editing | 1176 ± 16 | 1075 ± 8 | 1016 ± 10 | 889 ± 10 | 843 ± 10 |
| Object/Env. Editing | 1102 ± 19 | 1025 ± 9 | 930 ± 12 | 983 ± 13 | 961 ± 10 |
| General Text-to-Image | 1094 ± 16 | 1037 ± 8 | 1025 ± 9 | 1011 ± 9 | 907 ± 9 |
| Capability | Gemini 3 Pro Image | Gemini 2.5 Flash Image | GPT-Image 1 | Seedream v4 4k | Flux Pro Kontext Max |
|---|---|---|---|---|---|
| Multi-character Editing | 1213 ± 16 | 950 ± 10 | 997 ± 13 | 840 ± 19 | - |
| Chart Editing | 1209 ± 18 | 971 ± 10 | 994 ± 16 | 934 ± 16 | 893 ± 15 |
| Text Editing | 1202 ± 23 | 1001 ± 10 | 996 ± 14 | 860 ± 15 | 943 ± 12 |
| Factuality - Edu | 1169 ± 25 | 1050 ± 11 | 1084 ± 25 | 969 ± 22 | 884 ± 26 |
| Infographics | 1268 ± 17 | 1162 ± 11 | 1087 ± 12 | 1049 ± 12 | 824 ± 15 |
| Visual Design | 1104 ± 16 | 1083 ± 7 | 1028 ± 11 | 1038 ± 12 | 907 ± 11 |
Join the Discord community for the latest model updates, prompts, and support.