Z.ai Models on AtlasCloud | GLM

Atlas Cloud โฮสต์ซีรีส์ GLM ทั้งหมดผ่าน Z-AI API ตั้งแต่ GLM-4.6 ถึง GLM-5.1 โมเดลทั้งหมดรองรับสองภาษาและพร้อมให้บริการแบบจ่ายตามการใช้งานจริง (pay-as-you-go) โดยมีหน้าต่างบริบทขนาด 202K

Large Language Models by Z.ai

ขับเคลื่อนการสนทนา การให้เหตุผล และเอเจนต์ในระดับขนาดใหญ่ด้วยโมเดลภาษาขนาดใหญ่ชั้นนำ ที่ให้บริการอย่างรวดเร็วและคุ้มค่าบน Atlas Cloud

ดูโมเดลทั้งหมด

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

ModelStandard Price (USD)Our Price (USD)Discount
GLM 5.1
$1.4/$4.4per 1M tokens202.8K context
$1.26/$3.96M in/outper 1M tokens202.8K context
-10%View
GLM 5 Turbo
$1.2/$4per 1M tokens262.1K context
$1.2/$4M in/outper 1M tokens262.1K context
View
GLM 5
$1/$3.2per 1M tokens202.8K context
$0.95/$3.15M in/outper 1M tokens202.8K context
View
GLM 4.7
$0.6/$2.2per 1M tokens202.8K context
$0.52/$1.85M in/outper 1M tokens202.8K context
View
GLM 4.6
$0.6/$2.2per 1M tokens202.8K context
$0.6/$2.2M in/outper 1M tokens202.8K context
View

Explore models from other providers

Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.

กรณีการใช้งาน Z-AI API ที่คุณสามารถสร้างได้บน Atlas Cloud

ระดับโมเดลของ GLM ครอบคลุมทุกอย่างตั้งแต่งานแชทสองภาษาที่รวดเร็วไปจนถึงเอเจนต์การเขียนโค้ดอัตโนมัติที่ใช้เวลาหลายชั่วโมง ทีมงานใช้ GLM-5.1 สำหรับงานวิศวกรรมระยะยาว และใช้ GLM-4.7 หรือ GLM-5 Turbo เมื่อประสิทธิภาพด้านต้นทุนและความเร็วเป็นสิ่งสำคัญอันดับแรก

การเพิ่มประสิทธิภาพฐานข้อมูลระยะยาว

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

การรีแฟกเตอร์โค้ดอัตโนมัติระดับรีโพสิทอรี

ทีมพัฒนาใช้ GLM-5.1 ในการดำเนินการแปลงฐานโค้ดทั้งหมดผ่านเซสชันที่กินเวลาหลายชั่วโมงโดยไม่ต้องมีจุดตรวจสอบโดยมนุษย์ โมเดลจะวางแผน เขียน ทดสอบ และทำซ้ำการเปลี่ยนแปลงอย่างต่อเนื่องนานสูงสุด 8 ชั่วโมง โดยจัดการการทำซ้ำถึง 655 ครั้งในการสาธิตการสร้างระบบ Linux จากศูนย์ สิ่งนี้เข้ามาแทนที่งานรีแฟกทอริงด้วยตนเองที่ต้องใช้เวลาหลายสัปดาห์บนฐานโค้ดเดิมที่มีขนาดใหญ่

การบูรณาการเอเจนต์การเขียนโค้ด IDE

ทีมเครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ได้รวม GLM-5.1 และ GLM-5 Turbo เข้ามาเป็นโมเดลพื้นฐานสำหรับเวิร์กโฟลว์การเขียนโค้ด AI ใน Claude Code, Kilo Code, Cline, Roo Code และ OpenCode Z-AI API บน Atlas Cloud สามารถใช้งานร่วมกับ OpenAI ได้ ดังนั้นการเปลี่ยน base URL จึงเป็นการเปลี่ยนแปลงเพียงอย่างเดียวที่จำเป็นในการกำหนดเส้นทางของเครื่องมือเหล่านี้ผ่าน GLM หน้าต่างบริบท 262K ของ GLM-5 Turbo ทำให้เหมาะอย่างยิ่งสำหรับบริบทของไฟล์ขนาดใหญ่ในเวิร์กโฟลว์ IDE

ระบบอัตโนมัติสำหรับคำถามการสนับสนุน Tier-1

ทีมปฏิบัติการสร้างตัวแทนสนับสนุนโดยใช้ GLM-5 ซึ่งรวมการเข้าถึงฐานข้อมูลตั๋ว การค้นหาฐานความรู้ และเครื่องมือการส่งเรื่องต่อ เพื่อจัดการกับคำถามที่ซ้ำซากโดยไม่ต้องอาศัยการแทรกแซงของมนุษย์ การเรียกใช้เครื่องมือหลายอย่างและการรองรับการสตรีมของโมเดลทำให้ใช้งานได้จริงสำหรับการติดตั้งใช้งานที่ต้องเผชิญหน้ากับลูกค้าแบบเรียลไทม์ การรองรับสองภาษาหมายความว่าตัวแทนเดียวกันสามารถจัดการตั๋วทั้งภาษาจีนและภาษาอังกฤษจากตำแหน่งข้อมูลโมเดลเดียวบน Atlas Cloud ได้

การสร้างเอกสารสองภาษาในสเกลขนาดใหญ่

ทีมคอนเทนต์และธุรกิจใช้ GLM-4.7 ในการสร้างเอกสาร Word, งานนำเสนอ PowerPoint, PDF และรายงาน Excel ทั้งในภาษาจีนและภาษาอังกฤษจากพรอมต์ที่มีโครงสร้าง ด้วยราคา $0.52 ต่อหนึ่งล้านโทเค็นอินพุต จึงเป็นระดับ GLM ที่คุ้มค่าที่สุดสำหรับเวิร์กโฟลว์เอกสารปริมาณมากที่ไม่ต้องการการให้เหตุผลระดับแนวหน้า หน้าต่างบริบทขนาด 202K เพียงพอที่จะรองรับโครงร่างเอกสารทั้งหมดและวัสดุแหล่งที่มาในการเรียกใช้งานเพียงครั้งเดียว

การเพิ่มประสิทธิภาพเคอร์เนลสำหรับเวิร์กโหลด ML

ทีมโครงสร้างพื้นฐาน AI ใช้ GLM-5.1 เพื่อรันไปป์ไลน์การเพิ่มประสิทธิภาพที่ขับเคลื่อนด้วยเกณฑ์มาตรฐานบนเวิร์กโหลดของแมชชีนเลิร์นนิง ในงานสไตล์ KernelBench นั้น GLM-5.1 จะดำเนินการรอบการเพิ่มประสิทธิภาพที่ขับเคลื่อนด้วยเครื่องมือหลายพันรอบและบรรลุความเร็วเฉลี่ยเรขาคณิต 3.6 เท่า ความสามารถในการดำเนินการอย่างต่อเนื่อง 8 ชั่วโมงหมายความว่าเอเจนต์จะรันลูปการเพิ่มประสิทธิภาพแบบเต็มโดยไม่ต้องรีสตาร์ทแบบแมนนวลระหว่างเซสชัน

Atlas Cloud AI

ติดต่อฝ่ายขาย

คำถามที่พบบ่อยเกี่ยวกับโมเดล Z.ai

Z-AI (หรือเขียนว่า Z.ai) คือผู้พัฒนาซีรีส์โมเดลภาษาขนาดใหญ่ GLM หรือที่รู้จักกันในชื่อ ZhipuAI GLM ย่อมาจาก General Language Model ซึ่งเป็นกลุ่มโมเดลที่ครอบคลุมตั้งแต่ GLM-4.6 ไปจนถึงรุ่นเรือธงในปัจจุบันอย่าง GLM-5.1 ซีรีส์นี้ถูกสร้างขึ้นสำหรับการเขียนโค้ด เวิร์กโฟลว์ของเอเจนต์ และการใช้งานในระดับโปรดักชันแบบสองภาษา จีน-อังกฤษ

GLM-5.1 คว้าอันดับหนึ่งบน SWE-Bench Pro ด้วยคะแนน 58.4 เมื่อวันที่ 7 เมษายน 2026 แซงหน้า GPT-5.4 (57.7) และ Claude Opus 4.6 (57.3) นอกจากนี้ยังเป็นผู้นำใน CyberGym ด้วยคะแนน 68.7 ทำให้กลายเป็นโมเดลโอเพนซอร์สที่อยู่ในอันดับสูงสุดสำหรับการเขียนโค้ดในสภาพแวดล้อมการผลิต ณ ไตรมาสที่ 2 ปี 2026

ใช่ GLM-5.1 รองรับการทำงานอัตโนมัติอย่างต่อเนื่องสูงสุด 8 ชั่วโมงในงานเดียวโดยไม่ต้องอาศัยข้อมูลจากมนุษย์ โดยจะจัดการกับวงจรทั้งหมดของการวางแผน การดำเนินการ การปรับให้เหมาะสมแบบทำซ้ำ และการส่งมอบ สิ่งนี้ได้รับการออกแบบมาโดยเฉพาะสำหรับเวิร์กโฟลว์ของเอเจนต์การเขียนโค้ดระยะยาวในสภาพแวดล้อมเช่น Claude Code และการตั้งค่าที่เข้ากันได้กับ OpenClaw

GLM-5 คือโมเดลพื้นฐานที่สร้างขึ้นบนสถาปัตยกรรม MoE ขนาด 7.44 แสนล้านพารามิเตอร์ ได้รับการฝึกฝนด้วยโทเค็นจำนวน 28.5 ล้านล้านโทเค็น และขึ้นสู่อันดับ #1 ของ Elo บน Chatbot Arena สำหรับโมเดลโอเพนซอร์ส GLM-5.1 คือการอัปเกรดหลังการฝึกฝนของโมเดลพื้นฐานเดียวกัน ซึ่งมีความสามารถในการเขียนโค้ด การใช้เครื่องมือ และการดำเนินการแบบอัตโนมัติที่แข็งแกร่งขึ้นอย่างเห็นได้ชัด GLM-5 มีราคาอยู่ที่ 0.95 ดอลลาร์ต่อหนึ่งล้านโทเค็นอินพุตบน Atlas Cloud ส่วน GLM-5.1 มีราคา 1.26 ดอลลาร์ต่อหนึ่งล้านโทเค็นอินพุต

ใช่ GLM-5.1 เปิดตัวภายใต้ใบอนุญาต MIT ซึ่งอนุญาตให้ใช้งานเชิงพาณิชย์ ทำการปรับแต่งแบบละเอียด (fine-tuning) และแจกจ่ายซ้ำได้โดยไม่มีข้อจำกัด มีน้ำหนักแบบเปิด (open weights) สำหรับการปรับใช้แบบโฮสต์เอง (self-hosted) Atlas Cloud ให้บริการ GLM-5.1 ผ่าน API สำหรับทีมที่ต้องการการเข้าถึงแบบจัดการโดยไม่มีภาระค่าใช้จ่ายด้านโครงสร้างพื้นฐาน

GLM-4.6, GLM-4.7, GLM-5 และ GLM-5.1 ทั้งหมดรองรับหน้าต่างบริบทขนาด 202,750 โทเค็นบน Atlas Cloud ยกเว้น GLM-5 Turbo ที่มีหน้าต่างบริบทใหญ่กว่าที่ 262,144 โทเค็น และมีความยาวเอาต์พุตสูงสุด 131,072 โทเค็น GLM-5.1 เหมาะสำหรับการสร้างไฟล์โค้ดที่ยาวและการติดตามการประมวลผลที่ขยายออกไปภายใต้ข้อจำกัดของบริบท

ใช่ โมเดล GLM ทั้งหมดได้รับการปรับให้เหมาะสมสำหรับภาษาจีนและภาษาอังกฤษ โดยมีความเชี่ยวชาญเท่าเทียมกันในทั้งสองภาษา คุณสามารถเขียนพรอมต์ในภาษาใดภาษาหนึ่งและรับผลลัพธ์ที่มีคุณภาพสม่ำเสมอ สิ่งนี้ทำให้ GLM นำไปใช้งานได้จริงสำหรับทีมที่สร้างผลิตภัณฑ์เพื่อตอบสนองทั้งตลาดจีนและตลาดต่างประเทศโดยใช้เพียงโมเดลเดียว

GLM-4.7 เริ่มต้นที่ 0.52 ดอลลาร์ต่ออินพุตโทเคนหนึ่งล้านโทเคน และเป็นระดับที่คุ้มค่าที่สุด GLM-4.6 ราคา 0.60 ดอลลาร์, GLM-5 ราคา 0.95 ดอลลาร์ และ GLM-5 Turbo ราคา 1.20 ดอลลาร์ต่ออินพุตโทเคนหนึ่งล้านโทเคน GLM-5.1 ซึ่งเป็นรุ่นเรือธง มีราคา 1.26 ดอลลาร์ต่ออินพุตโทเคนหนึ่งล้านโทเคน และ 3.96 ดอลลาร์ต่อเอาต์พุตโทเคนหนึ่งล้านโทเคน ทุกรุ่นใช้ระบบจ่ายตามการใช้งานจริง (pay-as-you-go) โดยไม่มีข้อผูกมัดรายเดือน

สำรวจกลุ่มเพิ่มเติม

Seedance 2.0 Models

Seedance 2.0(by Bytedance) is a multimodal video generation model that redefines "controllable creation," moving beyond the limitations of text or start/end frames. It supports quad-modal inputs—text, image, video, and audio—and introduces an industry-leading "Universal Reference" system. By precisely replicating the composition, camera movement, and character actions from reference assets, Seedance 2.0 solves critical issues with character consistency and physical coherence, empowering creators to act as true "directors" with deep control over their output.

ดูกลุ่ม

Grok-Imagine Models

Grok Imagine Image Quality is xAI's latest AI image generation model, delivering studio-grade visuals with up to 2K resolution and razor-sharp detail. It offers best-in-class text rendering across multiple languages, photorealistic outputs with natural lighting, rich textures, and believable physics, plus tighter prompt following and image editing with reference inputs for precise creative control. Ideal for hero images, ad creatives, product renders, and brand-grade visuals.

ดูกลุ่ม

Gemini Omni

Gemini Omni (by Google DeepMind) is a video generation and editing model launched on May 20, 2026 at Google I/O that redefines the standard for "reasoning-driven creation," built specifically to solve the core challenge of AI video: making output that actually understands what you mean, not just what you type. It fuses Gemini's reasoning engine with generative capability, accepting any mix of images, text, video, and audio to produce consistent, knowledge-grounded output. Unlike models that start from scratch each time, Omni lets you edit through natural conversation — swapping objects, rewriting scenes, shifting styles — while keeping physics, characters, and continuity intact across every turn.

ดูกลุ่ม

GPT Image 2 Models

GPT Image 2 is a state-of-the-art multimodal foundation model engineered for exceptional text-to-image generation with unprecedented photorealism and creative versatility. Developed by OpenAI as the evolution of the DALL-E lineage, it transforms detailed natural language descriptions into hyper-realistic imagery at up to 4K resolution. With proprietary "Neural Rendering Engine" technology for precise visual control, GPT Image 2 delivers studio-quality results with accurate anatomy, lighting, and composition—making it the premier AI tool for professional creators, enterprises, and developers demanding production-ready visual assets.

ดูกลุ่ม

Google Models on Atlas Cloud | Gemini, Nano Bananas & Veo

โมเดลเชิงสร้างสรรค์ที่ทรงพลังที่สุดของ Google พร้อมใช้งานแล้วบน Atlas Cloud โดย Veo 3.1 นำเสนอการสร้างวิดีโอระดับภาพยนตร์ Nano Banana 2 ขับเคลื่อนการสร้างภาพที่มีความเที่ยงตรงสูง และ Gemini นำความชาญฉลาดแบบมัลติโมดัลมาสู่ทุกเวิร์กโฟลว์ เข้าถึงชุดโมเดลของ Google เต็มรูปแบบผ่าน API key เดียวพร้อมความพร้อมใช้งานระดับ Day-0 และการกำหนดราคาแบบจ่ายตามการใช้งาน (pay-as-you-go)

ดูกลุ่ม

ByteDance Models on Atlas Cloud | Seedance & Seedream

ตั้งแต่การสร้างวิดีโอระดับภาพยนตร์ไปจนถึงการสร้างภาพที่มีความละเอียดสูง โมเดลที่ทรงพลังที่สุดของ ByteDance พร้อมใช้งานแล้วบน Atlas Cloud รัน Seedance และ Seedream ในสเกลขนาดใหญ่ด้วยราคาการอนุมานที่ต่ำที่สุด และไม่มีค่าใช้จ่ายแฝงด้านโครงสร้างพื้นฐาน

ดูกลุ่ม

Alibaba Models on Atlas Cloud | Wan & Qwen

Atlas Cloud รวบรวมโมเดลทั้งหมดของ Alibaba ไว้ใน API เดียว: Qwen สำหรับงานด้านภาษาและรูปภาพ และ Wan สำหรับการสร้างวิดีโอความละเอียดสูงสุด 1080p เข้าถึงทุกโมเดลในรูปแบบจ่ายตามการใช้งานจริง (pay-as-you-go) โดยไม่ต้องสมัครสมาชิก Alibaba API พร้อมใช้งานผ่าน base URL เดียวโดยใช้ไคลเอนต์ที่รองรับ OpenAI ที่คุณมีอยู่แล้ว

ดูกลุ่ม

MAI Image 2.5 Models

MAI-Image-2.5 คือตระกูลโมเดลการสร้างและแก้ไขภาพถ่ายเสมือนจริงรุ่นล่าสุดของ Microsoft ที่สร้างขึ้นสำหรับการออกแบบเชิงพาณิชย์ การถ่ายภาพผลิตภัณฑ์ และการสร้างเนื้อหาที่พร้อมสำหรับแบรนด์ มีให้บริการในรุ่นมาตรฐานและ Flash สำหรับทั้งการแปลงข้อความเป็นภาพและการแก้ไขภาพ โดยมอบคะแนน Arena ELO ที่ดีที่สุดในระดับเดียวกันในราคาที่แข่งขันได้ — เริ่มต้นที่ 0.03 ดอลลาร์สหรัฐฯ ต่อภาพ ด้วยการเรนเดอร์ข้อความที่แม่นยำ ความสามารถในการแก้ไขที่ละเอียดอ่อนระดับศัลยกรรม และการสร้างภาพบุคคลที่เป็นธรรมชาติ MAI-Image-2.5 ได้รับการออกแบบมาสำหรับทีมที่ต้องการภาพคุณภาพระดับโปรดักชันโดยไม่ต้องมีภาระค่าใช้จ่ายในการประมวลผลหลังการถ่ายทำ

ดูกลุ่ม

Wan2.7 Models

Launching this March, Wan2.7 is the latest powerhouse in the Qwen ecosystem, delivering a massive upgrade in visual fidelity, audio synchronization, and motion consistency over version 2.6. This all-in-one AI video generator supports advanced features like first-and-last frame control, 3x3 grid synthesis, and instruction-based video editing. Outperforming competitors like Jimeng, Wan2.7 offers superior flexibility with support for real-person image inputs, up to five video references, and 1080P high-definition outputs spanning 2 to 15 seconds, making it the premier choice for professional digital storytelling and high-end content marketing.

ดูกลุ่ม

Nano Banana2 Models

Nano Banana 2 (by Google), is a generative image model that perfectly balances lightning-fast rendering with exceptional visual quality. With an improved price-performance ratio, it achieves breakthrough micro-detail depiction, accurate native text rendering, and complex physical structure reconstruction. It serves as a highly efficient, commercial-grade visual production tool for developers, marketing teams, and content creators.

ดูกลุ่ม

Doubao Models

Doubao คือกลุ่มโมเดลภาษาขนาดใหญ่ของ ByteDance ที่ออกแบบมาเพื่อการให้เหตุผลระดับโปรดักชัน การเขียนโค้ด และเวิร์กโหลดของเอเจนต์ที่มีปริมาณมาก ครอบคลุมตั้งแต่รุ่นเรือธง Seed 2.0 Pro, ตัวแปร Code Preview ที่ออกแบบมาโดยเฉพาะ, รุ่น Lite และ Mini ที่คุ้มต้นทุน ตลอดจนรุ่น Seed 1.8 และ Seed 1.6 ที่ได้รับการพิสูจน์แล้ว ไลน์อัปนี้มอบอินเทอร์เฟซเดียวที่เข้ากันได้กับ OpenAI ให้แก่นักพัฒนา เพื่อปรับขนาดตั้งแต่การให้เหตุผลขั้นสูง ไปจนถึงงานที่มีความไวต่อเวลาแฝงและต้องการปริมาณงานสูง โมเดล Doubao ทุกรุ่นบน Atlas Cloud มาพร้อมกับหน้าต่างบริบทขนาด 256K โทเค็น, การสตรีม และความเข้ากันได้ของ SDK ที่พร้อมใช้งานทันที คุณจึงสามารถจับคู่โมเดลที่เหมาะสมกับแต่ละงานได้โดยไม่ต้องเขียนสแต็กของคุณใหม่

ดูกลุ่ม

Hunyuan 3D Generation Models

Hunyuan3D is a state-of-the-art 3D generative foundation model from Tencent that turns text prompts and single images into high-quality, textured 3D meshes. Built on a two-stage pipeline—Hunyuan3D-DiT for shape generation via flow-matching diffusion and Hunyuan3D-Paint for multi-view texture synthesis—it produces clean geometry with full PBR materials ready for game engines, AR/VR, 3D printing, and DCC tools. Available in Pro (up to 1.5M faces, 4K PBR textures) and Rapid (2–3 minute lightweight generation) tiers, with both Text-to-3D and Image-to-3D entry points, Hunyuan3D is the premier AI 3D toolkit for game developers, e-commerce teams, and 3D content studios. Generations start at $0.02 each.

ดูกลุ่ม

บทความแนะนำ

คู่มือ บทแนะนำ และอัปเดตผลิตภัณฑ์ ที่ช่วยให้คุณใช้ Atlas Cloud ได้อย่างเต็มประสิทธิภาพ

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.