Z.ai API for Top Open-Source GLM Coding

Z.ai API นำซีรีส์ GLM ทั้งหมดของ ZhipuAI มาไว้ในสแตกของคุณ ตั้งแต่ GLM-4.6 ไปจนถึงรุ่นเรือธง GLM-5.1 ซึ่งครองอันดับหนึ่งในกลุ่มโมเดลโอเพนซอร์สบน SWE-Bench Pro และสามารถรันเอเจนต์เขียนโค้ดอัตโนมัติได้ต่อเนื่องเป็นเวลาหลายชั่วโมง GLM ผสานบริบทขนาด 202K token เข้ากับเอาต์พุตภาษาจีนและอังกฤษที่สมดุล ภายใต้ไลเซนส์ MIT ที่เปิดกว้าง Atlas Cloud ให้บริการแต่ละโมเดลผ่านคีย์เดียวที่เข้ากันได้กับ OpenAI พร้อมการเข้าถึงตั้งแต่ Day-0 และราคาต่อการเรียกใช้งานที่โปร่งใส เริ่มต้นได้วันนี้

Large Language Models by Z.ai

ขับเคลื่อนการสนทนา การให้เหตุผล และเอเจนต์ในระดับขนาดใหญ่ด้วยโมเดลภาษาขนาดใหญ่ชั้นนำ ที่ให้บริการอย่างรวดเร็วและคุ้มค่าบน Atlas Cloud

ดูโมเดลทั้งหมด

LLM

GLM

GLM คือซีรีส์ LLM เรือธงของ Z.ai จาก Zhipu AI และ GLM API ครอบคลุมตั้งแต่ GLM-5 แบบ agentic ไปจนถึง GLM-4.6 แบบ 357B MoE ที่มีประสิทธิภาพสูง โมเดลเหล่านี้โดดเด่นด้านการดำเนินงานแบบอัตโนมัติ การจัดการ agent ที่ซับซ้อน และการเขียนโปรแกรมระดับใช้งานจริง บน Atlas Cloud endpoint เดียวแบบรวมศูนย์ช่วยให้คุณเข้าถึงตระกูล GLM ทั้งหมดได้ตั้งแต่ Day-0 พร้อมการคิดราคาตามการใช้งานและ uptime สำหรับ production ที่เชื่อถือได้ เริ่มสร้างได้วันนี้

6 โมเดลสำรวจ GLM

Z.ai Models API Pricing Details

Compare standard vs. our pricing across every Z.ai model.

Model	Standard Price (USD)	Our Price (USD)	Discount
GLM 5.2	$1.4/$4.4per 1M tokens1048.6K context	$1.26/$3.96M in/outper 1M tokens1048.6K context	-10%	View
GLM 5.1	$1.4/$4.4per 1M tokens202.8K context	$1.26/$3.96M in/outper 1M tokens202.8K context	-10%	View
GLM 5v Turbo	$1.2/$4per 1M tokens202.8K context	$1.2/$4M in/outper 1M tokens202.8K context	—	View
GLM 5	$1/$3.2per 1M tokens202.8K context	$0.95/$3.15M in/outper 1M tokens202.8K context	—	View
GLM 4.7	$0.6/$2.2per 1M tokens202.8K context	$0.52/$1.85M in/outper 1M tokens202.8K context	—	View
GLM 4.6	$0.6/$2.2per 1M tokens202.8K context	$0.6/$2.2M in/outper 1M tokens202.8K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

กรณีการใช้งาน Z-AI API ที่คุณสามารถสร้างได้บน Atlas Cloud

ระดับโมเดลของ GLM ครอบคลุมทุกอย่างตั้งแต่งานแชทสองภาษาที่รวดเร็วไปจนถึงเอเจนต์การเขียนโค้ดอัตโนมัติที่ใช้เวลาหลายชั่วโมง ทีมงานใช้ GLM-5.1 สำหรับงานวิศวกรรมระยะยาว และใช้ GLM-4.7 หรือ GLM-5 Turbo เมื่อประสิทธิภาพด้านต้นทุนและความเร็วเป็นสิ่งสำคัญอันดับแรก

การเพิ่มประสิทธิภาพฐานข้อมูลระยะยาว

Engineering teams use GLM-5.1 to run autonomous optimization agents that iterate on production systems over hundreds of rounds. In a documented run, GLM-5.1 improved a vector database through 600 iterations and 6,000 tool calls, reaching 21,500 queries per second — six times the result achievable in a single 50-turn session. Atlas Cloud's pay-as-you-go pricing makes it practical to run these extended sessions without pre-purchasing capacity.

การรีแฟกเตอร์โค้ดอัตโนมัติระดับรีโพสิทอรี

ทีมพัฒนาใช้ GLM-5.1 ในการดำเนินการแปลงฐานโค้ดทั้งหมดผ่านเซสชันที่กินเวลาหลายชั่วโมงโดยไม่ต้องมีจุดตรวจสอบโดยมนุษย์ โมเดลจะวางแผน เขียน ทดสอบ และทำซ้ำการเปลี่ยนแปลงอย่างต่อเนื่องนานสูงสุด 8 ชั่วโมง โดยจัดการการทำซ้ำถึง 655 ครั้งในการสาธิตการสร้างระบบ Linux จากศูนย์ สิ่งนี้เข้ามาแทนที่งานรีแฟกทอริงด้วยตนเองที่ต้องใช้เวลาหลายสัปดาห์บนฐานโค้ดเดิมที่มีขนาดใหญ่

การบูรณาการเอเจนต์การเขียนโค้ด IDE

ทีมเครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ได้รวม GLM-5.1 และ GLM-5 Turbo เข้ามาเป็นโมเดลพื้นฐานสำหรับเวิร์กโฟลว์การเขียนโค้ด AI ใน Claude Code, Kilo Code, Cline, Roo Code และ OpenCode Z-AI API บน Atlas Cloud สามารถใช้งานร่วมกับ OpenAI ได้ ดังนั้นการเปลี่ยน base URL จึงเป็นการเปลี่ยนแปลงเพียงอย่างเดียวที่จำเป็นในการกำหนดเส้นทางของเครื่องมือเหล่านี้ผ่าน GLM หน้าต่างบริบท 262K ของ GLM-5 Turbo ทำให้เหมาะอย่างยิ่งสำหรับบริบทของไฟล์ขนาดใหญ่ในเวิร์กโฟลว์ IDE

ระบบอัตโนมัติสำหรับคำถามการสนับสนุน Tier-1

ทีมปฏิบัติการสร้างตัวแทนสนับสนุนโดยใช้ GLM-5 ซึ่งรวมการเข้าถึงฐานข้อมูลตั๋ว การค้นหาฐานความรู้ และเครื่องมือการส่งเรื่องต่อ เพื่อจัดการกับคำถามที่ซ้ำซากโดยไม่ต้องอาศัยการแทรกแซงของมนุษย์ การเรียกใช้เครื่องมือหลายอย่างและการรองรับการสตรีมของโมเดลทำให้ใช้งานได้จริงสำหรับการติดตั้งใช้งานที่ต้องเผชิญหน้ากับลูกค้าแบบเรียลไทม์ การรองรับสองภาษาหมายความว่าตัวแทนเดียวกันสามารถจัดการตั๋วทั้งภาษาจีนและภาษาอังกฤษจากตำแหน่งข้อมูลโมเดลเดียวบน Atlas Cloud ได้

การสร้างเอกสารสองภาษาในสเกลขนาดใหญ่

ทีมคอนเทนต์และธุรกิจใช้ GLM-4.7 ในการสร้างเอกสาร Word, งานนำเสนอ PowerPoint, PDF และรายงาน Excel ทั้งในภาษาจีนและภาษาอังกฤษจากพรอมต์ที่มีโครงสร้าง ด้วยราคา $0.52 ต่อหนึ่งล้านโทเค็นอินพุต จึงเป็นระดับ GLM ที่คุ้มค่าที่สุดสำหรับเวิร์กโฟลว์เอกสารปริมาณมากที่ไม่ต้องการการให้เหตุผลระดับแนวหน้า หน้าต่างบริบทขนาด 202K เพียงพอที่จะรองรับโครงร่างเอกสารทั้งหมดและวัสดุแหล่งที่มาในการเรียกใช้งานเพียงครั้งเดียว

การเพิ่มประสิทธิภาพเคอร์เนลสำหรับเวิร์กโหลด ML

ทีมโครงสร้างพื้นฐาน AI ใช้ GLM-5.1 เพื่อรันไปป์ไลน์การเพิ่มประสิทธิภาพที่ขับเคลื่อนด้วยเกณฑ์มาตรฐานบนเวิร์กโหลดของแมชชีนเลิร์นนิง ในงานสไตล์ KernelBench นั้น GLM-5.1 จะดำเนินการรอบการเพิ่มประสิทธิภาพที่ขับเคลื่อนด้วยเครื่องมือหลายพันรอบและบรรลุความเร็วเฉลี่ยเรขาคณิต 3.6 เท่า ความสามารถในการดำเนินการอย่างต่อเนื่อง 8 ชั่วโมงหมายความว่าเอเจนต์จะรันลูปการเพิ่มประสิทธิภาพแบบเต็มโดยไม่ต้องรีสตาร์ทแบบแมนนวลระหว่างเซสชัน

เปลี่ยนวิสัยทัศน์ระดับองค์กรของคุณให้เป็นจริงด้วย Atlas Cloud AI

ติดต่อฝ่ายขาย

สิ่งที่นักพัฒนามักถามเกี่ยวกับ Z.ai API

Z.ai API ช่วยให้นักพัฒนาเข้าถึง GLM series ของโมเดลภาษาขนาดใหญ่ที่สร้างโดย Z.ai ซึ่งเป็นบริษัทที่รู้จักกันในชื่อ Zhipu AI ผ่านโปรแกรมได้ GLM ย่อมาจาก General Language Model และครอบคลุมรุ่นตั้งแต่ GLM-4.6 ไปจนถึงรุ่นเรือธง GLM-5.1 โดยปรับแต่งมาสำหรับงานเขียนโค้ด เวิร์กโฟลว์แบบ agentic และการใช้งานจริงแบบสองภาษา Chinese และ English บน Atlas Cloud คุณเข้าถึงโมเดลทั้งหมดได้ผ่าน endpoint เดียวที่เข้ากันได้กับ OpenAI

Atlas Cloud ให้บริการ GLM series ตั้งแต่ GLM-4.6 ไปจนถึงรุ่นเรือธง GLM-5.1 โดยมี GLM-4.7 และ GLM-5 อยู่ระหว่างกลาง รุ่นที่เบากว่ารองรับงานประจำวันปริมาณสูงด้วยต้นทุนที่ต่ำกว่า ขณะที่ GLM-5.1 มุ่งเน้นงานเขียนโค้ดและงานแบบ agentic ที่ต้องการความสามารถสูงที่สุด ทุกโมเดลใช้งานแบบจ่ายตามจริงผ่านคีย์เดียวกัน

ใช่ open weights ของ GLM รวมถึง GLM-5.1 เผยแพร่ภายใต้ MIT license ซึ่งอนุญาตให้ใช้งานเชิงพาณิชย์ fine-tuning และแจกจ่ายต่อได้โดยไม่มีข้อจำกัด หากคุณไม่ต้องการจัดการภาระด้านโครงสร้างพื้นฐาน Atlas Cloud ให้บริการโมเดลเดียวกันผ่าน API เพื่อการเข้าถึงแบบ managed แทนการโฮสต์เอง

ชี้ OpenAI SDK ที่คุณใช้อยู่ไปยัง base URL ของ Atlas Cloud ตั้งค่าคีย์ของคุณ แล้วส่งชื่อโมเดล GLM ที่ต้องการ เนื่องจาก Z.ai API เข้ากันได้กับ OpenAI โปรเจกต์ส่วนใหญ่จึงย้ายมาใช้งานได้ด้วยการเปลี่ยนเพียง base URL และสตริงชื่อโมเดล อีกทั้งโมเดลยังเชื่อมต่อกับเครื่องมือ agent เช่น Claude Code, Cline และ Roo Code ได้โดยตรง เริ่มสร้างได้วันนี้

ทั้ง Chinese และ English เป็นภาษาระดับ first-class สำหรับ GLM ซึ่งฝึกมาให้มีความสามารถสูงในแต่ละภาษา คุณสามารถเขียน prompt ด้วยภาษาใดก็ได้และจะได้คุณภาพที่สม่ำเสมอ ทำให้โมเดลชุดนี้เหมาะสำหรับทีมที่ให้บริการทั้งผู้ใช้ชาวจีนและผู้ใช้นานาชาติด้วยโมเดลเดียว แทนการดูแลสแต็กแยกกัน

GLM-4.6 ถึง GLM-5.1 รองรับ context window ขนาด 200K token เพียงพอสำหรับใส่ codebase ขนาดใหญ่ เอกสารยาว หรือ trace ของ agent ที่ต่อเนื่องได้ในคำขอเดียว หากเวิร์กโฟลว์ของคุณสร้างผลลัพธ์ที่ยาว context window เดียวกันยังรองรับไฟล์โค้ดขนาดใหญ่และ log การทำงานหลายขั้นตอนได้โดยไม่ถูกตัดทอนก่อนเวลา

GLM-5.1 ทำคะแนนสูงสุดบน SWE-Bench Pro ด้วยคะแนน 58.4 ในเดือนเมษายน 2026 ทำให้เป็นหนึ่งในโมเดลโอเพนซอร์สที่แข็งแกร่งที่สุดสำหรับงานเขียนโค้ดในโลกจริง นอกจากนี้ยังรองรับการทำงานอัตโนมัติอย่างต่อเนื่องได้นานสูงสุดแปดชั่วโมงต่อหนึ่งงาน โดยดำเนินการวางแผน ทำซ้ำ และส่งมอบในลูปเดียว ซึ่งเหมาะกับเวิร์กโฟลว์ agent ระยะยาวในสภาพแวดล้อมอย่าง Claude Code

ทุกโมเดล GLM บน Z.ai API ใช้ราคาแบบจ่ายตามจริงที่โปร่งใส คิดค่าบริการต่อ token โดยไม่มีค่าสมัครสมาชิกหรือข้อผูกมัดรายเดือน token ขาเข้าและขาออกจะถูกวัดแยกกัน และรุ่นที่เบากว่า เช่น GLM-4.7 มีราคาต่อ token ต่ำกว่ารุ่นเรือธง GLM-5.1 คุณจึงเลือกโมเดลให้เหมาะกับงบประมาณได้ ตรวจสอบอัตราต่อ token ล่าสุดได้บน model card ของแต่ละโมเดลใน Atlas Cloud

สำรวจกลุ่มเพิ่มเติม

Seedance 2.0

Seedance 2.0 API ให้คุณเข้าถึงระดับโปรดักชันของโมเดลวิดีโอแบบมัลติโมดัลจาก ByteDance — รองรับอินพุต 4 รูปแบบ (ข้อความ, รูปภาพ, วิดีโอ, เสียง) และระบบ "Universal Reference" ชั้นนำของอุตสาหกรรมที่ล็อกองค์ประกอบภาพ การเคลื่อนไหวของกล้อง และการกระทำของตัวละครในทุกช็อต ผสานรวมการควบคุมระดับผู้กำกับด้วยการเรียกใช้ API เพียงครั้งเดียว ในราคาคงที่ $0.09/วินาที รับคีย์ได้ทันที และไม่มีคิวรอ — พร้อมการรับประกันเวลาพร้อมใช้งานและการปฏิบัติตามข้อกำหนดระดับองค์กร Seedance 2.0 Native 4K เปิดใช้งานแล้ววันนี้!

ดูกลุ่ม

GPT Image 2

GPT Image 2 API ช่วยให้นักพัฒนาสามารถเข้าถึงโมเดลรูปภาพล่าสุดของ OpenAI ซึ่งเป็นรุ่นสืบทอดจาก GPT Image 1.5 โดยสามารถสร้างและแก้ไขรูปภาพพร้อมกับการเรนเดอร์ข้อความที่แม่นยำทั้งในอักษรละตินและ CJK รวมถึงการจัดวางองค์ประกอบที่ยอดเยี่ยมสำหรับโปสเตอร์ ม็อกอัป และอินโฟกราฟิก บน Atlas Cloud คุณสามารถเข้าถึงโมเดลนี้ผ่าน API ที่เป็นหนึ่งเดียวร่วมกับโมเดลอื่นๆ อีกกว่า 300 รุ่น พร้อมเครดิตฟรี เวลาทำงาน 99.99% และไม่จำเป็นต้องมีการตรวจสอบยืนยันองค์กรจาก OpenAI

ดูกลุ่ม

Seedream 5.0 Pro

Seedream 5.0 Pro API มอบโมเดลการแก้ไขภาพที่ควบคุมได้ของ ByteDance บน Atlas Cloud ให้กับนักพัฒนา โดยจะวางการแก้ไขอย่างแม่นยำด้วยจุดยึดและพิกัด แยกภาพออกเป็นเลเยอร์ที่แก้ไขได้ ผสานข้อมูลอ้างอิงหลายรายการ และจับคู่สีและวัสดุที่แน่นอน พร้อมข้อความหลายภาษาที่ความละเอียด 2K และ 3K บน Atlas Cloud คุณสามารถเข้าถึงได้ผ่านคีย์เดียว!

ดูกลุ่ม

Gemini Omni Flash

Gemini Omni API นำโมเดลสร้างและแก้ไขวิดีโอแบบมัลติโมดัลของ Google DeepMind ซึ่งเปิดตัวในงาน Google I/O 2026 มาสู่สแต็กของคุณ Gemini Omni ผสานเอนจินการใช้เหตุผลของ Gemini เข้ากับสื่อเชิงสร้างสรรค์ รองรับอินพุตทุกรูปแบบทั้งข้อความ รูปภาพ วิดีโอ และเสียง เพื่อสร้างผลลัพธ์ที่สอดคล้องกันและอิงตามความรู้ ปรับแต่งผลลัพธ์ผ่านการสนทนาอย่างเป็นธรรมชาติ ไม่ว่าจะเปลี่ยนวัตถุ เขียนฉากใหม่ หรือปรับสไตล์ โดยที่ฟิสิกส์ ตัวละคร และความต่อเนื่องยังคงเดิม Atlas Cloud ให้บริการ Gemini Omni Flash ครบทั้งไลน์อัป ทั้งการสร้างวิดีโอจากข้อความ การสร้างวิดีโอจากรูปภาพพร้อมรูปอ้างอิงสูงสุด 7 รูป และการสร้างวิดีโอจากรูปอ้างอิง ผ่าน API เดียวแบบครบวงจร ด้วยราคาต่อวินาทีที่โปร่งใสเริ่มต้นที่ $0.112 โดยไม่ต้องสมัครสมาชิก เริ่มสร้างได้เลยวันนี้

ดูกลุ่ม

Grok Imagine

Grok Imagine API นำเสนอการสร้างภาพ วิดีโอ และเสียงของ xAI ให้นักพัฒนาในชุดเครื่องมือเดียว สามารถสร้างภาพความละเอียดสูงสุด 2K พร้อมการเรนเดอร์ข้อความหลายภาษา รวมถึงวิดีโอความยาวสูงสุด 15 วินาทีพร้อมเสียงที่ซิงโครไนซ์แบบเนทีฟและการแก้ไขตามข้อมูลอ้างอิง บน Atlas Cloud คีย์เดียวสามารถรัน Grok Imagine ได้ทุกโหมด คุณจึงสามารถสลับไปมาระหว่างภาพ วิดีโอ และเสียงได้โดยไม่ต้องตั้งค่าแยกกัน เริ่มต้นที่ $0.02 ต่อภาพ และ $0.05 ต่อวินาที

ดูกลุ่ม

Google

โมเดลเชิงสร้างสรรค์ที่ทรงพลังที่สุดของ Google พร้อมใช้งานแล้วบน Atlas Cloud โดย Veo 3.1 นำเสนอการสร้างวิดีโอระดับภาพยนตร์ Nano Banana 2 ขับเคลื่อนการสร้างภาพที่มีความเที่ยงตรงสูง และ Gemini นำความชาญฉลาดแบบมัลติโมดัลมาสู่ทุกเวิร์กโฟลว์ เข้าถึงชุดโมเดลของ Google เต็มรูปแบบผ่าน API key เดียวพร้อมความพร้อมใช้งานระดับ Day-0 และการกำหนดราคาแบบจ่ายตามการใช้งาน (pay-as-you-go)

ดูกลุ่ม

Seedance 2.0 Mini

Seedance 2.0 Mini นำเสนอการสร้างวิดีโอแบบมัลติโมดัลของ ByteDance สู่เวิร์กโฟลว์ที่ความเร็วและต้นทุนมีความสำคัญสูงสุด โดยมอบความสามารถหลักของ Seedance 2.0 ในรูปแบบที่ใช้ทรัพยากรน้อยลง — สร้างได้เร็วกว่า ต้นทุนต่อวิดีโอต่ำกว่า และใช้การผสานรวม API เดิมที่คุณใช้อยู่แล้ว สำหรับทีมที่จัดการไปป์ไลน์ปริมาณมากหรือสร้างต้นแบบในสเกลขนาดใหญ่ Mini คือตัวเลือกเริ่มต้นที่ใช้งานได้จริง

ดูกลุ่ม

ByteDance

ตั้งแต่การสร้างวิดีโอระดับภาพยนตร์ไปจนถึงการสร้างภาพที่มีความละเอียดสูง โมเดลที่ทรงพลังที่สุดของ ByteDance พร้อมใช้งานแล้วบน Atlas Cloud รัน Seedance และ Seedream ในสเกลขนาดใหญ่ด้วยราคาการอนุมานที่ต่ำที่สุด และไม่มีค่าใช้จ่ายแฝงด้านโครงสร้างพื้นฐาน

ดูกลุ่ม

Alibaba

Atlas Cloud รวบรวมโมเดลทั้งหมดของ Alibaba ไว้ใน API เดียว: Qwen สำหรับงานด้านภาษาและรูปภาพ และ Wan สำหรับการสร้างวิดีโอความละเอียดสูงสุด 1080p เข้าถึงทุกโมเดลในรูปแบบจ่ายตามการใช้งานจริง (pay-as-you-go) โดยไม่ต้องสมัครสมาชิก Alibaba API พร้อมใช้งานผ่าน base URL เดียวโดยใช้ไคลเอนต์ที่รองรับ OpenAI ที่คุณมีอยู่แล้ว

ดูกลุ่ม

OpenAI

Atlas Cloud ให้คุณเข้าถึงกลุ่มผลิตภัณฑ์ OpenAI API แบบครบวงจร ตั้งแต่ GPT Image 2 สำหรับการสร้างภาพถ่าย ไปจนถึง Sora 2 สำหรับวิดีโอ ทุกโมเดลพร้อมใช้งานแบบจ่ายตามการใช้งานจริง (pay-as-you-go) โดยไม่มีข้อผูกมัดรายเดือน เชื่อมต่อได้ง่ายดายด้วยการสลับ base URL เพียงจุดเดียวโดยใช้ API ที่เข้ากันได้กับ OpenAI

ดูกลุ่ม

xAI

สร้างไปป์ไลน์ภาพและวิดีโอที่สมบูรณ์โดยใช้ xAI API บน Atlas Cloud สร้างที่ความละเอียด 2K แก้ไขด้วยภาพอ้างอิง และทำให้ภาพเคลื่อนไหวเป็นคลิปที่ซิงค์กับเสียง

ดูกลุ่ม

Kwaivgi

Kwaivgi API ในราคาที่ถูกกว่าราคามาตรฐาน 15% Atlas Cloud มอบการเข้าถึง Day-0 สำหรับการเปิดตัว Kling ใหม่ด้วยการกำหนดราคาแบบจ่ายตามการใช้งานจริง (pay-as-you-go) และไม่จำกัดจำนวนผู้ใช้ บัญชีเดียว คีย์เดียว สำหรับโมเดล Kling ทุกรุ่นตั้งแต่ระดับมาตรฐานไปจนถึงระดับมาสเตอร์

ดูกลุ่ม