Grok API: xAI Reasoning and Coding Models

Grok, được phát triển bởi xAI, là một chuỗi các mô hình ngôn ngữ lớn được xây dựng xoay quanh nhận thức thời gian thực và khả năng suy luận ở mức độ tiên tiến. Grok 4.3 là mô hình hội thoại nâng cao của xAI, được tối ưu hóa cho đối thoại tự nhiên, khám phá kiến thức và suy luận nhiều bước trên cửa sổ ngữ cảnh 1.000.000 token. Grok Build 0.1 đi theo một hướng khác — nó được xây dựng chuyên biệt cho phát triển phần mềm, với các khả năng tập trung vào tạo mã, gỡ lỗi và tái cấu trúc mã trong các quy trình làm việc phức tạp của nhà phát triển. Cả hai mô hình đều có sẵn trên Atlas Cloud thông qua các endpoint API tương thích với OpenAI, với mức giá bắt đầu từ 1 đô la cho mỗi triệu token.

Khám phá Mô hình Hàng đầu

Atlas Cloud cung cấp cho bạn các mô hình sáng tạo tiên tiến nhất trong ngành.

NEW

HOT

Flagship conversational model built for real-time knowledge exploration, sharp reasoning, and highly engaging AI interactions.

LLM

Grok 4.5

Đầu ra Tối đa:500.00K

$2/6M Đầu vào/Đầu ra

NEW

HOT

Specialized coding model optimized for software development, code generation, debugging, refactoring, and developer workflows.

LLM

Grok Build 0.1

Đầu ra Tối đa:262.14K

$1/2M Đầu vào/Đầu ra

NEW

HOT

Advanced conversational AI model optimized for natural dialogue, knowledge exploration, reasoning, and interactive chat experiences.

LLM

Grok 4.3

Đầu vào:$1.25/M Token

Đầu ra:$2.5/M Token

Đầu ra Tối đa:1000.00K

$1.25/2.5M Đầu vào/Đầu ra

NEW

Văn bản-Âm thanh

xAI TTS v1

xAI TTS v1 is a high-fidelity text-to-speech model that converts text into natural, expressive speech with sub-second latency, supporting 20 languages and 80+ voices with fine-grained delivery control.

xAI STT v1

xAI STT v1 is a production-grade speech-to-text model that transcribes audio into accurate, formatted text. It supports 24+ languages with automatic language detection, word-level timestamps, speaker diarization, multichannel transcription, and inverse text normalization.

From

$0.002/phút

So sánh các mô hình Grok API

Match each job to the right model: Grok 4.3 for reasoning across a 1M token context and Grok Build 0.1 for agentic coding, both reachable through one OpenAI-compatible key on Atlas Cloud.

Model	Type	Best For	Context	Inputs	Function Calling	Structured Outputs	Prompt Caching	Status
Grok 4.3	Flagship reasoning model	Logic, analysis, multi-step agents, long-document work	1M tokens	Text, image	Yes	Yes	Yes	Flagship, GA
Grok Build 0.1	Coding-focused model	Code generation, debugging, refactoring, coding agents	256K tokens	Text, image	Yes	Yes	Yes	Early access

Grok API Features

The Grok API brings xAI's reasoning and coding models to Atlas Cloud with a 1M token context window, always-on reasoning, function calling, structured outputs, vision input, and prompt caching, all behind one OpenAI-compatible key.

1M Token Context Window

Grok 4.3 handles up to one million tokens in a single request, enough for full contract sets, large codebases, or long multi-turn agent sessions. The wide context removes chunked retrieval and preserves cross-document reasoning that shorter models lose.

Always-On Reasoning with the Grok API

The Grok API runs Grok 4.3 with built-in step-by-step reasoning, tuned for accuracy-critical work like logic, math, and multi-step analysis. The model thinks before it answers, which lifts factual reliability and instruction following on complex prompts.

Agentic Tool Calling

Grok 4.3 is built for agents: it plans, calls functions in sequence, and adjusts on intermediate results. Native function calling lets it trigger tools and APIs mid-task, the foundation for research agents, support bots, and automation that runs without a human in the loop.

Structured Outputs and Vision with the Grok API

The Grok API returns structured JSON that matches your schema, so extracted data flows straight into downstream code. Grok 4.3 also accepts images alongside text, handling diagrams, screenshots, and UI mockups in the same call.

Coding with Grok Build 0.1

Grok Build 0.1 is xAI's coding-tuned model for code generation, debugging, and refactoring across developer workflows, with a 256K token context. It targets interactive coding agents and multi-step development tasks rather than general chat.

Prompt Caching on the Grok API

The Grok API supports prompt caching, which reuses a shared system prompt or context prefix at a lower token rate. For agentic loops that send the same instructions across many calls, this cuts repeated input cost without changing your code.

Một prompt xây dựng duy nhất qua các mô hình

Cung cấp cùng một prompt xây dựng cho Grok và các mô hình khác trên Atlas Cloud, đồng thời quan sát từng mô hình tạo ra một trang web hoàn chỉnh, có thể chạy được, nhờ đó bạn có thể so sánh phong cách viết mã và kết quả đầu ra song song với nhau.

Prompt

Xây dựng một tệp HTML độc lập duy nhất hiển thị hệ mặt trời 3D tương tác sử dụng Three.js từ một CDN. Kết xuất mặt trời và tám hành tinh quay quanh quỹ đạo với các kết cấu được mô phỏng bằng màu sắc và ánh sáng rực rỡ, quỹ đạo chuyển động và nền trời sao. Cho phép người dùng xoay và thu phóng camera bằng chuột, và nhấp vào một hành tinh để camera bay mượt mà tới đó và hiển thị số liệu thống kê của nó. Bao gồm một tiêu đề lớp phủ trang nhã và một nút điều khiển để tăng tốc hoặc làm chậm thời gian. Giữ mọi thứ trong một tệp HTML duy nhất với phần nhập Three.js từ CDN. Ưu tiên giao diện điện ảnh, tuyệt đẹp.

Grok 4.3

GLM 5

Grok Build 0.1

Prompt

Xây dựng một tệp HTML độc lập duy nhất hoạt động như một bảng điều khiển phân tích có hiệu ứng động. Bao gồm một biểu đồ thanh động, một biểu đồ đường tự vẽ khi tải, một biểu đồ bánh rán và các thẻ số liệu thống kê tóm tắt đếm ngược lên. Sử dụng dữ liệu mẫu được mã hóa cứng, hiệu ứng chuyển động mượt mà khi xuất hiện và bố cục bảng điều khiển giao diện tối, hiện đại và gọn gàng. Thêm một chú giải công cụ tinh tế khi di chuột vào từng thành phần biểu đồ. Chỉ sử dụng CSS nội tuyến và JavaScript nguyên bản (vanilla) với canvas hoặc SVG, không sử dụng thư viện bên ngoài. Hãy làm cho nó trông giống như một bảng điều khiển SaaS cao cấp.

Grok 4.3

GLM 5

Grok Build 0.1

Những gì bạn có thể làm với Grok LLM API trên Atlas Cloud

Grok 4.3 kết hợp cửa sổ ngữ cảnh 1 triệu token với tìm kiếm web và X theo thời gian thực, khiến nó trở nên thiết thực cho các quy trình sản xuất cần thông tin cập nhật cùng với khả năng suy luận sâu.

Pipeline nghiên cứu và trí tuệ thời gian thực

Các nhóm xây dựng công cụ nghiên cứu sử dụng các tiện ích bổ sung Web Search và X Search của Grok 4.3 để trích xuất dữ liệu trực tiếp từ web và X thẳng vào quá trình tạo nội dung mà không cần lớp truy xuất riêng biệt. Điều này hữu ích cho các luồng công việc phân tích cạnh tranh, tóm tắt tin tức và tình báo thị trường, nơi câu trả lời phụ thuộc vào thông tin được công bố sau thời điểm cắt dữ liệu huấn luyện của mô hình. Web Search và X Search được tính phí 5 đô la cho mỗi 1.000 lệnh gọi trên xAI API.

Backend LLM môi trường sản xuất tối ưu chi phí

Các nhóm kỹ thuật chuyển đổi từ GPT-4.1 hoặc Claude Sonnet sử dụng Grok 4.3 như một giải pháp thay thế trực tiếp thông qua endpoint tương thích với OpenAI của Atlas Cloud. Với mức giá 1,25 đô la cho mỗi triệu token đầu vào, Grok 4.3 rẻ hơn khoảng 37% so với GPT-4.1 và rẻ hơn 58% so với Claude Sonnet 4.6 về mặt đầu vào. Quá trình di chuyển chỉ yêu cầu thay đổi base URL và khóa API trong mã SDK hiện có.

Phân tích tài liệu dài với ngữ cảnh 1M

Các nhóm pháp lý, tài chính và nghiên cứu sử dụng cửa sổ ngữ cảnh 1 triệu token của Grok 4.3 để xử lý các bộ hợp đồng đầy đủ, hồ sơ tài chính hoặc tài liệu kỹ thuật trong một lệnh gọi API duy nhất. Ngữ cảnh lớn giúp loại bỏ nhu cầu về các pipeline truy xuất phân mảnh và duy trì khả năng suy luận xuyên tài liệu mà các mô hình có ngữ cảnh ngắn hơn dễ làm đứt gãy. Việc bộ nhớ đệm lời nhắc (prompt caching) làm giảm thêm chi phí khi cùng một ngữ cảnh tài liệu được sử dụng lại trong nhiều lệnh gọi phân tích.

Lập trình Đa phương thức và Phân tích Trực quan

Các nhà phát triển sử dụng khả năng hiểu hình ảnh của Grok 4.3 để truyền các sơ đồ, ảnh chụp màn hình, mô hình UI và nhật ký lỗi cùng với văn bản trong cùng một lệnh gọi API. Điều này rất hữu ích cho các quy trình gỡ lỗi, nơi ảnh chụp màn hình của lỗi hoặc sơ đồ kiến trúc hệ thống cung cấp ngữ cảnh mà chỉ riêng văn bản không thể làm được. Tính năng gọi hàm và đầu ra có cấu trúc được hỗ trợ trong cùng một lệnh gọi, vì vậy dữ liệu hình ảnh được trích xuất có thể được trả về theo một lược đồ sẵn sàng cho việc xử lý ở hạ nguồn.

Thực thi Tác vụ Nhiều bước Dựa trên Tác nhân

Các nhóm sản phẩm sử dụng tính năng tối ưu hóa tác nhân của Grok 4.3 để xây dựng các tác nhân có khả năng lập kế hoạch, thực thi và lặp lại qua nhiều bước mà không cần con người nhắc nhở ở giữa. Mô hình này được tinh chỉnh đặc biệt để phân tích các nhiệm vụ phức tạp — chia nhỏ một mục tiêu cấp cao thành các nhiệm vụ phụ, gọi các công cụ theo tuần tự và điều chỉnh dựa trên kết quả trung gian. Kết hợp với việc gọi hàm và tiện ích bổ sung Web Search, điều này bao trùm các quy trình làm việc từ nghiên cứu đến kết quả đầu ra như "tìm đối thủ cạnh tranh, phân tích giá cả, phác thảo báo cáo so sánh" chỉ trong một lần chạy tác nhân duy nhất.

Thực thi mã trong ngữ cảnh cho phân tích dữ liệu

Các nhóm dữ liệu và phân tích sử dụng Grok 4.3 với tiện ích bổ sung Code Execution để chạy Python trực tiếp bên trong lệnh gọi suy luận, xử lý dữ liệu và trả về kết quả đã tính toán cùng với quá trình suy luận của mô hình. Điều này giúp loại bỏ nhu cầu về một môi trường thực thi mã riêng biệt khi xây dựng các công cụ phân tích dữ liệu hoặc quy trình báo cáo tự động. Code Execution được tính phí ở mức 5 đô la cho mỗi 1.000 lệnh gọi trên xAI API, tách biệt với chi phí token.

So sánh Grok API

Xem cách Grok API so sánh với các LLMs hàng đầu khác trên Atlas Cloud về ngữ cảnh, đầu vào và trọng tâm, để bạn có thể định tuyến từng tác vụ đến mô hình phù hợp, tất cả chỉ với một khóa duy nhất.

Model	Provider	Context Window	Inputs	Best For
Grok 4.3	xAI	1M tokens	Text	Agentic reasoning, long-document analysis, high factual accuracy
Grok Build 0.1	xAI	256K tokens	Text	Code generation, debugging, refactoring
DeepSeek V4 Pro	DeepSeek	1M tokens	Text	Cost-efficient reasoning and agentic tool use at scale
Kimi K2.6	Moonshot	262K tokens	Text, image	Long-horizon coding agents and multimodal workflows
GLM 5.2	Z.ai	202.8K tokens	Text	Long-horizon agentic engineering and project-scale coding

Cách Sử Dụng Grok trên Atlas Cloud

Bắt đầu trong vài phút — làm theo các bước đơn giản sau để tích hợp và triển khai mô hình qua nền tảng Atlas Cloud.

Tạo Tài Khoản Atlas Cloud

Đăng ký tại atlascloud.ai và hoàn tất xác minh. Người dùng mới nhận được tín dụng miễn phí để khám phá nền tảng và thử nghiệm mô hình.

Tại sao Sử dụng Grok trên Atlas Cloud

Sự kết hợp của các mô hình tiên tiến của Grok với nền tảng được tăng tốc GPU của Atlas Cloud mang lại hiệu suất, khả năng mở rộng và trải nghiệm nhà phát triển độc đáo.

Hiệu suất và Tính linh hoạt

Độ Trễ Thấp:
Suy luận được tối ưu hóa GPU cho suy luận thời gian thực.

API Thống nhất:
Chạy Grok, GPT, Gemini và DeepSeek với một tích hợp duy nhất.

Giá cả Minh bạch:
Thanh toán dựa trên token có thể dự đoán với tùy chọn serverless.

Doanh nghiệp và Mở rộng

Trải nghiệm Nhà phát triển:
SDK, phân tích, công cụ tinh chỉnh và mẫu.

Độ tin cậy:
99,99% khả dụng, RBAC và ghi nhật ký sẵn sàng cho tuân thủ.

Bảo mật và Tuân thủ:
SOC 2 Type II, tuân thủ HIPAA, chủ quyền dữ liệu tại Hoa Kỳ.

Các câu hỏi thường gặp về Grok LLM

Atlas Cloud lưu trữ Grok 4.3, LLM hàng đầu hiện tại của xAI, có sẵn với mức giá 1,25 đô la cho mỗi một triệu token đầu vào. Mô hình hỗ trợ trò chuyện, suy luận, gọi hàm, đầu ra có cấu trúc và hiểu hình ảnh trong một API duy nhất. Hãy kiểm tra trang bộ sưu tập Atlas Cloud xAI để biết bất kỳ phiên bản Grok bổ sung nào khi chúng được thêm vào.

Grok 4.3 hỗ trợ cửa sổ ngữ cảnh lên đến 1 triệu token. Kích thước này đủ lớn để xử lý toàn bộ cơ sở mã, các tài liệu nghiên cứu dài hoặc các phiên tác nhân đa lượt mở rộng chỉ trong một lệnh gọi duy nhất. Giới hạn ngữ cảnh áp dụng cho cả đầu vào văn bản và hình ảnh kết hợp.

Có. xAI API hỗ trợ Web Search và X Search dưới dạng các tiện ích bổ sung tùy chọn, được tính phí riêng ở mức 5 đô la cho mỗi 1.000 lệnh gọi. Điều này cho phép Grok truy xuất thông tin theo thời gian thực từ web hoặc X trong quá trình tạo. Truy cập các tính năng này thông qua endpoint API tiêu chuẩn cùng với các lệnh gọi API thông thường của bạn.

Có. xAI API hỗ trợ bộ nhớ đệm lời nhắc, giúp giảm chi phí cho các yêu cầu sử dụng lại cùng một lời nhắc hệ thống hoặc tiền tố ngữ cảnh. Các token đầu vào được lưu trong bộ nhớ đệm được tính phí với mức giá thấp hơn đáng kể so với các token không được lưu. Điều này đặc biệt hữu ích cho các quy trình làm việc của tác nhân gửi cùng một hướng dẫn qua nhiều lần gọi.

Có. Grok 4.3 hỗ trợ đầu vào đa phương thức, chấp nhận hình ảnh cùng với văn bản trong cùng một lệnh gọi API. Bạn có thể truyền URL hình ảnh hoặc hình ảnh được mã hóa base64 thông qua định dạng tin nhắn tiêu chuẩn. Điều này cho phép các trường hợp sử dụng như trả lời câu hỏi trực quan, phân tích tài liệu và tạo mã do hình ảnh hướng dẫn.

Có. Grok 4.3 hỗ trợ gọi hàm, đầu ra có cấu trúc và phản hồi luồng. Những tính năng này hoạt động với lược đồ hàm tiêu chuẩn tương thích với OpenAI, do đó, các định nghĩa công cụ hiện có từ các tích hợp dựa trên GPT sẽ chuyển giao trực tiếp. Việc thực thi mã cũng có sẵn dưới dạng tiện ích bổ sung tùy chọn với mức giá 5 USD cho mỗi 1.000 lần gọi.

Lưu vào bộ nhớ cache của prompt (Prompt caching) tái sử dụng tiền tố ngữ cảnh lặp lại, chẳng hạn như prompt hệ thống dài hoặc các hướng dẫn được chia sẻ, với mức phí token đầu vào giảm trong các lệnh gọi sau. Đối với các chatbot và agent gửi lại cùng một thiết lập trong mỗi yêu cầu, điều này giúp giảm chi phí đầu vào lặp lại mà không cần thay đổi mã của bạn. Đặt nội dung tĩnh ở đầu prompt và nội dung người dùng có thể thay đổi ở cuối để áp dụng bộ nhớ cache.

Giới hạn tốc độ và tính đồng thời khác nhau tùy theo cấp độ tài khoản, vì vậy hãy thêm thuật toán lùi lũy thừa (exponential backoff) và thử lại khi có phản hồi 429, đồng thời xếp hàng các yêu cầu trong thời gian lưu lượng truy cập tăng đột biến. Đối với các công việc ngoại tuyến lớn, xử lý hàng loạt giúp khối lượng công việc lớn không vượt quá giới hạn thời gian thực của bạn. Một chi phí ẩn phổ biến khi mở rộng quy mô là gửi lại toàn bộ lịch sử trò chuyện trong mỗi lần gọi, vì vậy hãy truyền một bản tóm tắt ngắn gọn thay vì toàn bộ luồng và liên hệ với bộ phận hỗ trợ để tăng giới hạn khi bạn phát triển.

Grok API sử dụng phương thức thanh toán dùng mức nào trả mức đó (pay-as-you-go) dựa trên mức sử dụng token, với token đầu vào và đầu ra được đo lường theo mỗi yêu cầu và không cần đăng ký gói. Chạy Grok cùng với hơn 300 mô hình khác trên Atlas Cloud đồng nghĩa với việc chỉ cần một tài khoản và một hóa đơn thay vì các hợp đồng riêng biệt cho từng nhà cung cấp. Tính năng lưu bộ nhớ đệm lời nhắc (prompt caching) và xử lý hàng loạt có thể giảm chi phí thực tế đối với các khối lượng công việc lặp đi lặp lại hoặc ngoại tuyến.

Tạo tài khoản trên Atlas Cloud, tạo khóa API và trỏ máy khách tương thích OpenAI hiện có của bạn tới điểm cuối Atlas bằng tên mô hình Grok. Gửi yêu cầu đầu tiên của bạn tới Grok 4.3 để lập luận hoặc Grok Build 0.1 để lập trình, sau đó mở rộng quy mô khi cần. Vì cùng một khóa có thể truy cập hơn 300 mô hình, bạn có thể thử nghiệm các mô hình khác mà không cần bất kỳ thiết lập bổ sung nào.

Khám phá Thêm Dòng

Seedance 2.0

Seedance 2.0 API cung cấp cho bạn quyền truy cập cấp sản xuất vào mô hình video đa phương thức của ByteDance — đầu vào bốn phương thức (văn bản, hình ảnh, video, âm thanh) và hệ thống "Universal Reference" hàng đầu trong ngành giúp khóa bố cục, chuyển động của camera và hành động của nhân vật trên các cảnh quay. Tích hợp quyền kiểm soát cấp độ đạo diễn bằng một lệnh gọi API, mức giá cố định $0,09/giây, cấp khóa tức thì và không có danh sách chờ — được hỗ trợ bởi thời gian hoạt động và sự tuân thủ cấp doanh nghiệp. Seedance 2.0 Native 4K hiện đã ra mắt!

Xem Dòng

Grok Imagine

Grok Imagine API cung cấp cho các nhà phát triển khả năng tạo hình ảnh, video và âm thanh của xAI trong một bộ công cụ duy nhất. API này tạo ra hình ảnh độ phân giải lên đến 2K với khả năng hiển thị văn bản đa ngôn ngữ, cộng với video lên đến 15 giây với âm thanh gốc, được đồng bộ hóa và chỉnh sửa dựa trên tham chiếu. Trên Atlas Cloud, một khóa duy nhất có thể chạy mọi chế độ Grok Imagine, do đó bạn có thể chuyển đổi giữa hình ảnh, video và âm thanh mà không cần thiết lập riêng biệt, với mức giá từ 0,02 USD cho mỗi hình ảnh và 0,05 USD mỗi giây.

Xem Dòng

Gemini Omni Flash

Gemini Omni API đưa mô hình tạo và chỉnh sửa video đa phương thức của Google DeepMind, được giới thiệu tại Google I/O 2026, vào stack của bạn. Gemini Omni kết hợp công cụ suy luận của Gemini với media tạo sinh, chấp nhận mọi tổ hợp văn bản, hình ảnh, video và âm thanh để tạo ra kết quả nhất quán, dựa trên nền tảng tri thức. Tinh chỉnh kết quả qua hội thoại tự nhiên — hoán đổi vật thể, viết lại cảnh quay và thay đổi phong cách, trong khi vật lý, nhân vật và tính liên tục vẫn được giữ nguyên. Atlas Cloud cung cấp trọn bộ dòng Gemini Omni Flash — chuyển văn bản thành video, chuyển hình ảnh thành video với tối đa 7 hình ảnh tham chiếu, và chuyển tham chiếu thành video — thông qua một API hợp nhất với mức giá minh bạch tính theo giây từ $0.112 và không cần đăng ký thuê bao. Bắt đầu xây dựng ngay hôm nay.

Xem Dòng

GPT Image 2

GPT Image 2 API cung cấp cho các nhà phát triển quyền truy cập vào mô hình hình ảnh mới nhất của OpenAI, phiên bản kế nhiệm của GPT Image 1.5. Mô hình này tạo và chỉnh sửa hình ảnh với khả năng hiển thị văn bản chính xác trên các chữ viết Latinh và CJK, cùng với bố cục mạnh mẽ cho áp phích, mockup và đồ họa thông tin. Trên Atlas Cloud, bạn có thể truy cập nó thông qua một API thống nhất cùng với hơn 300 mô hình khác, với tín dụng miễn phí, 99,99% thời gian hoạt động và không yêu cầu xác minh tổ chức OpenAI.

Xem Dòng

Google

Các mô hình sáng tạo mạnh mẽ nhất của Google hiện đều có sẵn trên Atlas Cloud. Veo 3.1 cung cấp khả năng tạo video đậm chất điện ảnh, Nano Banana 2 hỗ trợ tạo hình ảnh có độ chân thực cao, và Gemini mang trí tuệ đa phương thức vào mọi quy trình làm việc. Truy cập toàn bộ bộ mô hình Google thông qua một API key duy nhất với tính khả dụng Day-0 và mức giá dùng bao nhiêu trả bấy nhiêu (pay-as-you-go).

Xem Dòng

Seedance 2.0 Mini

Seedance 2.0 Mini mang khả năng tạo video đa phương thức của ByteDance vào các quy trình làm việc nơi tốc độ và chi phí là quan trọng nhất. Nó cung cấp các khả năng cốt lõi của Seedance 2.0 với mức tiêu thụ tài nguyên nhẹ hơn — tạo nhanh hơn, chi phí mỗi video thấp hơn và tích hợp API giống như bạn đã sử dụng. Đối với các nhóm chạy các quy trình (pipeline) khối lượng lớn hoặc tạo nguyên mẫu ở quy mô lớn, Mini là lựa chọn mặc định thiết thực.

Xem Dòng

ByteDance

Từ tạo video điện ảnh đến kiến tạo hình ảnh có độ trung thực cao, các mô hình mạnh mẽ nhất của ByteDance hiện đã có mặt trên Atlas Cloud. Chạy Seedance và Seedream ở quy mô lớn với mức giá suy luận thấp nhất và không có chi phí quản lý cơ sở hạ tầng.

Xem Dòng

Alibaba

Atlas Cloud tập hợp toàn bộ dòng mô hình của Alibaba dưới một API duy nhất: Qwen cho các tác vụ ngôn ngữ và hình ảnh, Wan để tạo video với độ phân giải lên đến 1080p. Truy cập mọi mô hình theo hình thức dùng đến đâu trả tiền đến đó (pay-as-you-go) mà không cần đăng ký gói. Alibaba API có sẵn thông qua một URL cơ sở (base URL) duy nhất bằng cách sử dụng ứng dụng khách tương thích với OpenAI hiện có của bạn.

Xem Dòng

OpenAI

Atlas Cloud cấp cho bạn quyền truy cập vào toàn bộ danh mục OpenAI API, từ GPT Image 2 để tạo hình ảnh đến Sora 2 cho video. Mọi mô hình đều có sẵn theo hình thức dùng đến đâu trả tiền đến đó (pay-as-you-go) mà không cần cam kết hàng tháng. Tích hợp dễ dàng chỉ bằng cách thay đổi một base URL thông qua API tương thích với OpenAI.

Xem Dòng

xAI

Xây dựng các pipeline hình ảnh và video hoàn chỉnh bằng xAI API trên Atlas Cloud. Tạo ở độ phân giải 2K, chỉnh sửa bằng hình ảnh tham chiếu và tạo hoạt ảnh từ hình ảnh thành các clip đồng bộ với âm thanh.

Xem Dòng

Kwaivgi

Kwaivgi API với mức giá thấp hơn 15% so với giá tiêu chuẩn. Atlas Cloud cung cấp quyền truy cập Day-0 cho các bản phát hành Kling mới với mức giá dùng trả theo mức sử dụng (pay-as-you-go) và không giới hạn số lượng người dùng. Một tài khoản, một khóa, mọi mô hình Kling từ cấp tiêu chuẩn đến cấp master.

Xem Dòng

Seedream 5.0 Pro

Seedream 5.0 Pro API cung cấp cho các nhà phát triển mô hình chỉnh sửa hình ảnh có thể kiểm soát của ByteDance trên Atlas Cloud. Nó đặt các chỉnh sửa một cách chính xác bằng các điểm neo và tọa độ, tách hình ảnh thành các lớp có thể chỉnh sửa, kết hợp nhiều tham chiếu và khớp màu sắc cũng như vật liệu chính xác, với văn bản đa ngôn ngữ ở độ phân giải 2K và 3K. Trên Atlas Cloud, bạn có thể truy cập nó chỉ bằng một khóa!

Xem Dòng

Một API cho mọi AI đa phương tiện.

Khám phá tất cả mô hình