大多數 AI 簡報工具都能撰寫投影片內容,但真正的挑戰在於如何讓這些內容看起來像一份排版整潔的 PowerPoint 簡報。
一份報告、文章或 Markdown 檔案並沒有提供投影片間距、字體大小、視覺層級或圖片位置等參數。當 AI 代理人嘗試逐一建立可編輯的 PowerPoint 元素時,排版很快就會成為瓶頸。
在眾多開源 AI 簡報專案中,codex-ppt-skill 特別突出,因為它採取了更簡單的路徑:將每張投影片生成為全幀圖像,然後將這些圖像封裝成 .pptx 檔案。結果雖然無法在元素層級進行完全編輯,但對於比起手動調整每個文字方塊,更在意視覺一致性的使用者來說,這是一個實用的工作流程。
本指南說明了 codex-ppt-skill 的功能、為何基於圖像的 PPT 生成對於 AI 代理人很有幫助,以及如何配置它並以 Atlas Cloud 作為圖像模型後端。
為什麼 AI PowerPoint 代理人在處理原生 PPT 排版時會遇到困難
搜尋「AI PowerPoint generator from Markdown」或「Codex PPT generator」,許多工具看起來都很相似。但當代理人必須將內容置入投影片時,真正的差異就顯現出來了。
原生 PPT 生成通常意味著代理人或腳本必須建立真正的 PowerPoint 物件:文字方塊、形狀、表格、圖表和圖片。這雖然給了使用者可編輯的投影片,但也增加了排版的複雜度。原生 .pptx 工作流程必須決定每個物件的位置、文字如何換行、字體大小如何變化,以及如何防止重疊。
當開發者需要程式化控制 PowerPoint 檔案時,像是 PptxGenJS 這樣的函式庫非常強大。PptxGenJS 支援文字、表格、形狀、圖片、圖表、範本以及與 OOXML 相容的輸出。但對於 AI 代理人來說,這也意味著模型必須推敲投影片結構,而不是僅僅產出一頁視覺內容。
這就是瓶頸所在:問題不在於撰寫大綱,而在於將雜亂的內容轉化為乾淨的投影片排版。
codex-ppt-skill 的獨特之處
codex-ppt-skill 是為「圖像優先」的簡報工作流程而建。
它不要求代理人將每張投影片元素都建立為可編輯的 PowerPoint 物件,而是讓代理人規劃簡報、選擇視覺風格、生成全版投影片圖像,最後將它們封裝到標準的 .pptx 容器中。最終成品更接近一份經過設計的視覺簡報,而非一份完全可編輯的企業範本。
這種權衡非常重要:
- 當您想要快速製作精美的 AI 生成簡報時,請使用它。
- 當 PowerPoint 內的每個圖表、文字方塊和圖示都必須可編輯時,請避免使用它。
- 如果您日後需要恢復可編輯元素,可將其與「圖像轉可編輯」的工作流程結合使用。
專案 README 也清楚說明了此限制:該技能適合強大的視覺呈現,但頁面元素本身無法直接編輯。
分步配置方法
1. 安裝 codex-ppt-skill
您可以將以下句子發送給您的 Agent:
plaintext1 Please help me install this codex-ppt skill. The link is https://github.com/ningzimu/codex-ppt-skill
2. 從 Atlas Cloud 控制台獲取您的 API 金鑰
開啟您的 Atlas Cloud 控制台並前往 API Keys 頁面。建立一個新金鑰或複製現有的金鑰。

請確保金鑰保密,不要將其貼到公開的 GitHub 儲存庫、文章草稿或螢幕截圖中。
3. 配置圖像模型後端
金鑰準備好後,配置 codex-ppt-skill 使用的本地執行環境。
使用專案圖像模型配置指南中的 Atlas Cloud 配置指令:
plaintext1python3 {skill_root}/scripts/codex_ppt_runtime.py config \ 2 --api-key "your-atlascloud-api-key" \ 3 --base-url "https://api.atlascloud.ai/api/v1/model" \ 4 --model openai/gpt-image-2
將 your-atlascloud-api-key 替換為從控制台生成的金鑰。
對於此路徑,請將 --model 設定為基礎模型名稱。配置指南指出,CLI 會在內部選擇對應的生成或編輯模型路由。
4. 準備一個小型 Markdown 輸入檔
從一個簡短的 Markdown 檔案開始。以下是一個範例:
plaintext1# AI 簡報工作流程 2 3## 第 1 張:為什麼 AI PPT 生成很困難 4- AI 可以快速總結內容 5- 投影片排版仍然需要視覺決策 6- 原生可編輯 PPT 生成通常會增加排版複雜度 7 8## 第 2 張:基於圖像的方法 9- 將每張投影片生成為全幀圖像 10- 將圖像組裝成 PPTX 檔案 11- 優先考慮視覺一致性,而非元素級別的編輯 12 13## 第 3 張:實際應用場景 14- 技術文章摘要 15- 產品說明簡報 16- 研究簡報 17- 內部概念簡報
建議的首次執行設定:
| 設定 | 建議值 |
|---|---|
| 投影片數量 | 3 到 5 張 |
| 原始素材長度 | 500 字以內 |
| 長寬比 | 16:9 |
| 文字密度 | 每張投影片一個核心概念 |
| 視覺風格 | 乾淨的技術說明風格 |
5. 執行 PPT 生成提示
明確要求您的 Agent 使用該技能:
plaintext1Use the codex-ppt skill to turn /path/to/article.md into a 5-slide image-based PowerPoint deck.
README 將正常工作流程描述為分階段執行,而非一次性完成:該技能讀取來源、建立 outline.md、要求使用者確認投影片數量與要點、提供視覺風格選項、確認圖像後端、生成一張範例投影片,然後再進行完整投影片的生成與 .pptx 組裝。
6. 以下是生成的預覽圖像風格:


為什麼要將 codex-ppt-skill 與 Atlas Cloud 搭配使用?
codex-ppt-skill 和 Atlas Cloud 在同一個 AI 簡報工作流程中解決了兩個不同的問題。
codex-ppt-skill 處理簡報生成端。它透過規劃投影片結構、生成全版投影片視覺圖,並將這些圖像封裝成 .pptx 檔案,將素材轉化為基於圖像的 PowerPoint 簡報。這避免了 AI 投影片生成中最困難的部分之一:建立帶有可編輯 PowerPoint 物件的乾淨排版。
Atlas Cloud 處理模型存取端。像這樣的工作流程通常需要不只一種模型類型。文字模型用於閱讀素材、結構化簡報並撰寫投影片文案。接著使用圖像模型將每張投影片渲染為完整的視覺頁面。如果沒有統一的 API 層,開發者通常必須管理不同的服務提供商帳號、多個 API 金鑰以及不同的模型端點。
這正是兩者結合的價值所在。
在此工作流程中,`codex-ppt-skill







