
一句話的魔法:從零打造一個活生生的 AI 沙盒世界
想像一下,只需輸入一句話,就能看著一個龐大、具互動性的 2D 像素世界瞬間成形。無需繁瑣的地圖繪製、無需編寫數千行的 NPC 對話,也不需要處理複雜的狀態追蹤。
透過 WorldX 這款開源的 AI 世界生成與模擬器,這已不再是空想,而是現實。WorldX 結合了生成式 AI、電腦視覺 (CV) 與多智能體模擬技術,將原始的文字描述轉化為功能齊全的沙盒環境,讓自動化角色能在其中生活、交流,並在無人干預的情況下推動各自的敘事。

深入 WorldX:一個提示詞如何演變成自主現實
傳統遊戲開發極度依賴硬編碼腳本與剛性的行為樹。WorldX 透過一個兩階段流程完全取代了這種模式:
- 演算法地圖生成: 當您輸入提示詞時,協調者 LLM 會將文字轉譯為結構化的 JSON 佈局,而圖像生成模型則會繪製全域地圖。為了彌合創意 AI 繪圖與精確遊戲機制之間的落差,WorldX 採用了智慧的「疊加標註 + 差異化視覺 (differential vision)」技術。它能精準標記互動區域與碰撞邊界,將鬆散的像素轉化為可供行走、互動的遊戲網格。
- 多智能體協調: 地圖生成後,角色 (NPC) 會被賦予獨特的檔案、動機與記憶。在模擬 LLM 的驅動下,這些角色不僅僅是站著不動;他們會主動感知周遭環境、將事件記錄在個人日記中、透過 WebSockets 與彼此傳訊,並根據周遭發生的變化動態調整目標。
展示:從一句提示詞到鮮活的海盜島,只需 5 分鐘
讓我們看看從零開始設定並運行即時模擬有多麼容易。

第一步:環境設定與 API 金鑰配置
首先,複製儲存庫並安裝依賴套件:
Bash
plaintext1git clone https://github.com/YGYOOO/WorldX.git 2cd WorldX 3npm install
要運行模擬,您需要存取 LLM 與圖像生成模型。
💡 開發者提示: 與其在四個不同的 AI 平台註冊並分別管理協調、模擬與圖像生成的 API 金鑰,此步驟使用 AtlasCloud 的統一 API 金鑰。只需單一金鑰,我們就能輕鬆將呼叫分發至不同模型(例如用於深度推理的 DeepSeek,或用於快速代理聊天的標準 LLM),而無需更新多個環境變數。
設定您的 .env 檔案:
程式碼片段
plaintext1PORT=3000 2ATLASCLOUD_API_KEY=your_atlascloud_key_here 3# 設定統一閘道以流暢地路由協調與模擬查詢
第二步:輸入魔法提示詞
使用 npm run dev 啟動伺服器並開啟本機儀表板。在建立控制台中,輸入以下這句提示詞:
「一個海盜島,船長在島上藏了被詛咒的寶藏,而船員中的一名叛徒正在午夜前悄悄試圖偷走它。」
第三步:見證模擬演變
點擊 Generate。在接下來的 5 分鐘內,WorldX 將運行其後端管道,輸出完整地圖並初始化三名主要代理:Blackwood 船長、大副 Thomas(叛徒)以及軍需官 Elena。
以下是即時 5 分鐘測試中,自主模擬展開的時間軸:
- 01:15 (地圖就緒): 出現了一個海岸像素島,配有酒館、海岸線與隱藏的洞穴區。
- 02:30 (首次互動): Thomas 移動到酒館並與 Elena 搭話,試圖打探她是否知道船長寶箱鑰匙的存放處。
- 03:45 (衝突浮現): Blackwood 船長注意到 Thomas 在禁區洞穴附近徘徊。模擬 LLM 更新了 Blackwood 的日記:「Thomas 在海岸線附近行跡可疑。我必須加強戒備。」
- 05:00 (高潮): Blackwood 在洞穴附近與 Thomas 對質。雙方透過 WebSockets 進行了緊張的對話,將兩人的關係狀態變更為「敵對」。
本次運行的效能與成本指標:
- 地圖生成總耗時: 42 秒
- 代理平均決策延遲: 1.2 秒
- 總 Token 消耗 (5 分鐘運行): 約 24,500 tokens(涵蓋協調、日記與即時聊天)
資料與架構剖析:WorldX 的底層運作
WorldX 的高效在於它與傳統遊戲引擎相比,大幅減少了手動配置的需求。
| 指標 / 功能 | 傳統沙盒設定 | WorldX 管道 |
| 地圖創建時間 | 數小時/數天 (手動貼圖或繁重程序化編碼) | < 60 秒 (透過 AI 與 CV 將提示詞轉為地圖網格) |
| NPC 對話路徑 | 固定分支樹 (數百行文字) | 動態且無邊界 (由 LLM 即時生成) |
| 碰撞映射 | 在 Tiled 等編輯器中手動繪製邊界 | 自動化 (透過功能性遮罩層與 Sharp 處理) |
| 狀態追蹤 | 集中式重量級資料庫狀態 | 分散式日記 (儲存為短期與長期記憶片段) |
常見問題 (FAQ):關於 WorldX 您需要知道的一切
WorldX 如何處理 AI 生成地圖上的角色碰撞?
它使用了巧妙的雙層處理方法。AI 首先生成視覺地圖,接著一個基於視覺的二級循環會在上方應用一個半透明的遮罩層,以標記可行走與不可行走的區域。核心引擎會將這些遮罩轉換為二進位網格矩陣,內建的路徑搜尋庫 (EasyStar.js) 即利用此矩陣來引導角色平滑移動。
我可以完全離線使用本機 LLM 運行 WorldX 嗎?
可以。由於該架構透過標準 REST 與 WebSocket 協定通訊,您可以輕鬆地將基礎 URL 指向運行 Ollama 或 Llama.cpp 的本機推論供應商。請注意,地圖協調需要紮實的 JSON 遵循能力,因此強烈建議針對穩定設定使用較大的量化模型。
當代理的記憶變得太長時會發生什麼?
WorldX 透過結構化的快照系統防止上下文視窗膨脹。模擬架構不會將整個歷史記錄饋送到每一輪操作中,而是將過去的事件壓縮為簡潔的日記條目與關係狀態旗標,從而確保每個代理的迴圈保持快速且具備成本效益。







