限時特惠|Seedance 2.0 & 2.0 Mini 立享 8 折!

如何透過單一提示詞(Prompt)構建 AI 沙盒遊戲:WorldX 指南

WorldX 讓任何人都能從單一文字提示詞開始,建立一個完全自主、可互動的 2D 像素風格沙盒世界,徹底打破傳統遊戲開發的限制。

如何透過單一提示詞(Prompt)構建 AI 沙盒遊戲:WorldX 指南

showcase.png


一句話的魔法:從零打造一個活生生的 AI 沙盒世界

想像一下,只需輸入一句話,就能看著一個龐大、具互動性的 2D 像素世界瞬間成形。無需繁瑣的地圖繪製、無需編寫數千行的 NPC 對話,也不需要處理複雜的狀態追蹤。

透過 WorldX 這款開源的 AI 世界生成與模擬器,這已不再是空想,而是現實。WorldX 結合了生成式 AI、電腦視覺 (CV) 與多智能體模擬技術,將原始的文字描述轉化為功能齊全的沙盒環境,讓自動化角色能在其中生活、交流,並在無人干預的情況下推動各自的敘事。

process.png


深入 WorldX:一個提示詞如何演變成自主現實

傳統遊戲開發極度依賴硬編碼腳本與剛性的行為樹。WorldX 透過一個兩階段流程完全取代了這種模式:

  • 演算法地圖生成: 當您輸入提示詞時,協調者 LLM 會將文字轉譯為結構化的 JSON 佈局,而圖像生成模型則會繪製全域地圖。為了彌合創意 AI 繪圖與精確遊戲機制之間的落差,WorldX 採用了智慧的「疊加標註 + 差異化視覺 (differential vision)」技術。它能精準標記互動區域與碰撞邊界,將鬆散的像素轉化為可供行走、互動的遊戲網格。
  • 多智能體協調: 地圖生成後,角色 (NPC) 會被賦予獨特的檔案、動機與記憶。在模擬 LLM 的驅動下,這些角色不僅僅是站著不動;他們會主動感知周遭環境、將事件記錄在個人日記中、透過 WebSockets 與彼此傳訊,並根據周遭發生的變化動態調整目標。

展示:從一句提示詞到鮮活的海盜島,只需 5 分鐘

讓我們看看從零開始設定並運行即時模擬有多麼容易。

map.png

第一步:環境設定與 API 金鑰配置

首先,複製儲存庫並安裝依賴套件:

Bash

plaintext
1git clone https://github.com/YGYOOO/WorldX.git
2cd WorldX
3npm install

要運行模擬,您需要存取 LLM 與圖像生成模型。

💡 開發者提示: 與其在四個不同的 AI 平台註冊並分別管理協調、模擬與圖像生成的 API 金鑰,此步驟使用 AtlasCloud 的統一 API 金鑰。只需單一金鑰,我們就能輕鬆將呼叫分發至不同模型(例如用於深度推理的 DeepSeek,或用於快速代理聊天的標準 LLM),而無需更新多個環境變數。

設定您的 .env 檔案:

程式碼片段

plaintext
1PORT=3000
2ATLASCLOUD_API_KEY=your_atlascloud_key_here
3# 設定統一閘道以流暢地路由協調與模擬查詢

第二步:輸入魔法提示詞

使用 npm run dev 啟動伺服器並開啟本機儀表板。在建立控制台中,輸入以下這句提示詞:

「一個海盜島,船長在島上藏了被詛咒的寶藏,而船員中的一名叛徒正在午夜前悄悄試圖偷走它。」

第三步:見證模擬演變

點擊 Generate。在接下來的 5 分鐘內,WorldX 將運行其後端管道,輸出完整地圖並初始化三名主要代理:Blackwood 船長、大副 Thomas(叛徒)以及軍需官 Elena。

以下是即時 5 分鐘測試中,自主模擬展開的時間軸:

  • 01:15 (地圖就緒): 出現了一個海岸像素島,配有酒館、海岸線與隱藏的洞穴區。
  • 02:30 (首次互動): Thomas 移動到酒館並與 Elena 搭話,試圖打探她是否知道船長寶箱鑰匙的存放處。
  • 03:45 (衝突浮現): Blackwood 船長注意到 Thomas 在禁區洞穴附近徘徊。模擬 LLM 更新了 Blackwood 的日記:「Thomas 在海岸線附近行跡可疑。我必須加強戒備。」
  • 05:00 (高潮): Blackwood 在洞穴附近與 Thomas 對質。雙方透過 WebSockets 進行了緊張的對話,將兩人的關係狀態變更為「敵對」。

本次運行的效能與成本指標:

  • 地圖生成總耗時: 42 秒
  • 代理平均決策延遲: 1.2 秒
  • 總 Token 消耗 (5 分鐘運行): 約 24,500 tokens(涵蓋協調、日記與即時聊天)

資料與架構剖析:WorldX 的底層運作

WorldX 的高效在於它與傳統遊戲引擎相比,大幅減少了手動配置的需求。

   
指標 / 功能傳統沙盒設定WorldX 管道
地圖創建時間數小時/數天 (手動貼圖或繁重程序化編碼)< 60 秒 (透過 AI 與 CV 將提示詞轉為地圖網格)
NPC 對話路徑固定分支樹 (數百行文字)動態且無邊界 (由 LLM 即時生成)
碰撞映射在 Tiled 等編輯器中手動繪製邊界自動化 (透過功能性遮罩層與 Sharp 處理)
狀態追蹤集中式重量級資料庫狀態分散式日記 (儲存為短期與長期記憶片段)

常見問題 (FAQ):關於 WorldX 您需要知道的一切

WorldX 如何處理 AI 生成地圖上的角色碰撞?

它使用了巧妙的雙層處理方法。AI 首先生成視覺地圖,接著一個基於視覺的二級循環會在上方應用一個半透明的遮罩層,以標記可行走與不可行走的區域。核心引擎會將這些遮罩轉換為二進位網格矩陣,內建的路徑搜尋庫 (EasyStar.js) 即利用此矩陣來引導角色平滑移動。

我可以完全離線使用本機 LLM 運行 WorldX 嗎?

可以。由於該架構透過標準 REST 與 WebSocket 協定通訊,您可以輕鬆地將基礎 URL 指向運行 Ollama 或 Llama.cpp 的本機推論供應商。請注意,地圖協調需要紮實的 JSON 遵循能力,因此強烈建議針對穩定設定使用較大的量化模型。

當代理的記憶變得太長時會發生什麼?

WorldX 透過結構化的快照系統防止上下文視窗膨脹。模擬架構不會將整個歷史記錄饋送到每一輪操作中,而是將過去的事件壓縮為簡潔的日記條目與關係狀態旗標,從而確保每個代理的迴圈保持快速且具備成本效益。

最新模型

一個 API,暢享全模態 AI。

探索全部模型

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.