限时特惠|Seedance 2.0 & 2.0 Mini 立享 8 折!

如何通过单一提示词构建 AI 沙盒游戏:WorldX 指南

WorldX 让任何人都能通过一条文本提示词,快速构建一个完全自主、可交互的 2D 像素艺术沙盒世界,彻底打破了传统游戏开发的束缚。

如何通过单一提示词构建 AI 沙盒游戏:WorldX 指南

showcase.png


一句话的魔法:从零构建一个鲜活的 AI 沙盒世界

想象一下,只需输入一句话,就能见证一个庞大且具备交互性的 2D 像素艺术世界瞬间生成。无需手动拼接地图,无需编写数千行的 NPC 对话,更无需复杂的后端状态追踪。

通过 WorldX——一个开源的 AI 驱动世界生成器与模拟器,这一切已从概念变为现实。WorldX 将生成式 AI 与计算机视觉 (CV) 及多智能体模拟相结合,将原始文本描述转化为功能完整的沙盒环境。在这里,自主智能体能够生活、交流并自主推进各自的叙事,全程无需人工干预。

process.png


探秘 WorldX:一段提示词如何演化为自主现实

传统游戏开发高度依赖硬编码脚本和僵化的行为树。WorldX 通过一个双重处理流水线彻底颠覆了这一范式:

  • 算法地图生成: 当你输入提示词时,协调器 LLM 会将其转换为结构化的 JSON 布局,同时由图像生成模型绘制全局地图。为了弥合创意 AI 艺术与精确游戏机制之间的鸿沟,WorldX 采用了一种巧妙的“覆盖标注 + 微分视觉”技术。它能够精准标记交互区域和碰撞边界,将松散的像素转换为可行走、可交互的游戏网格。
  • 多智能体协调: 地图生成后,系统会创建具有独特档案、动机和记忆的智能体(NPC)。在模拟 LLM 的驱动下,这些角色绝非静止不动。它们会主动感知环境、在个人日记中记录事件、通过 WebSocket 相互发消息,并根据周遭发生的事情动态调整目标。

展示:从一个提示词到鲜活的海盗岛,仅需 5 分钟

让我们来看看如何轻松上手并运行一个实时模拟。

map.png

第一步:环境配置与 API Key 设置

首先,克隆仓库并安装依赖:

Bash

plaintext
1git clone https://github.com/YGYOOO/WorldX.git
2cd WorldX
3npm install

要运行模拟,你需要访问 LLM 和图像生成模型。

💡 开发者注: 无需在四个不同的 AI 平台注册并管理多套 API Key(分别用于协调、模拟和图像生成),此步骤使用 AtlasCloud 统一 API Key 即可。通过一个 Key,我们可以轻松将请求分发给不同的模型(例如用于深度推理的 DeepSeek,或用于快速智能体聊天的标准 LLM),而无需更新多个环境变量。

配置你的 .env 文件:

代码段

plaintext
1PORT=3000
2ATLASCLOUD_API_KEY=your_atlascloud_key_here
3# 配置统一网关,实现协调器和模拟查询的无缝路由

第二步:输入魔法提示词

运行 npm run dev 启动服务器,并打开本地仪表盘。在创建控制台中,输入以下单句提示词:

“一个海盗岛,船长在此藏了一份被诅咒的宝藏,船员中一名叛徒正悄悄试图在午夜前将其窃取。”

第三步:观察模拟演化

点击 Generate(生成)。在接下来的 5 分钟内,WorldX 会在后台运行流水线,输出一张完整的地图并初始化三个主要智能体:Blackwood 船长、大副 Thomas(叛徒)以及军需官 Elena。

以下是实时 5 分钟测试中自主模拟的演化时间轴:

  • 01:15(地图定型): 一座像素风海岸岛屿出现,包含酒馆、海岸线和隐藏洞穴区域。
  • 02:30(首次交互): Thomas 走向酒馆并与 Elena 攀谈,试图刺探她是否知道船长宝箱钥匙的存放位置。
  • 03:45(冲突浮现): Blackwood 船长注意到 Thomas 在禁区(洞穴)附近徘徊。模拟 LLM 更新了船长的日记:“Thomas 在海岸线附近行迹可疑,我必须加强防御。”
  • 05:00(高潮): Blackwood 在洞穴附近与 Thomas 对峙。双方通过 WebSocket 进行了紧张的对话交锋,将两者的关系状态变更为“敌对”。

本次运行的性能与成本指标:

  • 地图生成总时长: 42 秒
  • 智能体平均决策延迟: 1.2 秒
  • 总 Token 消耗(5 分钟运行): 约 24,500 Tokens(涵盖协调、日记记录和实时聊天)

数据与架构解析:WorldX 的底层逻辑

WorldX 的高效在于它相比传统游戏引擎大幅减少了手动配置工作。

指标 / 特性传统沙盒设置WorldX 流水线
地图创建时间数小时/数天(手动拼图或繁重的程序化编码)< 60 秒(通过 AI 与 CV 实现提示词转地图网格)
NPC 对话路径固定分支树(编写数百行文本)动态且无界(由 LLM 实时生成)
碰撞映射在 Tiled 等编辑器中手动绘制边界自动化(通过功能色彩蒙版与 Sharp 处理)
状态追踪中心化重型数据库状态去中心化日记(存储为短期与长期记忆片段)

常见问题解答 (FAQ)

WorldX 如何处理 AI 生成地图上的角色碰撞?

它采用了一种巧妙的双层方法。AI 首先生成视觉地图,随后一个基于视觉的二级循环会在其上应用半透明的色彩蒙版,以标记可行走与不可行走区域。核心引擎将这些蒙版转换为二进制网格矩阵,内置的寻路库 (EasyStar.js) 则利用该矩阵引导角色平滑移动。

我可以完全离线并使用本地 LLM 运行 WorldX 吗?

可以。由于该框架通过标准的 REST 和 WebSocket 协议进行通信,你可以轻松地将基础 URL 指向运行 Ollama 或 Llama.cpp 的本地推理服务。请注意,地图协调需要较强的 JSON 遵循能力,因此强烈建议使用较大的量化模型以保证环境生成的稳定性。

当智能体的记忆过长时会发生什么?

WorldX 通过结构化的快照系统防止上下文窗口溢出。模拟架构不会将整个历史记录填入每一次对话,而是将过去的事件压缩为紧凑的日记条目和关系状态标志,从而保持单个智能体循环的快速与经济。

最新模型

一个 API,畅享全模态 AI。

探索全部模型

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.