Agent 开发指南

本文档介绍如何基于 PuerTsAgent 框架定义和开发一个智能体（Agent）。

概述

在本框架中，一个智能体的行为和能力完全由一个资源目录（Resource Root）下的文件定义。不同的资源目录代表不同的智能体——可以是 Unity 编辑器助手、游戏内 AI 角色、或任何你需要的角色。

创建智能体

在 C# 代码中，通过资源路径初始化一个智能体。以随项目附带的 Maze Runner Demo 为例：

var agent = new AgentScriptManager();
agent.Initialize("maze-runner", () =>
{
    Debug.Log("Maze runner agent is ready!");
});

Initialize 的第一个参数是 Unity Resources/ 下的资源目录路径。框架会从该目录加载智能体的全部定义，包括：

system-prompt.md.txt — 角色定义（System Prompt）
skills/ — 领域技能文档（按需加载，可选）
builtins/ — 内置辅助模块（可执行的 JS 模块）

maze-runner 的完整目录结构如下：

Resources/maze-runner/
├── system-prompt.md.txt          # 角色定义（System Prompt）
├── skills/                       # 领域技能（按需加载，可选）
└── builtins/                     # 内置模块（按需加载）
    ├── maze-control.mjs          # 迷宫移动与状态查询
    └── screenshot.mjs            # 截屏观察迷宫

所有资源文件放在 Unity 的 Resources/ 目录下。

文件后缀约定：Unity Resources 不支持 .md 和 .mjs 作为 TextAsset，因此：
Markdown 文件使用 .md.txt 后缀
JS 模块文件使用 .mjs 后缀

下面依次介绍这三类文件的编写方式。

1. System Prompt — 角色定义

作用

system-prompt.md.txt 定义了智能体的身份、性格、能力范围和行为准则。它会被注入到 LLM 的 system prompt 最前面，是智能体"人设"的核心。

文件位置

<resource-root>/system-prompt.md.txt

格式

纯文本 / Markdown 格式，直接编写角色定义即可，无需 front-matter。

示例

编辑器助手（editor-assistant/system-prompt.md.txt）：

You are a helpful AI assistant running inside Unity via PuerTS (a TypeScript/JavaScript runtime for Unity). You can help with game development, scripting, and general questions. Be concise and practical.

迷宫 AI 示例（maze-runner/system-prompt.md.txt，节选）：

You are a Maze Explorer AI — an intelligent agent that navigates through 3D mazes by observing, reasoning, and acting.

## Your Capabilities

You can control a player character in a 3D maze using two builtin modules:
- **maze-control**: Move in compass directions (north/south/east/west) with `movePath()` and query obstacle distances with `getPlayerStatus()`
- **screenshot**: Capture the game view to visually observe the maze

## Goal Description

Your goal is to reach the **maze exit marker** — a tall RED pillar with a bright RED glowing ring.
...

System Prompt 中描述了 AI 的身份、可用模块、目标、探索循环、导航规则等完整的行为准则。篇幅可以较长——它定义了 AI 在整个任务中的行为模式。

2. Skills — 领域技能

作用

Skill 是一种按需加载的 Markdown 文档，为 LLM 提供特定领域的操作指南和规则。LLM 在需要时通过 loadSkill 工具主动加载对应技能到上下文中。

文件位置

<resource-root>/skills/<skill-name>.md.txt

文件格式

Skill 文件使用 YAML front-matter 声明元信息，正文为 Markdown 内容：

---
name: <skill-id>
description: "<one-line description shown to the LLM>"
---

(Markdown body — the actual skill instructions)

Front-matter 字段	必填	说明
`name`	✅	唯一标识符，LLM 通过此名称调用 `loadSkill`
`description`	❌	简短描述，展示在 `loadSkill` 工具的可用技能列表中

示例

skills/puerts-interop.md.txt：

---
name: puerts-interop
description: "PuerTS JS ↔ C# interop rules: CS/puer globals, out/ref params, generics, operators, Array/List indexer access, async/Task. CRITICAL: Unity edit-mode safety — use sharedMaterial/sharedMesh/DestroyImmediate instead of runtime-only APIs"
---

## PuerTS: JS ↔ C# Interop Rules

You are running in a PuerTS environment. Below are the rules for interacting between JavaScript/TypeScript and C#.

### JS Calling C#

1. **Access C# classes**: Use the global `CS` object with the full namespace path.
   ```js
   const Vector3 = CS.UnityEngine.Vector3;
   const go = new CS.UnityEngine.GameObject("myObj");

...

### 设计建议

- **description 要准确**：LLM 依据 description 判断是否需要加载该技能
- **内容要详尽**：技能文档是 LLM 执行特定任务的唯一参考，不要省略关键细节
- **一个领域一个技能**：保持职责单一，便于 LLM 精准加载

---

## 3. Builtin — 内置辅助模块

### 作用

Builtin 模块是 JavaScript 模块，为 LLM 的 `evalJsCode` 工具提供预置的辅助函数。与 Skill 不同，Builtin 是真正可执行的代码，而非文档。

### 文件位置

```text
<resource-root>/builtins/<module-name>.mjs

源码可以使用 TypeScript、JavaScript 或任何能编译为 .mjs 的语言，工程结构和位置不限。框架只关心最终放在资源目录下的 .mjs 文件。

模块约定

每个 Builtin 模块必须导出以下两个字符串常量：

导出	类型	说明
`summary`	`string`	简短摘要（约一行），始终展示在 `evalJsCode` 工具描述中
`description`	`string`	详细的函数签名和用法说明，LLM 通过 `import()` 读取

此外，模块导出的函数就是 LLM 在 evalJsCode 中可以调用的实际功能。

示例

builtins/unity-log.mjs（以 TypeScript 源码形式展示）：

// ---- Summary for tool description (always in context) ----
export const summary = `**unity-log** — Unity console log access (retrieve and summarize recent logs). Read \`.description\` to see available functions and their signatures.`;

// ---- Description for on-demand access via import ----
export const description = `
- **\`getUnityLogs(count?, logType?)\`** — Get recent Unity console logs.
  - \`count\` (number, default 20): Number of log entries to retrieve (1-50).
  - \`logType\` (string, default \`'all'\`): Filter by type — \`'all'\`, \`'error'\`, \`'warning'\`, or \`'log'\`.
  - Returns an array of log entry objects: \`{ timestamp, type, message, stackTrace? }\`.
`.trim();

// ---- Function implementations ----
export function getUnityLogs(count: number = 20, logType: string = 'all'): LogEntry[] {
    // Parameter validation...
    const logsJson = CS.LLMAgent.UnityLogBridge.GetRecentLogs(count, logType);
    return JSON.parse(logsJson);
}

设计建议

summary 尽量简短：它始终占用 token，只需告知模块用途即可
description 要列出完整签名：LLM 必须先读 description 才能正确调用函数
函数要做参数校验：LLM 可能传入错误参数，校验后抛出有意义的错误信息
支持 top-level await：模块可在顶层使用 await（如异步初始化）
C# 桥接层（Bridge 类）需要提前在 Unity 侧实现好

4. 完整开发流程

以 Maze Runner 迷宫 AI 智能体为例：

Step 1：创建资源目录

Resources/maze-runner/
├── system-prompt.md.txt
├── skills/
└── builtins/

Step 2：编写角色定义

编辑 system-prompt.md.txt，定义 AI 的身份和行为准则。例如迷宫 AI 需要描述：

角色身份（迷宫探索者）
可用模块（maze-control, screenshot）
目标（到达红色终点标记）
探索循环（观察 → 规划 → 行动）
导航策略（右手法则、死胡同检测等）

Step 3：编写领域技能（可选）

在 skills/ 目录下创建 .md.txt 文件，添加 YAML front-matter 和技能内容。

迷宫 Demo 没有使用 skill 文件——所有导航规则直接写在 system-prompt 中。当领域知识较多且不需要每次都加载时，拆分为 skill 更合适。

Step 4：编写辅助模块

编写 Builtin 模块源文件，编译后将 .mjs 产物放到 Resources/maze-runner/builtins/ 下。

迷宫 Demo 有两个 Builtin 模块：maze-control（移动和状态查询）和 screenshot（截屏观察）。以 maze-control 为例（TypeScript 源码，节选）：

export const summary = `**maze-control** — Control the player in the maze. \`movePath([{dir, steps}, ...])\` executes a multi-segment path. \`getPlayerStatus()\` returns position and obstacle distances. Read \`.description\` for details.`;

export const description = `
- **\`movePath(segments)\`** — Move the player along a multi-segment planned path.
  - \`segments\` (array): Array of \`{ dir: string, steps: number }\`.
  - Returns: \`{ success, stepsCompleted, blocked, reachedGoal, position, message }\`
- **\`getPlayerStatus()\`** — Get the player's position and obstacle distances.
  - Returns: \`{ position, northDistance, southDistance, eastDistance, westDistance, reachedGoal }\`
`.trim();

export async function movePath(segments: PathSegment[]): Promise<MoveSequenceResult> {
    // Parameter validation...
    const directionsJson = JSON.stringify(segments.map(s => s.dir));
    const distancesJson = JSON.stringify(segments.map(s => s.steps));
    const resultJson = await new Promise<string>((resolve, reject) => {
        CS.LLMAgent.MazePlayerBridge.MoveSequenceV2(directionsJson, distancesJson, (json: string) => resolve(json));
    });
    return JSON.parse(resultJson);
}

export async function getPlayerStatus(): Promise<PlayerStatusResult> {
    const resultJson = await new Promise<string>((resolve, reject) => {
        CS.LLMAgent.MazePlayerBridge.GetPlayerStatus((json: string) => resolve(json));
    });
    return JSON.parse(resultJson);
}

Builtin 模块通过 CS.* 全局对象调用 C# 桥接层。桥接类（如 MazePlayerBridge）需要提前在 Unity 侧实现。

Step 5：初始化智能体

在 C# 代码中，用对应的资源路径初始化智能体（参见本文开头「创建智能体」一节）。

5. 最佳实践

System Prompt

保持简洁明确，避免过长（它始终占用上下文 token）
聚焦于"你是谁"和"你应该怎么做"，不要包含框架运行时细节

Skills

将复杂的领域知识拆分为独立的技能文件
description 中包含关键词，帮助 LLM 判断何时需要加载
内容越详细越好——这是 LLM 执行任务的唯一参考

Builtins

每个模块专注一个功能领域（如场景操作、日志查询）
summary 一行即可，description 要完整列出所有函数签名
所有导出函数都应做参数校验，抛出有意义的错误信息

通用

一个资源目录 = 一个独立的智能体角色
不同智能体之间完全隔离，可以有完全不同的技能和工具集

Agent 开发指南

概述​

创建智能体​

1. System Prompt — 角色定义​

作用​

文件位置​

格式​

示例​

2. Skills — 领域技能​

作用​

文件位置​

文件格式​

示例​

模块约定​

示例​

设计建议​

4. 完整开发流程​

Step 1：创建资源目录​

Step 2：编写角色定义​

Step 3：编写领域技能（可选）​

Step 4：编写辅助模块​

Step 5：初始化智能体​

5. 最佳实践​

System Prompt​

Skills​

Builtins​

通用​

概述

创建智能体

1. System Prompt — 角色定义

作用

文件位置

格式

示例

2. Skills — 领域技能

作用

文件位置

文件格式

示例

模块约定

示例

设计建议

4. 完整开发流程

Step 1：创建资源目录

Step 2：编写角色定义

Step 3：编写领域技能（可选）

Step 4：编写辅助模块

Step 5：初始化智能体

5. 最佳实践

System Prompt

Skills

Builtins

通用