CodePapr 教程

CodePapr 简介

什么是 CodePapr

CodePapr 是一个缓存优先的编码代理（Agent）系统，提供 Tauri 桌面工作台和 CLI 终端入口两种入口。它通过共享 Agent Runtime 为桌面端与终端 CLI 提供能力，使 AI 代理能够在真实项目仓库里完成读取、修改、执行、验证与预览。

CodePapr 不是传统的 AI 聊天工具，也不是 IDE 插件。它是一个在终端/桌面中运行的自主代理，能真正理解你的项目上下文并自动执行开发任务。

核心设计理念

本地优先：项目上下文尽量不离开工作区，文件和命令执行都在本地完成
单一 Runtime，多入口复用：桌面工作台与 CLI 终端入口共用同一套 Agent、Session、ToolRegistry、Provider 语义
DeepSeek 缓存优化：稳定内容前置、易变内容后置，最大化前缀缓存命中率以降低 token 成本
结构化代码修改：使用 Search/Replace Diff 机制，先校验再写入，避免行号错位
可验证执行链路：每一轮请求、响应、工具调用和缓存统计都可追踪

CodePapr 与主流 AI 编程工具对比

2026 年，AI 编程工具已经很成熟。以下对比基于各工具当前公开能力，如实呈现差异。

维度	Cline (62k⭐)	Aider (46k⭐)	Devin Desktop	CodePapr
形态	SDK / VS Code / JetBrains / CLI / Kanban	终端命令	独立桌面 IDE	独立桌面应用（Tauri 2）
多 Agent	✅ 团队 + 协调者 + 定时调度	❌ 单 Agent	✅ 多 Agent 舰队 + ACP 协议	✅ 主 Agent + 3 内置子代理 + 自定义
任务规划	Kanban 看板	❌	Spaces + Kanban	TodoList：自动创建 / 进度追踪 / re-plan
代码理解	读取文件 + grep + LSP	Repo Map	Fast Context（毫秒级）	ProjectGraph 语义图：14 个分析 action
回退机制	Checkpoints 快照	Git commit 回退	Diff review	Git auto-commit checkpoint + `reset --hard`：代码与消息原子性恢复
缓存优化	❌	❌	❌	DeepSeek 三层前缀缓存，跨会话复用
模型支持	几乎所有（含本地）	几乎所有（含本地）	内置免费模型 + 第三方	DeepSeek / OpenAI / Claude / 本地
扩展性	SDK + MCP + 插件系统	配置文件	MCP + Extension + ACP	自定义 Agent / Skills / 命令 / 规则
价格	开源免费 + API 费用	开源免费 + API 费用	免费 / $20 Pro / $200 Max	开源免费 + API 费用

CodePapr 的独特价值：与其他工具互补而非替代。如果你需要 IDE 深度集成和丰富的插件生态，Cline/Aider/Devin Desktop 更成熟。如果你看重 独立桌面工作台、DeepSeek 前缀缓存极致省成本、多子代理协作体系和对话即可回退的原地重置——CodePapr 是最佳选择。

谁适合使用 CodePapr

已掌握至少一门编程语言，能读懂基础语法和项目结构
希望借助 AI 大幅提升开发效率的工程师
独立开发者或需要长期维护复杂项目的技术负责人
习惯在命令行和可视化界面之间切换的开发者
关注 token 成本，希望利用 DeepSeek 缓存优化降低开销的团队

需要具备的基础能力

基础编程能力（能读懂并编写简单代码）
基本的代码阅读与理解能力
会使用常见开发工具（编辑器、命令行、Git）
具备基本的项目结构认知（目录、模块划分）
愿意理解代码，而不是完全依赖 AI

支持的 LLM Provider

DeepSeek（原生） OpenAI（兼容） Claude / Anthropic（兼容）本地 OpenAI 兼容端点

安装与环境配置

环境要求

组件	最低版本	用途
Node.js	18+	运行时和包管理
npm	9+	依赖管理
Rust toolchain + Cargo	stable	桌面端编译（debug/release/publish）
.NET SDK	-	C# Roslyn analyzer（release 构建需要）

注意：如果只做前端开发或只阅读源码，完成 npm install 和 npm run build 通常就够了。桌面端调试和打包才需要 Rust toolchain。

标准安装

# 克隆仓库后
npm install
npm run build

安装验收

npm run verify

通过这一步，说明当前机器至少满足：Node 依赖正确、workspace 构建正常、workspace 测试正常、CLI E2E 正常、Tauri cargo check 正常。

支持平台

平台	架构	状态
macOS	arm64 (Apple Silicon)	支持（输出 .dmg 安装包）
Windows	x64	支持（输出 .msi 安装包）

两个平台共用同一套 Rust 后端与前端代码，发布流程会同时输出 dmg / msi 安装包。

外部依赖

根据你要执行的操作，可能还需要：

可用的模型 API key（DeepSeek / OpenAI / Claude 或本地兼容端点）
Chrome 或 Chromium 兼容浏览器（用于浏览器交互和截图）
VS Code（可选，用于工作区任务和调试配置）

三种启动方式

命令	用途
`npm run debug`	开发调试，热重载，适合长会话和日常使用
`npm run release`	直接启动优化后的桌面端运行文件（不打包安装包）
`npm run publish`	生成当前平台的安装包（.dmg / .msi）并整理到 `Release/`

API 设置与模型配置

配置存放位置

层级	路径	作用
应用级	`~/.codepapr/codepapr.sqlite`	provider、model、API key、语言、采样参数
项目级	`<workspace>/.CodePapr/`	项目状态、会话记录、规则、Agents、Skills

Provider 模式

模式	说明	适用场景
`deepseek`	DeepSeek 官方 provider	推荐默认，缓存优化效果最好
`openai`	OpenAI 兼容格式	接入 OpenAI 或兼容服务
`claude`	Claude/Anthropic 兼容格式	接入 Claude 或兼容端点

DeepSeek 接口参考地址

# OpenAI 格式（DeepSeek provider 默认使用）
https://api.deepseek.com/v1

CodePapr 的 DeepSeek provider 固定使用 OpenAI 兼容的 https://api.deepseek.com/v1。如果你想用 Anthropic 协议接 DeepSeek，可在 provider 中选择 Claude，并把 baseURL 设为 DeepSeek 提供的 Anthropic 兼容端点。

环境变量回退顺序

桌面端与 CLI 提供 provider 兼容层会按以下顺序读取 API key：

DEEPSEEK_API_KEY
OPENAI_API_KEY
ANTHROPIC_API_KEY

应用级设置项

LLM 设置

provider — 模型提供商
model — 模型名称
baseURL — 自定义端点地址
API key — 认证密钥
temperature — 生成温度
maxTokens — 最大输出 tokens
thinkingEnabled / thinkingEffort — 思考模式

路由设置

fast model 开关 — 是否启用快速模型
fast model name — 快速模型名称（默认 deepseek-v4-flash）
max tool rounds — 最大工具轮次（默认 500）
max context tokens — 最大上下文 tokens（默认 200k）
max conversation rounds — 最大对话轮数（默认 24）

快速模型路由

场景	使用模型	温度
主 Agent 对话	主模型（默认 `deepseek-v4-pro`）	默认
上下文压缩	快速模型（默认 `deepseek-v4-flash`）	0.1
子代理派发（重型/执行类）	主模型	用户配置
子代理派发（Explore/Scout 快速模式）	快速模型（可切换为主模型）	用户配置
Slash 命令声明 `model: fast`（如 `/search`、`/lint`、`/clean`、`/commit`、`/summary`、`/build`）	快速模型（未启用时回退主模型）	0.3

提示：桌面端设置面板分为 通用 / LLM / 搜索 / Mentor / 高级 五个 Tab。通用含语言、调试、许可证；LLM含主模型、快速模型、采样参数与思考强度；搜索用于配置自托管 SearXNG 搜索后端（SearXNG 优先，失败自动降级到内置 Bing / Mojeek / Qwant / Wikipedia 等多源聚合；搜索引擎选择器已移除；分类/时间/语言/安全搜索等高级参数收入折叠区）；Mentor配置导师子代理的独立 API Key、Base URL 和模型选择；高级含上下文压缩、TodoList 重试、Goal 自主循环、Verifier 模型、ProjectGraph 限制等。语音配置不在主设置面板，而在角色编辑面板（CharacterModal 的 Voice Tab）中按角色独立设置。

第一次使用

三步启动

准备配置：在桌面端设置中填写 API key、provider 和 model
选择入口：直接使用桌面端（当前公开产品入口只保留桌面工作台）
选择模式：Ask 负责解释和分析，Plan 负责拆解方案，Agent 负责实际执行，App 负责生成可视化应用

最短路径

npm install
npm run build
npm run debug

首次使用流程

打开设置，填写 provider、model 和 API key
选择项目文件夹
在 Ask、Plan、Agent、App 中选择当前任务模式
输入任务描述，让代理执行或分析
在文件树、编辑器、Git、预览面板中复核结果

自动恢复：桌面端会记住你上次打开的项目目录，并在下次启动时自动恢复该项目及其项目级聊天记录。只有当项目路径失效或你改为打开其它目录时，才会看到空工作区。

使用入口

入口	适合场景
Desktop Workbench	长会话、文件树、Git、预览、浏览器交互——可视化工作台
CLI（`codepapr` 命令）	终端交互、脚本化自动化；提供 `chat` / `ask` / `plan` / `agent` / `init` / `session` / `stats` / `config` 子命令

注意：CLI 内置 Explore、Scout 两个子代理；Mentor 仅在桌面端的"子Agent"标签页可启用并配置。

工作模式：Ask / Plan / Agent / App

Ask、Plan、Agent、App 不是不同产品，而是同一套 Runtime 的四种工作方式。

Ask 分析模式

适合：解释架构、梳理模块职责、分析报错原因、先问清楚再决定是否执行。

特点：

默认不改文件、不跑命令
遇到时效性问题时，优先走只读时间/网页工具核实
只有你明确要求基于项目核实，它才会进入只读工具链

Plan 规划模式

适合：大改动前先出执行方案、想看影响文件和验证路径、把复杂任务拆成清晰步骤。

特点：

默认先给任务清单
会给影响文件、执行顺序、验证方式和风险
适合先规划，再切到 Agent 执行

Agent 执行模式

适合：修复 bug、实现功能、跑测试与验证、需要真正读写文件和调用工具的任务。

特点：

会主动搜索项目、读写文件、跑命令、做验证
会使用工作区工具、后台命令、shell、预览和浏览器能力
Agent 主执行循环在 Web Worker 中运行，长任务不会阻塞界面
exec 等长命令会在工具调用卡片中显示运行状态和日志
主执行默认最多连续运行 500 个内部工具轮次
文件改动后会异步派发后台诊断；同一失败指纹不会重复触发修复

App 应用生成模式

适合：数据探索与可视化、生成交互式图表和仪表盘、一句话将分析结果变成可交互的 HTML 应用。

核心理念：

你的直接产出不是 Markdown 回答——而是一个完整的 HTML 应用
就像即时开发一个针对当前问题的专用工具
与编码 Agent 完全不同——它是"应用工厂"，不是"写代码的人"

工作流程：

探索数据源：用 workspace_read_file / MCP 工具理解数据结构
生成应用：用 workspace_write_file 写完整 HTML 到 .CodePapr/apps/<appId>/index.html
渲染结果：调用 app_render 工具渲染到右侧"应用"面板

HTML 应用规范：

单文件内联 HTML——不需要组件拆分或构建系统
通过 CDN 引用图表库（D3、ECharts、Mermaid、MapLibre、Leaflet、Three.js 等）
在沙箱 iframe 中运行（sandbox="allow-scripts allow-same-origin"）
可使用 Papr SDK（window.papr）调用 Agent、存储、HTTP、文件系统
appId 必须是 kebab-case，相同 appId 再次调用覆盖更新——支持迭代改进

会话隔离：

App 与编码模式（Ask/Plan/Agent）会话级隔离--一旦选定 App，该会话锁定为 App 🔒，不可切到其他模式
编码会话中 App 选项被隐藏--已开始编码的会话不能切到 App
Ask / Plan / Agent 之间可以自由切换，无需新建会话
App ↔ 编码模式互切换 -> 新建会话

模型策略：始终使用主模型（deepseek-v4-pro）以保证 HTML 生成质量。

应用管理：右侧面板的"应用"Tab 显示所有已注册的 .papr App。绿/红圆点指示运行状态。底部工具栏：▶ 启动 / 打开 / ■ 停止 / 🗑 删除。LLM 可通过 app_list、app_start、app_stop、app_delete 工具管理应用生命周期。

权限分级：App 通过 manifest.level 声明权限级别（L0 纯计算 / L1 Runtime / L2 联网 / L3 系统，默认 L1）。设置 → App Tab 管理全局默认级别和逐 app 覆盖。

App 模式典型场景

数据库分析："分析这个 SQLite 的表结构，生成一个 Database Explorer"
人物关系图："把人物关系做成 D3 力导向图"
股票仪表盘："生成带有 K 线图和龙虎榜的 dashboard"
文件分析："分析 paper-map——引用网络、作者关系、Topic Cluster"
地域可视化："分析唐朝宰相的地域分布，做成可缩放地图"

如何给出有效任务

CodePapr 的实际表现很依赖任务描述质量。最有效的提示词通常包含：

目标是什么
改动范围在哪里
参考实现在哪
不能动什么
验证标准是什么

不够好的写法

帮我修一下预览。

经验之谈：把它当作一个能执行任务的工程代理，而不是纯聊天机器人，会得到更稳定的结果。

桌面工作台

界面结构

左侧：会话列表和快捷入口
中间：聊天区，展示消息、工具调用、状态和执行总结
右侧：文件树与代码预览
辅助区域：Git 面板、后台进程、网页预览

桌面端完整能力

项目文件树浏览
Monaco 代码预览（VS Code 引擎）
多语言 LSP hover、definition 和问题标记
Ask / Plan / Agent / App 模式切换
工具调用过程可视化

Git diff、最近提交、分支切换与安全回退
后台进程管理
应用内网页预览
浏览器页面交互与截图
项目配置入口（规则、Agents、Skills）
可视化 Code Review 面板（逐行评论、审批状态）
非阻塞 Toast 通知
外部路径访问权限弹窗

代码审查面板

顶部 AgentOps 工具栏点击审查可打开 Code Review 面板：

默认对比 HEAD~1..HEAD 的 diff
左侧文件列表展示新增/修改/删除/重命名
Monaco diff 编辑器展示 original / modified 两侧
点击行号边栏可在任意一侧添加行级评论
评论可标记为已解决 / 未解决
可设置整体审批状态：待审查 / 已批准 / 需修改 / 已评论

对话轮次导航

对话区域右侧有一个紧凑的轮次指示条，每条横线对应一个用户消息：

悬停指示条 → 自动展开面板，列出所有对话轮次（#1 编号 + 用户输入首句）
当前可视轮次在指示条和面板中同步高亮
点击任意轮 → 对话平滑滚动到对应消息位置
鼠标移开面板或指示条 → 面板自动关闭（200ms 延迟防误关）

全局搜索

顶部工具栏搜索框，支持对话和文件搜索，通过 对话 | 文件 双 Tab 切换：

对话 Tab：搜索当前会话消息，可按角色过滤（全部 / 你 / AI），↑↓ 选择 Enter 跳转
文件 Tab — 内容模式：搜索工作区文件内部文本，结果展示文件路径 + 行号 + 匹配行
文件 Tab — 文件名模式：搜索文件路径和名称
文件结果点击 → 打开文件并跳转到对应行
搜索面板视口居中弹出，300ms 防抖，仅文件 Tab 激活时才触发后端搜索

Toast 通知

桌面端使用非阻塞 Toast 替代 alert：

四色：info / success / warning / error
默认 4.5 秒自动消失，error 默认 8 秒
最多同时显示 5 条，超出时丢弃最早的

外部路径权限

当 Agent 请求读取或列出项目外的绝对路径时，桌面端会弹出权限对话框：

拒绝：阻断此次访问
允许此文件：仅放行该文件
允许此文件夹：放行该目录及其子内容

授权结果保存在白名单中，后续同路径不再弹窗。写入、编辑、命令执行仍限制在工作区内。

什么时候优先用桌面端

你在做多轮修复或重构
你需要一边看文件树一边让代理工作
你需要 Git diff、页面预览或页面自动化
你希望把会话、文件和验证收拢在一个界面里

Git 集成

Git 面板：展示 staged/unstaged diff、最近提交历史、分支创建/切换、本地提交、安全擦除本地改动
8 个 Agent Git 工具：status、diff、history、branch_checkout、stage、commit、restore、reset（全部通过内置 libgit2 Tauri 命令，不依赖系统 git）
自动初始化：如果当前工作区还没有 Git 仓库，面板可直接初始化（通过内置 libgit2，无需系统 Git）

对话重置（Shadow Git 快照）

每条用户消息进入对话历史之前，CodePapr 会通过独立的 Shadow Git 仓库（.CodePapr/git/，基于 libgit2 — 无需系统 Git CLI）抓取代码快照：

IgnoreResolver 扫描工作区文件树，遵守 .gitignore 并自动排除 node_modules/、dist/、.next/、大文件（>100MB）等
通过 index.add_path 逐文件添加，提交为 checkpoint #N · "消息预览"

当你需要回退时：

Hover 任意用户消息，点击"重置到此点"
恢复计划预览：系统先计算哪些文件会变更 — 展示恢复/删除/不变的文件数量，先预览再执行
执行：确认后系统回退到快照 checkout
自动创建备份引用 refs/codepapr-backup-before-reset，可随时撤销
消息列表同步截断，后续对话全部移除

工具能力详解

Agent 注册了 全面的工具集，覆盖文件操作、ProjectGraph 分析、Git、预览、浏览器、Shell、LSP 等全部本地开发场景。以下是按能力分组的关键工具。

graph — 项目理解核心

统一的项目语义图工具，通过 action 参数选择操作。同时返回目录树、代码结构骨架和文件/符号关系图，是所有符号查找、依赖分析、影响分析的基础。

工具 / Action	能力
`graph` full	生成完整 ProjectGraph：目录树 + 代码结构骨架 + 依赖图
`graph` overview	轻量概览（不含完整代码骨架），适合快速感知项目轮廓
`graph` lookup	按名称/路径查找符号，返回 symbolId、文件和行号
`graph` dependency	提取依赖子图，支持 incoming / outgoing / both
`graph` entrypoints	查找项目入口文件和入口符号
`graph` impact	反向影响分析：修改某符号会影响哪些地方
`graph` implementations	查找接口或基类的实现/派生符号
`graph` smart_context	根据任务描述智能获取最相关项目上下文
`graph` dead_code	检测未使用的符号（类、函数、变量）
`graph` circular_deps	检测文件间循环导入依赖
`graph` type_hierarchy	构建类、接口、类型的继承/实现层次树
`graph` suggest_refactors	基于代码结构分析，建议可提取的方法和可独立成文件的符号
`graph` test_impact	根据变更文件列表，分析哪些现有测试会受影响
`graph` generate_tests	为项目中导出的可测试符号自动生成测试骨架

文件操作

工具	能力
`read`	读取文件内容，支持行范围、行窗口、上下文行数、字节限制
`write`	创建或完整覆盖写入文件；局部修改请用 edit
`edit`	单文件精确 SEARCH/REPLACE 修改；search 必须精确匹配源文件
`patch`	多文件原子 SEARCH/REPLACE；全部校验成功后一起写入，任一失败即回滚
`grep`	正则搜索文件内容，返回匹配位置与上下文
`glob`	按文件名 glob 模式搜索项目文件，支持正则合并
`list`	浏览项目目录树结构，支持递归深度控制

LSP 语言智能

工具 / Action	能力
`lsp` definition / references	语言服务只读导航：跳转到定义、查找所有引用
`lsp_edit` rename / code_action / format	语言服务语义修改：重命名、代码动作、格式化
`diagnostics`	单文件 LSP 诊断或项目级 lint / typecheck

命令执行

工具 / Action	能力
`exec`	运行命令：默认阻塞等待；background:true 后台运行；previewUrl 启动后预览
`shell` open / send / read / close / list	持久 Shell 会话，支持多步命令和交互式终端
`proc` list / stop / stop_all	后台进程管理

Git 操作

工具 / Action	能力
`git` status / diff / log	读取工作区状态、差异、提交历史
`git` branch / stage / commit	切换或创建分支、暂存改动、创建提交
`git` restore / reset	恢复改动或安全回退（自动创建备份分支和快照）

浏览器与预览

工具 / Action	能力
`browser` open / navigate / reload / close	内置浏览器：打开 URL、导航、刷新、关闭
`browser` click / type / read / screenshot / get	浏览器交互：点击元素、输入文本、读取 DOM、截图、读状态
`open`	在系统默认浏览器打开 URL 或项目内 HTML 文件

应用渲染

工具	能力
`app_render`	生成 .papr App 并渲染到应用面板；自动写 manifest.json + index.html。支持声明 permissions、agents、level（权限级别 0-3）。HTML 可使用 `window.papr` SDK 调用 Agent/存储/HTTP/文件系统。相同 appId 覆盖更新。
`app_list`	列出所有已注册 .papr App（名称、是否有后端、是否运行中）。创建前调用检查重复。
`app_start`	按 appId 启动后端服务。检查端口可用性，成功后绿点亮起。
`app_stop`	按 appId 停止后端服务。停止后绿点变红。
`app_delete`	按 appId 彻底删除 App。停止后端、删除文件、清除存储。不可恢复。

网络工具

工具	能力
`web_search`	在线搜索网页，聚合多源结果
`web_fetch`	读取网页内容，自动提取正文并转为纯文本
`web_download`	下载文件到项目 .CodePapr/downloads/ 文件夹

其他工具

工具	能力
`skill`	加载项目 .CodePapr/skills/ 下的 Skill 说明文件
`local_time_now`	获取当前本地时间、日期和时区，适合时效性问题（市场开闭盘、活动截止时间等）
`question`	Plan 模式下向用户提问，支持预定义选项和多选
`task`	把子任务委派给声明式子代理（Explore / Scout / Mentor）执行
`todo`	规划和追踪多步任务清单，支持初始化、进度汇报、重规划

外部路径权限

桌面端对项目外绝对路径的 read / list 操作会触发 PermissionDialog 弹窗授权；CLI 的读取边界较宽松，写入仍限制在工作区内。

文件大小限制

单次 read / write / edit / patch 操作的上限为 20MB，可覆盖大多数源码和二进制资源文件，但大文件会显著增加 token 消耗。

工具设计原则：LLM 看到的工具名是精简的"合并工具"（共 26 个），底层委托给 40+ 独立工具。Agent 可同时使用所有工具，子代理按 tools 配置白名单限制权限。代码修改优先用 edit/patch 走 Search/Replace Diff，新建文件才用 write。命令执行：短命令用 exec，长驻进程用 exec background:true，交互式终端用 shell。

角色扮演

CodePapr 支持创建、导入和管理 AI 角色，让 Agent 以特定人设与你对话。激活角色后，角色的身份、语气、风格会被注入 LLM 系统提示词，Agent 以角色人设作出回应。

角色数据模型

每个角色包含以下字段：

字段	说明
名称	角色显示名
头像	上传的图片，也会显示在聊天界面
描述	外貌、背景故事、身份设定
个性	说话风格、性格特征、行为习惯
场景	当前对话发生的情境
开场白	角色第一次对话时会说的话
示例对话	用 `<START>` 分隔的多组对话，引导 LLM 理解角色风格
系统提示词	追加到角色人设后面的额外指令
标签	自定义标签，用于分类和检索

角色扮演格式约定

激活角色后，系统提示词会明确以下格式规则，确保 TTS 能正确区分对话和动作：

格式	含义	TTS 行为
`动作描述`	叙述、场景描写、角色动作	不朗读
纯文本	角色说的话	朗读
`加粗文字`	重读、强调	朗读时加重语气
`（括号）或（轻声）`	语气提示	不朗读

创建角色

点击工具栏的角色按钮（头像图标），打开角色管理面板
点击 "新建角色"
在基础 Tab 中填写名称、描述、个性、场景、开场白、示例对话等信息
可上传头像图片（PNG/JPG）
在语音 Tab 中配置语音合成（可选，详见下节）
点击保存

导入角色卡（CCv3 / SillyTavern 兼容）

CodePapr 兼容 chara-card-v3 规范，可从其他工具导入角色：

点击角色面板中的 "导入角色卡" 按钮
选择 PNG 文件（JSON 嵌入在图片的 tEXt/iTXt chunk 中）或 JSON 文件
角色信息自动解析，PNG 图片自动作为头像
检查并调整导入的字段，点击保存

支持的 PNG chunk 关键字：chara、ccv3、character、character_card

导出角色卡

在角色列表中点击角色的导出按钮，角色将被导出为 PNG 角色卡。PNG 中嵌入完整的 CCv3 JSON，可在 SillyTavern 等工具中使用。

启用/切换角色

在角色列表中点击角色名称即可激活。当前激活的角色会显示"已启用"标记。Agent 的每次回复都会以该角色的人设进行。

角色人设放在 Session Bootstrap 中（不在系统提示词的 ImmutablePrefix 中），因此切换角色不会破坏 DeepSeek 前缀缓存。

提示：角色扮演不影响 Agent 的代码理解和执行能力。Agent 仍然能搜索项目、修改文件、运行命令——只是输出的语气和风格会匹配角色设定。

语音合成（TTS）

CodePapr 集成了 GPT-SoVITS 语音克隆引擎，可在本地将角色的文字回复合成为语音。只需 3-10 秒的参考音频即可克隆一个角色的声音。

TTS 数据流： ChatPanel → useTtsPlayer (React Hook)：流式文本 → 句子分割 → 队列管理 → Rust TTS 模块 → GPT-SoVITS Python Server（本地端口 9880） → rodio（Rust 音频库）播放

安装 GPT-SoVITS

首次使用语音功能需要安装 GPT-SoVITS。安装入口有两处：

点击 ChatPanel 上的 TTS 喇叭按钮，若检测到未安装，会自动弹出安装向导
在角色编辑面板的 Voice Tab 中触发安装

安装向导会自动完成 5 步：检查 Python → 克隆 GPT-SoVITS 仓库 → pip 安装依赖 → 下载预训练模型（约 2GB，使用 hf-mirror 源）→ 验证。

需要本机已安装 Python 3.10+。安装过程会写入 ~/.codepapr/gpt-sovits/。

为角色配置语音

点击工具栏的角色头像按钮，打开角色编辑面板
切换到 Voice Tab，开启 “启用语音输出”
上传参考音频：
- 时长 3-10 秒（推荐 5 秒），太短克隆不准、太长会被截断
- 格式 WAV / MP3 / M4A / AAC，采样率 16kHz 或更高
- 内容：清晰人声，无背景音乐、噪声、混响
填写 参考文本：必须与音频内容逐字对应，否则克隆效果会很差
选择 参考音频语言 和 说话语言（支持中文、粤语、英语、日语、韩语及混合模式）
调整参数：
- 语速：50% - 200%
- 合成速度：仅 4 / 8 / 16 三档。4=极速、8=均衡、16=最高质量
- 合并句数：1-5，一次合成合并几句一起推理，减少往返次数
点击 “试听” 按钮预览效果
满意后点击保存

当前播放模式

当前 UI 采用 WebSocket 批量流式（ws-batch）作为默认且唯一实际生效的模式：所有句子通过一条持久 WebSocket 连接批量发送、逐个返回，首字延迟约 1-2 秒，句间衔接流畅。

代码层保留了 whole、streamed-pipeline、streamed-pcm 三种模式，但角色编辑面板暂未开放切换，用户无需关注。

语音微调

对音质有更高要求时，可在 Voice Tab 中使用微调功能：

确保参考音频和参考文本已配置并试听通过
点击 “生成训练数据”：LLM 根据角色设定生成约 500 字的台词脚本，GPT-SoVITS 自动合成约 2 分钟训练语音，无需手动录音
点击 “开始微调”：后台训练，通常 30-60 分钟，可关闭窗口
训练完成后勾选 “使用微调模型”：音色更稳定、合成更快，合成速度可降至 4（极速档）

播放控制

自动朗读：启用语音的角色在 AI 回复时会自动朗读
重播：鼠标悬停在任意 AI 回复上，会出现“重播”按钮，可重新朗读该条内容
停止：取消当前 Agent 消息可中断正在进行的朗读
服务控制：ChatPanel 上的 TTS 喇叭按钮用于启动 GPT-SoVITS 服务或查看服务日志/状态

GPU 预热（Apple Silicon）：在 M 系列 Mac 上，首次启动 TTS 服务后，可在角色编辑面板的 Voice Tab 中手动点击 “GPU 预热” 按钮。它会提前编译 Metal GPU kernel，避免首次合成卡顿 5-15 秒。预热仅在 Apple Silicon 上有效。

音质建议：参考音频最好在安静环境中录制，避免背景噪音。参考文本需要与音频内容完全一致。微调后音质提升明显，尤其是中文和日语。

配置文件与规则

.CodePapr/AGENTS.md — 全局项目规则

全项目规则会注入主 Agent 和所有子代理。适合写：

代码风格和目录约定
构建、测试、发布命令
禁止改动的路径或行为
项目背景和验收标准

自动注入流程：代理会按以下优先级查找规则文件并拼进稳定系统提示词：
1. .CodePapr/AGENTS.md
2. .CodePapr/rules.md
文件不存在会被自动跳过。

.CodePapr/memory.md — 跨会话项目记忆（自动整理）

Agent 在工作过程中会自动发现项目特有的模式、坑和约定，并将其写入记忆文件。下次会话启动时自动加载，帮助 Agent 避免重复踩坑。文件超过 200 行后会自动整理，避免无限膨胀。

自动积累：Agent 发现项目特有知识后，用 write 追加到 .CodePapr/memory.md，每条以 ## YYYY-MM-DD 主题 开头
自动加载：每次会话启动时注入到 bootstrap 上下文，不影响系统提示词缓存
自动整理：会话启动时若 memory.md > 200 行，或上下文压缩 / /compact 触发，标记为待整理；当前轮 Agent 回复完成后，异步用快速模型对记忆做去重、合并、精简，写回文件
不阻塞：整理是 fire-and-forget 异步执行，当前会话用旧记忆，下次启动用整理后的版本；失败时静默降级为规则去重，不影响主流程
不新增工具：整理由 store 层后台逻辑触发，模型无感知，不破坏 ImmutablePrefix 缓存
记录原则：用户偏好、项目约定、错误模式与解法、架构决策；不记录通用编程知识、临时任务状态、已在 .CodePapr/AGENTS.md 中的规则

整理触发链路：
T1: session 启动读 memory.md，行数 > 200 → 标记 pending
T2: 上下文压缩（自动或 /compact）→ 标记 pending
T3: 每次 agent 回复完成 → pending? → 异步调 fast model 整理 → 写回 memory.md
整理目标：保留用户偏好/项目约定/错误模式/架构决策，控制在 200 行以内。

/compact — 强制压缩上下文

手动触发对话压缩，将早前消息合并为结构化检查点释放 token 空间：

强制模式：不受 maxConversationRounds 和 maxContextTokens 阈值限制
本地命令：零 token 消耗，调用现有压缩管线生成检查点
顺带触发记忆整理：压缩成功后会标记 memory.md 为待整理，下一轮 agent 回复后异步整理
使用场景：接近上下文上限或响应变慢时，压缩即可恢复流畅对话

配置入口

桌面端项目头部的"配置"入口可以：

创建/编辑 .CodePapr/AGENTS.md（不存在时生成默认模板）
创建/编辑/删除自定义子代理（.CodePapr/agents/*.md）
创建/编辑/启用/停用/删除 Skills（.CodePapr/skills/**/SKILL.md）

数据位置总览

路径	作用
`~/.codepapr/codepapr.sqlite`	应用级设置、会话和缓存统计
`~/.codepapr/lsp-tools/`	托管 LSP 工具下载缓存（首次需要时下载，下次复用）
`<workspace>/.CodePapr/project.sqlite`	项目级状态、聊天记录、缓存统计
`<workspace>/.CodePapr/memory.md`	跨会话项目记忆，Agent 自动积累 + 超 200 行自动整理
`<workspace>/.CodePapr/skills`	项目级技能文件
`<workspace>/.CodePapr/agents`	项目级子代理定义
`<workspace>/.CodePapr/commands`	项目级自定义命令
`<workspace>/.CodePapr/downloads/`	Scout 子代理下载文件的默认目录
`~/.codepapr/voices/`	角色参考音频文件
`~/.codepapr/gpt-sovits/`	GPT-SoVITS 安装与预训练模型

代码修改与 Diff 机制

Search/Replace Diff（YOLO Diff）

CodePapr 的自动修改不依赖标准 Git diff 行号。多处局部修改会优先生成 Search/Replace 块：

<<<<<<< SEARCH
文件里已经存在的旧代码
=======
替换后的新代码
>>>>>>> REPLACE

应用规则

SEARCH 必须能在目标文件中精确匹配
同一个 SEARCH 如果匹配多处，会被拒绝，避免误改
同一次批量修改会先校验所有文件和所有块，任意块失败则不写入任何文件
换行会兼容 LF / CRLF
失败信息会回到 Agent 上下文，触发重新读取原文件和自愈重试

不推荐使用场景

新建文件或整文件重写 → 使用写文件工具
只改一个很小的局部块 → 普通 patch 更直接

Skills 技能系统

什么是 Skill

Skill 是主 Agent 的可复用操作手册，适合沉淀搜索策略、排错流程、发布检查、审查清单和项目固定工作方法。它不会创建独立子代理，而是作为项目级上下文供模型按需选择。

Skill 文件格式

以目录包为标准，放在 .CodePapr/skills/**/SKILL.md，目录里可放 assets/、references/、scripts/ 等资源。

---
name: search
description: 使用公开网页、官方文档和社区资料进行可验证搜索
---

# 搜索 Skill

当任务需要公开资料、当前事实、第三方 API 用法或报错排查时：

- 官方文档优先，其次 GitHub issue / PR，再看社区答案。
- 精确报错使用双引号，例如 "Cannot find module"。
- 限定站点使用 site:，例如 site:developer.mozilla.org fetch abort。
- 同时带上库名、版本号、运行环境和关键错误码。

Skill 加载机制

运行时只把用户启用 Skill 的 name + description 注入稳定上下文
模型自行判断是否需要某个 Skill
只有选定后才调用 skill 读取完整内容
启用状态保存在 .CodePapr/project.sqlite

内置 search Skill

默认 search Skill 包含常用资料源和方法：

官方文档：Microsoft Learn、OpenAI、MDN、Node.js、npm、PyPI、Rust、Tauri、Vite、React
代码与问题：GitHub repositories、issues、pull requests
社区资料：Stack Overflow、包管理器页面、维护者博客
搜索方法：site: 限定站点、双引号精确报错、包名加版本号

Agent 与子代理

内置子代理

CodePapr 自带四个内置子代理，主 Agent 可通过 task 工具直接调度（verifier 除外，仅供 Goal 循环内部使用），无需额外配置：

Agent	用途	模型	工具
explore	只读代码分析：搜索项目文件、定位符号、分析依赖关系	fast	read, read_image, graph, lsp, diagnostics, grep
scout	网络搜索：查找文档、API 参考、最新资料	fast	web_search, web_fetch, web_download, browser, read_image
mentor	架构/算法/调试高层指导（不写代码、不调工具）	mentor*	无
verifier	Goal 验收器（内部）：客观判定目标条件是否达成，防 Worker 伪造成功假象	fast**	无

* Mentor 默认使用主模型，可在设置中启用独立导师模型（支持独立的 API Key、Base URL 和模型选择）。
** Verifier 是 Goal 自主循环的内部验收器，不暴露给主 Agent 的 task 工具；默认使用快速模型，可在高级设置中切换为主模型。

自定义子代理

在 .CodePapr/agents/<name>.md 中用 YAML frontmatter + 正文声明一个子代理，主代理可以把子任务委派给它。同名 Agent 会覆盖内置定义。

---
description: reviewer 负责审查当前改动、定位风险并给出最小修复建议
mode: subagent
model: fast
temperature: 0.2
tools:
  read: true
  grep: true
  diagnostics: true
  git: true
  write: false
  exec: false
---

你是 reviewer，一个只读代码审查子代理。

职责：
- 阅读主代理委派的目标、相关文件和当前 diff。
- 优先找真实 bug、行为回归、边界条件遗漏和缺失验证。
- 给出最小修复建议，指出应修改的文件和验证命令。

边界：
- 默认不直接改文件。
- 不重复总结无关代码风格，只报告影响正确性、可靠性或可维护性的发现。

输出格式：
1. Findings：按严重程度列出问题
2. Suggested Fix：给出最小修改方向
3. Verification：列出建议运行的验证命令

子代理配置说明

model：覆盖模型，可选 fast（快速模型）或具体模型名
temperature：温度参数，可选数字
tools：工具开关，缺省继承全部工具，声明空对象 {} 表示无工具
文件名（不含 .md）即子代理名称，与内置 Agent 同名则覆盖
改 description 让主代理知道何时调用它
改 tools 控制读写/命令权限

子任务机制（两种方式）

方式	触发	说明
编排层自动拆解	系统自动决策	Agent 模式下，任务含执行动词且够复杂时，LLM 判断是否需要拆成 2-5 个子任务并行/串行执行
Task 工具主动委派	Agent 主动调用	主 Agent 推理过程中显式调用 `task` 工具，将子任务委派给独立子 Agent（含内置和自定义）

子代理运行模型

每个子代理拥有独立 Session、ToolRegistry（按 tools 过滤）、Provider
最大嵌套深度 2 层（子代理不能再委派子代理给自己）
子代理最多执行 50 个内部工具轮次（主代理 500）
单次工具调用有 90 秒超时保护，超时返回错误给 LLM 自主决策
子代理整体有 5 分钟 wall-clock 超时，超时自动取消
Explore、Scout 使用快速模型；Mentor 使用独立导师模型或主模型
自定义 prompt 可在设置面板的 Mentor 标签页中覆盖

与 AGENTS.md 的区别

.CodePapr/AGENTS.md 是全局项目规则，所有模式、所有子代理都会继承；自定义 Agent 是专职子代理，只有主代理通过 task 工具委派子任务时才启用。前者适合写"所有任务都遵守什么"，后者适合写"某一类任务交给谁做、能用哪些工具"。

自定义命令

内置命令

命令支持 --name（推荐）和 /name（兼容旧版）两种格式。命令的 model 字段决定路由：未声明时使用主模型，声明 fast 时使用快速模型，本地命令不消耗 token。

命令	作用	模型	示例
`/help`	列出所有命令及说明	本地	`/help`
`/commands`	`/help` 的别名	本地	`/commands`
`/compact`	强制压缩当前会话上下文，生成检查点释放 token	本地	`/compact`
`/goal`	自主循环：Worker 执行 + Verifier 验收，直到验证条件通过	本地	`/goal exec:npm test`
`/review`	审查当前改动或指定范围	主模型	`/review src/App.tsx`
`/fix`	定位并修复指定问题	主模型	`/fix 登录按钮无响应`
`/test`	补测试或运行相关测试	主模型	`/test src/utils/format.ts`
`/explain`	解释文件、符号、错误或实现	主模型	`/explain handleSubmit 函数`
`/diagnose`	诊断报错、慢操作或异常行为	主模型	`/diagnose 页面加载超过 5 秒`
`/refactor`	保持行为不变的前提下整理代码	主模型	`/refactor src/components/Modal.tsx`
`/doc`	为变更或功能更新文档	主模型	`/doc 新增的退款接口`
`/new`	根据描述从零创建新文件、组件或功能	主模型	`/new 创建用户重置密码 REST API`
`/optimize`	分析并修复性能瓶颈	主模型	`/optimize src/pages/Dashboard.tsx`
`/search`	搜索代码库中的模式、用法、定义或引用	快速模型	`/search auth middleware`
`/lint`	运行 linter 并修复违规	快速模型	`/lint src/`
`/clean`	清理死代码、未用导入和遗留调试语句	快速模型	`/clean src/utils/`
`/commit`	暂存改动并生成规范的 commit message	快速模型	`/commit`
`/summary`	对文件、模块或整个项目做高层概述	快速模型	`/summary src/core/`
`/build`	构建项目并诊断/修复构建错误	快速模型	`/build`

自定义命令模板

在 .CodePapr/commands/<name>.md 中声明可复用的提示词模板：

---
description: 审查并修复 lint
agent: code-reviewer
---
请审查 $ARGUMENTS 的改动，并修复其中的 lint 问题。
参考规则见 @.CodePapr/AGENTS.md
当前状态：!`git status -s`

模板语法

语法	说明
`$ARGUMENTS`	全部参数
`$1 $2 ...`	第 N 个参数
`@path`	内联文件内容
!`cmd`	执行命令并嵌入输出（仅简单命令）

使用方式：在输入框输入 / 会弹出命令面板，列出所有可用命令并支持键盘 ↑↓ 选择。输入 /命令名参数 即可调用。-- 格式兼容旧版。

Goal 自主循环

什么是 Goal 循环

/goal 是控制命令（与 /compact 同级），启动 Worker + Evaluator 双模型自主循环。它将 AI 编程助手从"一问一答"模式变成一个长周期自主运行代理——直到机器可验证的验收条件通过才结束。

核心机制不是在 prompt 里加"请一直工作到完成为止"，而是建立了一套工程化的自对弈系统：

Worker（主模型）：拥有全套工具权限，负责规划、写代码、跑测试
Verifier（快速模型，无工具）：阅读 Worker 的执行记录，判定是否有伪造成功假象
客观条件函数：执行验证命令，用退出码和输出匹配做客观判定

三者协作：条件函数判定 + Verifier 反伪造 = 双保险。只有条件满足且 Verifier 确认 Worker 没有作弊，才判定为 SATISFIED。

基本用法

# 退出码为 0 即满足
/goal exec:npm test

# 退出码 0 且 stdout 匹配正则
/goal exec:npm test match:"\d+ passed"

# 复合条件，全部满足
/goal exec:npm run lint && exec:npm test

# 自然语言目标 + 验收条件（| 分隔）
/goal 修复 auth 测试 | exec:npm test

条件语法

语法	说明
`exec:<command>`	执行命令，退出码必须为 0
`exec:<cmd> match:"<pattern>"`	退出码 0 且 stdout 匹配正则模式
`exec:<cmd1> && exec:<cmd2>`	复合条件，所有子句都必须通过
`<目标> \| exec:<cmd>`	自然语言目标 + 验收条件，`\|` 分隔

关键约束：条件必须"机器可被客观验证"（如测试通过、退出码为 0、lint 无报错），而不是主观的（如"写一个好看的登录页"）。因为没有工具权限的 Verifier 只能通过终端日志来判定目标是否达成。

运行机制

Worker turn：主 Agent 执行一轮工作（读文件、写代码、跑命令）
客观条件评估：系统自动执行验证命令，获取退出码和输出
Verifier 反伪造检查：无工具的 Verifier 子代理阅读 Worker 的执行记录，检测是否有"声称测试通过但实际没跑"等完工偏见
判定：条件满足且 Verifier 确认 → SATISFIED，循环结束；否则生成详细反馈注入下一轮
上下文腐烂治理：每 5 轮触发自动压缩；状态持久化到 .CodePapr/goal-state.md

安全护栏

限制	默认值	说明
最大迭代轮数	20	外循环最大轮数，超过自动停止
最大运行时间	30 分钟	墙钟超时自动停止
用户中断	随时	GoalBanner 上的"停止"按钮或 CLI 的 Ctrl+C
状态持久化	每轮	写入 `.CodePapr/goal-state.md`，防上下文腐烂

配置

在设置面板的高级标签页中配置 Goal 循环参数：

最大迭代轮数：默认 20，可调 1-100
最大运行时间：默认 30 分钟，按分钟配置
Verifier 模型：默认快速模型（更快更便宜），可切换为主模型（更准确）
Verifier Token 上限：默认 1000
Verifier 温度：默认 0.1（越低越确定）

MCP 工具集成

什么是 MCP

Model Context Protocol（MCP）是一种开放协议，允许 Agent 通过外部工具服务器扩展能力。CodePapr 内置 MCP host，可同时连接多个 MCP 服务器，把外部工具透出给主 Agent 调用。

每个 MCP 工具会以 mcp__<serverId>__<toolName> 形式注册，与内置 26 个工具并列出现在 ToolRegistry 中。

三种传输模式

Transport	说明	适用场景
`stdio`	子进程 + stdin/stdout JSON-RPC	本地命令行 MCP 服务器（npx / uvx / python 等）
`sse`	Server-Sent Events	远程 HTTP MCP 服务器，单向流式
`streamable-http`	Streamable HTTP	远程 HTTP MCP 服务器，双向流式

每个 MCP 服务器的字段

字段	类型	说明
`name`	string	显示名称
`category`	`search` / `database` / `custom`	分类，`search` 启用后会替代 `web_search` 路由
`transport`	`stdio` / `sse` / `streamable-http`	传输模式
`command` / `args`	string	仅 stdio 使用：可执行命令和参数（参数支持引号分组）
`url`	string	仅 sse / streamable-http 使用：HTTP 端点 URL
`env`	多行 KEY=value	仅 stdio 使用：环境变量；不会进入模型上下文
`headers`	多行 Header-Name: value	仅 sse / streamable-http 使用：HTTP 请求头，常用于认证
`allowedTools`	逗号分隔，支持 `*` 通配	白名单，留空表示允许全部
`deniedTools`	逗号分隔，支持 `*` 通配	黑名单，优先级高于白名单
`permissionMode`	`read-only` / `read-write` / `dangerous`	权限分级，决定调用前是否需要确认
`requireConfirmation`	boolean	每次调用前都弹出确认
`timeoutSeconds`	5–600	单次工具调用超时

预置示例

桌面端默认提供三个开箱可用的 MCP 服务器（默认全部禁用，需手动启用）：

名称	分类	命令	用途
DuckDuckGo Search MCP	search	`npx -y duckduckgo-mcp-server`	免 API key 网页搜索
Postgres MCP	database	`npx -y @modelcontextprotocol/server-postgres <DSN>`	SQL 查询、表结构发现，默认禁写
SQLite MCP	database	`uvx mcp-server-sqlite --db-path ./database.sqlite`	本地 SQLite 数据库分析

stdio 服务器示例

# 名称
DuckDuckGo Search MCP

# Transport
stdio

# 命令 / 参数
command: npx
args: -y duckduckgo-mcp-server

# 环境变量（每行一个 KEY=value）
env:
HTTP_PROXY=http://127.0.0.1:7890
USER_AGENT=CodePapr/0.1.0

# 工具过滤
allowedTools: duckduckgo_web_search

sse / streamable-http 服务器示例

# 名称
Remote Knowledge Base

# Transport
streamable-http

# URL
url: https://example.com/mcp

# Headers（每行一个 Header-Name: value）
headers:
Authorization: Bearer your-token-here
X-API-Key: your-api-key

权限模式

read-only：只读工具，调用无需确认（适合搜索、查询）
read-write：可写工具，配合 requireConfirmation 使用
dangerous：危险工具（如执行 shell、删除数据），强烈建议开启 requireConfirmation

工具过滤

通过 allowedTools 和 deniedTools 控制每个服务器暴露的工具子集：

支持 * 通配符（如 describe*、list_*）
逗号分隔多个模式
黑名单优先级高于白名单
典型场景：Postgres MCP 默认 allowedTools=query,describe*,list* + deniedTools=delete*,drop*,truncate*,update*,insert*，确保只读

全局开关

设置	默认	说明
`enabled`	false	MCP 总开关，关闭后所有 MCP 服务器停用
`exposeTools`	true	是否把 MCP 工具透出给 Agent；关闭后 MCP 仅作为后台连接，不进入工具列表
`resultMaxBytes`	200,000	单次工具调用结果的最大字节数（1KB – 5MB）

常用 MCP 服务器推荐

@modelcontextprotocol/server-filesystem：受限文件系统访问
@modelcontextprotocol/server-postgres：Postgres 数据库
@modelcontextprotocol/server-github：GitHub API
@modelcontextprotocol/server-slack：Slack 集成
mcp-server-sqlite：SQLite 数据库
duckduckgo-mcp-server：免费网页搜索

缓存影响：启用的 MCP 服务器列表会进入 ImmutablePrefix 的工具定义哈希。新增/删除/修改 MCP 服务器都会破坏前缀缓存，下一轮请求需要重新建立缓存。建议在长会话开始前就完成 MCP 配置。

测试连接：MCP 设置面板提供"测试"按钮，可在不进入会话的情况下连接服务器、列出工具、应用过滤规则，确认配置无误后再启用。

系统架构

架构概览

User → Desktop Workbench → Shared Agent Runtime ↓ ┌─────────────┼──────────────┐ Provider SQLite Tool Registry Adapters (App/Project) (Workspace Tools) State ↓ ┌──────────┼──────────┐ DeepSeek OpenAI Claude

包级职责

包	角色	主要责任
`@codepapr/types`	共享协议层	统一消息、请求、响应、工具和统计类型
`@codepapr/common`	公共基础设施	日志、哈希与通用工具
`@codepapr/core`	运行时核心	Agent、Session、ToolRegistry、缓存分区、ProjectGraph、Prompt 组装
`@codepapr/api`	Provider 适配层	RequestBuilder、CacheValidator、provider 实现
`@codepapr/db`	持久化层	SQLite 封装与 repository
`@codepapr/editor`	编辑器契约	框架无关的 Monaco 类型、标记、导航与静态检查契约
`@codepapr/ui`	桌面工作台	React、Zustand、Tauri、WorkerBackedAgent

Rust 后端领域模块

Tauri 后端按职责拆分为多个模块：

browser：headless Chromium 浏览器自动化
shell：前台/后台命令、持久 Shell 会话、命令安全守卫
web：HTTP fetch、网页提取、多引擎搜索（SearXNG 优先，失败自动降级）
workspace_fs：文件列表、读取、写入、SEARCH/REPLACE diff、搜索
task_queue：重 I/O 操作串行化队列
db：应用与项目级 SQLite 持久化
lsp：LSP server 进程管理
symbol_provider：tree-sitter fallback 符号提取
mcp_host：MCP 工具服务器宿主
shared：路径归一化、workspace 路径解析、通用工具

桌面端 Agent 桥接

ChatPanel → agentStore.sendMessage() → WorkerBackedAgent.chat() ├─ Worker Thread: Agent.chat() → LLM └─ Main Thread: tool execution → Tauri invoke

桌面端不直接调用 core Agent，而是通过 WorkerBackedAgent 将 LLM 聊天循环卸载到 Web Worker 中，确保长任务不阻塞 UI。

Worker 崩溃恢复 & 流式快照

崩溃捕获：主线程会捕获 WorkerCrashError，自动清空当前 agent 实例（下次发送会创建新 Worker），并在错误消息前追加"Agent Worker 崩溃。"前缀
流式快照：流式响应过程中每约 2 秒（STREAM_SNAPSHOT_INTERVAL_MS）触发一次 onStreamSnapshot，把 in-flight 内容持久化到项目 SQLite
掉电恢复：崩溃 / 强退 / 掉电后下次启动可看到崩溃前已写入的对话片段，不会丢失大块进度

技术栈总览

层	技术
前端 UI	React 18、TypeScript、Zustand 5、Monaco Editor、Tailwind CSS 3、Vite 8
桌面框架	Tauri 2（Rust）
Rust 后端	rusqlite (SQLite)、headless_chrome (浏览器)、tree-sitter (16 种语言)、LSP stdio 桥接（15 个语言族）
Agent 卸载	Web Workers
测试	Vitest 4、Playwright（UI E2E）

DeepSeek 缓存优化

三层 Prompt 注入

系统将 prompt 分为三层注入，按稳定度从高到低排列以最大化 DeepSeek 自动前缀缓存命中：

层	注入位置	内容	稳定性
第一层	System Prompt	Base Identity + Rules + Mode + Workspace Path + Core Constraints	跨会话复用
第二层	Session Bootstrap	Skills Summary + ProjectGraph + Custom Guidance	跨轮次完全稳定
第三层	Runtime User Prompt	Mode Header + User Input + Diagnostics	每轮可变

缓存命中模式

同一会话多轮工具调用： Round 1: [system][bootstrap][user] ← 全部缓存 Round 2: [system][bootstrap][user][asst_1][tool_1] ← 前缀命中 Round 3: [system][bootstrap][user][asst_1][tool_1][asst_2][tool_2] ← 前缀命中跨会话（同项目）： Session A: [system][bootstrap][user_A] → system+bootstrap 缓存复用于 Session B 跨会话（不同项目）：各有不同 workspace path → system prompt 的 base+constraints 部分仍可复用

关键不变量

用户自定义提示词进入 session bootstrap 而非每轮 user prompt
Skills 进入 bootstrap 而非 system prefix
Workspace 路径只出现在 system prompt，不在 bootstrap 中重复
Custom guidance 只在 bootstrap 中出现一次

语言智能与 LSP

LSP 桥接架构

桌面端 LSP 采用Tauri 原生宿主 + stdio JSON-RPC 的结构，通过 src-tauri/src/lsp.rs 管理 language server 子进程、stdin 写入、stdout reader 线程和消息队列。

支持的语言族（15 种）

语言	主 LSP Server	类型	内置
TypeScript / JS / TSX / JSX	typescript-language-server	Node.js npm	是
HTML	vscode-html-language-server	Node.js npm	是
CSS / SCSS / LESS	vscode-css-language-server	Node.js npm	是
JSON / JSONC	vscode-json-language-server	Node.js npm	是
YAML	yaml-language-server	Node.js npm	是
Python	pyright	Node.js npm	是
ShellScript	bash-language-server	Node.js npm	是
C#	csharp-ls / CodePapr.CSharp.Analyzer / omnisharp	.NET binary	是
Rust	rust-analyzer	Native binary	是
Java	Eclipse JDTLS + Temurin JRE 21	Java binary	是
C / C++	clangd v22.1.6	Native binary	是
Go	gopls	Native binary	是（尽力）
Swift	sourcekit-lsp（macOS Xcode toolchain）	系统	否
SQL	sqls	Native binary	是
Markdown	marksman	Native binary	是

C# LSP 优先级链

C# 的 LSP 有多层回退机制：

系统 PATH 或 ~/.dotnet/tools 中的 csharp-ls
发布包内置的 csharp-ls 二进制（generated/lsp-tools/csharp-ls/bin/）
内置 CodePapr.CSharp.Analyzer（自定义 Roslyn sidecar，支持跨文件和跨 ProjectReference 解析）
dotnet run --project CodePapr.CSharp.Analyzer.csproj（开发态 / 源码 fallback）
系统 PATH 上的 omnisharp -lsp 或 OmniSharp -lsp（仅静态候选）
内建 tree-sitter 符号解析（最终兜底）

管理安装（Managed LSP）

桌面端会在运行时按需托管安装缺失的 LSP：

Node 系（5 个 npm 包，提供 7 种语言服务）：typescript-language-server（TypeScript / JavaScript）、vscode-langservers-extracted（HTML / CSS / JSON）、yaml-language-server、pyright、bash-language-server — 通过 npm 安装，使用内置 Node.js runtime v20.12.2
二进制系（6 个）：clangd v22.1.6、rust-analyzer、JDTLS + Temurin JRE 21、sqls、marksman、gopls — 从官方源下载
C#：通过 dotnet tool install -g csharp-ls 安装，或使用内置 Roslyn sidecar
可通过 CODEPAPR_DISABLE_MANAGED_LSP_DOWNLOAD=1 禁用自动托管下载

Tree-sitter 语法解析（16 种语言）

内建 tree-sitter 语法树解析，用于 ProjectGraph 和 fallback 符号提取：TypeScript、JavaScript、Python、Rust、Java、Go、C++、Bash、C#、CSS、HTML、JSON、PHP、Ruby、Kotlin、Swift。

LSP 加载策略

工作区启动时不会批量预热 LSP
当前文件显示后才异步加载该文件的 LSP
生成/修改/保存写盘后异步刷新相关文件的 diagnostics 和符号缓存
LSP 后端缓存全 workspace diagnostics，跨文件错误也能被检测
代码区只有有问题时才显示提示，没有问题时保持干净
上层 LSP 不可用时，回退到内建 tree-sitter fallback 符号解析

验证与发布

验证命令矩阵

命令	范围	适合场景
`npm run build`	全 workspace 构建	改完源码后确认产物可生成
`npm run test`	全 workspace 测试	日常主回归
`npm run test:e2e`	CLI E2E	改到 CLI、会话装配或 scripted provider
`npm run test:e2e:ui`	Playwright UI E2E	改到桌面端 UI 组件、Toast、权限、Code Review
`npm run test:e2e:ui:install`	安装 Playwright Chromium	首次运行 UI E2E 前准备
`npm run lint`	静态检查	提交前质量门禁
`npm run audit`	安全审计	发布前或依赖变更后
`npm run smoke:agent-tools`	真实模型工具烟测	改到工具选择、shell、浏览器交互
`npm run smoke:lsp-preview`	多语言 LSP 烟测	改到 LSP hover、definition
`npm run verify`	最完整验证	本地发布前（含 cargo check）

桌面端发布

# 开发调试
npm run debug

# 优化后的桌面运行版本（不打包）
npm run release

# 生成安装包（.dmg / .msi）并整理到 Release/
npm run publish

发布辅助脚本

macOS: ./publish-codepapr.command
Windows: publish-codepapr.cmd

发布前检查

npm run release:prep
npm run publish:dry-run

发布包内置内容：官方桌面发布包会同时内置默认 LSP 所需的 Node.js runtime v20.12.2、5 个 Node 系 npm 包（typescript-language-server、vscode-langservers-extracted、yaml-language-server、pyright、bash-language-server，提供 TypeScript / JavaScript / HTML / CSS / JSON / YAML / Python / ShellScript 共 8 种语言服务）、C# Roslyn sidecar + .NET SDK 10.0、JDTLS + Temurin JRE 21、clangd v22.1.6、rust-analyzer、sqls、marksman 和 gopls。用户首次使用默认语言时不需要再额外下载这些组件。

典型工作流

1. 先理解再执行

适合第一次接手仓库或需求还不够清晰时：

Ask：解释系统结构、定位模块
Plan：输出任务清单和验证方案
Agent：按清单实施

2. 直接修复问题

适合你已经知道目标，只是不想手动查和改：

修复 packages/@codepapr/api 里缓存统计不正确的问题。
先定位统计汇总逻辑，再做最小修改，最后跑相关测试。

3. 启动前端并在应用内预览

适合 UI 调整、页面行为验证和预览联动：

让 Agent 启动 preview session 或后台命令
在应用内预览中查看页面
如果还要点页面、填表单或截图，继续用浏览器工具

4. 保留终端上下文做连续操作

适合脚本、REPL、交互式 CLI 或多步 shell 流程：

打开 shell session
连续发送命令
按输出继续推进
完成后关闭 session

5. 复盘历史会话与成本

查看 session 列表
查看指定 session 的 stats（缓存命中/未命中/token 使用）
对照当前模型设置判断成本是否合理

成本与模型选择

DeepSeek 模型参考

模型	上下文	最大输出	缓存命中输入	缓存未命中输入	输出	并发
`deepseek-v4-flash`	1M	384K	0.02 元/M tokens	1 元/M tokens	2 元/M tokens	2500
`deepseek-v4-pro`	1M	384K	0.025 元/M tokens	3 元/M tokens	6 元/M tokens	500

注意：价格会变更，最终请始终以 DeepSeek 官方价格页为准。

在 CodePapr 里怎么选

主模型默认是 deepseek-v4-pro——用于 Ask、Plan、Agent、App 主执行流程；App 模式始终使用主模型以确保生成质量
快速模型默认是 deepseek-v4-flash——用于上下文压缩、子任务规划、只读轻型子代理
思考强度（thinkingEffort）默认为 max（最强推理），可在 LLM 设置 tab 中切换为 high

成本优化建议

Ask 和轻分析任务优先用更便宜模型
大改动前先走 Plan，减少无效执行轮次
让任务描述更具体，减少模型反复搜索和修复的轮数
保持系统提示与工具边界稳定，最大化前缀缓存命中

常见问题

1. 启动后提示没有 API key

先检查桌面端设置是否已保存，以及是否设置了对应环境变量（DEEPSEEK_API_KEY / OPENAI_API_KEY / ANTHROPIC_API_KEY）。

2. 安装或 CLI 命令跑不起来 / 找不到

确认是否执行过 npm install 和 npm run build，以及当前仓库是否位于 OneDrive 路径下导致 .bin shim 异常。

3. Agent 遇到 vite、tsc、eslint、模块缺失错误

优先当成依赖未安装或本地包未构建，而不是先怀疑云同步或磁盘问题。

4. 浏览器工具不可用

通常是因为本机没有可检测到的 Chrome 或 Chromium 兼容浏览器。

5. 改完代码后测试还是旧结果

这个仓库里不少包会通过各自的 dist 入口参与测试或引用。改了源文件后，如果结果看起来没变，先重新 build 受影响包，再跑验证。

6. 修改源码后构建原则

重要：改源码 → 先 build → 再跑受影响测试 → 再跑更大范围验证。当结果看起来像"没生效"时，先怀疑 build 没补，而不是先怀疑运行时异常。

7. 如何使用本地模型

在设置中可以接入本地模型 provider（OpenAI 兼容端点），用于离线或私有部署场景。在支持的模型下，可直接向聊天框粘贴或拖入图片作为输入。

8. 为什么读取某些绝对路径会弹窗

这是桌面端的外部路径权限机制。当 Agent 尝试读取或列出项目外的绝对路径时，会请求你显式授权，保证不会未经允许访问系统文件。

9. UI E2E 跑不起来

先确认是否已安装 Playwright 浏览器依赖：

npm run test:e2e:ui:install

UI E2E 使用 Chromium 在无 Tauri webview 的 mock 环境下运行，不需要真实模型配置。

使用建议

新手：先用 Ask 理解系统 → 再用 Plan 看清楚改动范围 → 最后用 Agent 做真正执行。需要数据可视化时切到 App 模式，一句话生成交互式图表。

老手：直接在 Agent 模式里给明确目标 → 明确影响文件和验证要求 → 用桌面端完成对话、Git、预览和浏览器联动。

CodePapr 简介

什么是 CodePapr

核心设计理念

CodePapr 与主流 AI 编程工具对比

谁适合使用 CodePapr

需要具备的基础能力

支持的 LLM Provider

安装与环境配置

环境要求

标准安装

安装验收

支持平台

外部依赖

三种启动方式

API 设置与模型配置

配置存放位置

Provider 模式

DeepSeek 接口参考地址

环境变量回退顺序

应用级设置项

LLM 设置

路由设置

快速模型路由

第一次使用

三步启动

最短路径

首次使用流程

使用入口

工作模式：Ask / Plan / Agent / App

Ask 分析模式

Plan 规划模式

Agent 执行模式

App 应用生成模式

App 模式典型场景

如何给出有效任务

推荐写法

不够好的写法

桌面工作台

界面结构

桌面端完整能力

代码审查面板

对话轮次导航

全局搜索

Toast 通知

外部路径权限

什么时候优先用桌面端

Git 集成

对话重置（Shadow Git 快照）

工具能力详解

graph — 项目理解核心

文件操作

LSP 语言智能

命令执行

Git 操作

浏览器与预览

应用渲染

网络工具

其他工具

外部路径权限

文件大小限制

角色扮演

角色数据模型

角色扮演格式约定

创建角色

导入角色卡（CCv3 / SillyTavern 兼容）

导出角色卡

启用/切换角色

语音合成（TTS）

安装 GPT-SoVITS

为角色配置语音

当前播放模式

语音微调

播放控制

配置文件与规则

.CodePapr/AGENTS.md — 全局项目规则

.CodePapr/memory.md — 跨会话项目记忆（自动整理）

/compact — 强制压缩上下文

配置入口

数据位置总览