自进化智能体引擎 · HKUDS

OpenSpace

Make Your Agents: Smarter · Low-Cost · Self-Evolving

4.2×
收益提升
-46%
Token 消耗
$11K
6小时赚取
165
自进化技能
3.9K
GitHub Stars
☆ 查看源码 🌐 云端社区
痛点与解法

当前 AI 智能体的核心缺陷

Claude Code、Codex、Cursor 等智能体功能强大,却从不从真实经验中学习、适应和进化,更不会相互分享。

❌ 当前智能体的问题
  • 每次任务都从零推理,大量重复消耗 Token
  • 🔁相同的失败模式反复出现,没有学习机制
  • 🔒知识锁定在单个智能体中,无法跨智能体共享
  • 📉技能随工具/API 变化悄然退化,无人察觉
✅ OpenSpace 解决方案
  • ♻️成功方案变成可复用技能,再遇直接调用
  • 🧬每次失败触发自动进化修复,错误变学习
  • 🌐一个智能体的进化,立刻惠及所有连接智能体
  • 📊多层质量监控,自动检测并进化退化技能
三大核心能力

插入任意智能体,立刻获得三大超能力

🧬
自我进化
  • AUTO-FIX:技能破损即时自愈
  • AUTO-IMPROVE:成功模式变更优版本
  • AUTO-LEARN:从真实使用中捕获赢法
  • 质量监控:追踪成功率/错误率/执行状态
🌐
集体智能
  • 共享进化:一个智能体的提升即时广播
  • 网络效应:智能体越多,进化越快
  • 一键共享:上传/下载进化技能
  • 访问控制:公开/私有/团队自由选择
💰
Token 效率
  • 停止重复工作:复用成功方案
  • 任务越做越便宜:技能持续优化
  • 最小化更新:只修改破损部分
  • 实测:46% Token 削减,4.2× 收益
进化引擎

三种进化模式,三道防线

技能不是静态文件,它们是能自动选择、应用、监控、分析并进化自身的活体实体。

🔧 FIX
⚙️
原地修复
修复破损或过时的技能指令。保持技能目录不变,只升级到新版本。 适用于工具 API 变更、依赖更新、执行失败等场景。 28/29 次触发都源自真实崩溃。
🚀 DERIVED
🌿
衍生增强
从父技能创建增强或专业化版本,生成全新技能目录,与父技能共存。 document-gen-fallback 技能家族通过此模式进化了 13 个版本。
✨ CAPTURED
💡
捕获提炼
从成功执行中提炼可复用的全新模式。不需要父技能, 直接从真实任务执行历史中发现价值,转化为可分享的技能资产。
三类独立触发器 · 多重防线
📈
执行后分析
每次任务完成后,分析完整记录,为相关技能建议 FIX/DERIVED/CAPTURED
⚠️
工具退化检测
工具成功率下降时,自动找出所有依赖该工具的技能,批量进化
📊
周期性健康扫描
定期扫描技能健康指标(应用率、完成率、回退率),进化欠佳者
GDPVal 基准测试

220 个真实专业任务,横跨 44 种职业

与相同骨干 LLM(Qwen 3.5-Plus)的 ClawWork 基线智能体对比, 确保性能差异纯粹来自技能进化,而非模型能力。

4.2×
更高收益(vs 基线)
72.8%
价值捕获率($11,484/$15,764)
70.8%
平均质量分(+30pp)
-45.9%
Phase 2 Token 用量
任务类别 数量 收益 Δ Token Δ 核心原因
📝 文档与书信 7 +3.3pp -56% document-gen-fallback 进化 13 个版本
📋 合规与表单 11 +18.5pp -51% PDF 技能链进化后全部表单任务复用
🎬 媒体制作 3 +5.8pp -46% 进化技能记录了可用的 ffmpeg 参数
🛠️ 工程项目 4 +8.7pp -43% 协调技能跨多类技术项目通用
📊 电子表格 15 +7.3pp -37% 公式/合并单元格模式跨领域复用
📈 战略分析 10 +1.0pp -32% 原本质量已高(88%),主要节省 Token
快速开始

两条路径,按需接入

🤖
Path A:为你的智能体赋能
将 OpenSpace 作为 MCP 服务插入现有智能体
# 1. 安装 git clone https://github.com/HKUDS/OpenSpace.git cd OpenSpace && pip install -e . # 2. 配置 MCP(在智能体配置文件中) { "mcpServers": { "openspace": { "command": "openspace-mcp", "env": { "OPENSPACE_HOST_SKILL_DIRS": "/your/agent/skills", "OPENSPACE_WORKSPACE": "/path/to/OpenSpace" } } } } # 3. 复制两个核心 Skill cp -r openspace/host_skills/delegate-task/ /your/agent/skills/ cp -r openspace/host_skills/skill-discovery/ /your/agent/skills/
👤
Path B:直接作为 AI 同事使用
OpenSpace 本身即为一个完整的自进化智能体
# 交互模式 openspace # 执行具体任务 openspace --model "anthropic/claude-sonnet-4-5" \ --query "Create a monitoring dashboard" # 云端技能管理 openspace-download-skill <skill_id> openspace-upload-skill /path/to/skill/dir # 本地可视化仪表盘(需 Node.js ≥ 20) openspace-dashboard --port 7788 # Terminal 1 cd frontend && npm install && npm run dev # Terminal 2
实战案例

My Daily Monitor:零人工代码,完整构建 20+ 面板系统

OpenSpace 从零进化 60+ 技能,自主完成了一套有 20 多个实时面板的个人行为监控系统。

🌱
Seed · 种子阶段
分析开源 WorldMonitor 项目,提炼参考模式
6 技能
🏗️
Scaffold · 脚手架阶段
生成项目结构、Vite 配置、TypeScript 设置
+8 技能
🎨
Build · 构建阶段
创建 20+ 面板、数据服务、API 路由、网格布局
+25 技能
🔧
Fix · 修复阶段
自动修复 TypeScript 错误、API 不匹配、CSS 冲突
+12 FIX
🧬
Evolve · 进化阶段
提炼增强模式,合并互补技能,生成衍生版本
+15 DERIVED
📦
Capture · 捕获阶段
从成功执行中提取可复用的通用模式
+8 CAPTURED
165 个进化技能的分类(GDPVal 50 任务)
📄 文件格式 I/O
44
PDF/DOCX/Excel 解析,32 个来自真实失败的修复
⚡ 执行恢复
29
沙箱失败→Shell→文件写入→heredoc 多层回退
📝 文档生成
26
document-gen-fallback 进化为 13 个衍生版本
✅ 质量保证
23
写后验证:检查行数、验证 PDF 页数、公式核查
🔀 任务编排
17
多文件追踪、ZIP 打包、零迭代失败检测
🔊 领域工作流
13
音频生产(4 代进化)、视频管道、SOAP 笔记