Make Your Agents: Smarter · Low-Cost · Self-Evolving
Claude Code、Codex、Cursor 等智能体功能强大,却从不从真实经验中学习、适应和进化,更不会相互分享。
技能不是静态文件,它们是能自动选择、应用、监控、分析并进化自身的活体实体。
document-gen-fallback 技能家族通过此模式进化了 13 个版本。
与相同骨干 LLM(Qwen 3.5-Plus)的 ClawWork 基线智能体对比, 确保性能差异纯粹来自技能进化,而非模型能力。
| 任务类别 | 数量 | 收益 Δ | Token Δ | 核心原因 |
|---|---|---|---|---|
| 📝 文档与书信 | 7 | +3.3pp | -56% | document-gen-fallback 进化 13 个版本 |
| 📋 合规与表单 | 11 | +18.5pp | -51% | PDF 技能链进化后全部表单任务复用 |
| 🎬 媒体制作 | 3 | +5.8pp | -46% | 进化技能记录了可用的 ffmpeg 参数 |
| 🛠️ 工程项目 | 4 | +8.7pp | -43% | 协调技能跨多类技术项目通用 |
| 📊 电子表格 | 15 | +7.3pp | -37% | 公式/合并单元格模式跨领域复用 |
| 📈 战略分析 | 10 | +1.0pp | -32% | 原本质量已高(88%),主要节省 Token |
OpenSpace 从零进化 60+ 技能,自主完成了一套有 20 多个实时面板的个人行为监控系统。