OpenSkill:无目标监督的开放世界 Agent 自进化框架
2026-06-17 04:00:00
OpenSkill(arXiv:2606.06741)研究 开放世界自进化:Agent 仅获任务提示,须从开放资源 自建技能 + 自建验证信号,训练阶段零目标监督。
核心流程
- 从文档、GitHub 仓库、网页获取 Grounded Knowledge
- 合成可迁移 Skills
- 基于自构建 Virtual Tasks 精炼技能(非目标答案)
实验结果
- 三个基准 + 两个目标 Agent 上 自动化通过率最优
- Skills 跨模型迁移,无需模型特定适配
- 自构建 Verifier 与 ground-truth 高度对齐(训练时未见)
工程意义
现有 Self-evolving Agent 多假设已有 成功轨迹、Verifier 或 Curated Skills;OpenSkill 面向 真实部署后冷启动 场景——只有 prompt、没有标注数据。
状态
GitHub OpenLAIR/OpenSkill 已公开论文与路线图,完整代码分批释出。
适用场景
- 企业内部 新系统/onboarding Agent
- 长尾工具 零样本接入
- 研究 无监督 Agent 对齐 边界