EvoSkill:讓 AI Agent 自己學會新技能
AI Research — Mar 14, 2026

EvoSkill:讓 AI Agent 自己學會新技能

來自 Sentient AGI 的最新研究,AI Agent 不再只靠人類寫好的 Prompt,而是能從失敗中自動發現、學習、進化出新技能。

如果 AI Agent 能從每次失敗中自動學到新技能,而且這些技能還能跨任務使用——這就是 EvoSkill 在做的事。

這是什麼?

EvoSkill 是一個多代理系統的自動技能發現框架,由 Sentient AGI 團隊在 2026 年 3 月發表。它的核心概念很簡單:與其讓人類手動優化 Prompt 或程式碼,不如讓 AI 自己從失敗中學習。

傳統做法是人類分析 AI 哪裡做錯了,然後手動調整。EvoSkill 把這個過程自動化——它分析失敗案例、提出新技能、測試效果、保留有用的技能,淘汰沒用的。整個過程完全自動。

怎麼運作?

每一輪迭代分四步:選擇一個現有的 Agent 版本(parent)、分析它在哪些任務上失敗、提出一個新技能或修改現有技能、測試新版本的表現。如果新版本比最弱的成員強,就加入「前線」陣容。

關鍵在於它操作的層級是「技能」而不是「Prompt」。每個技能是一個結構化的資料夾,包含描述、觸發條件、執行邏輯。這讓技能可以被理解、重用、甚至跨任務遷移。

EvoSkill 迭代進化流程:Executor 執行任務 → Proposer 分析失敗 → Skill-Builder 產生新技能 → 回饋到前線陣容
EvoSkill 迭代進化流程:Executor 執行任務 → Proposer 分析失敗 → Skill-Builder 產生新技能 → 回饋到前線陣容

效果如何?

在兩個基準測試上表現亮眼:OfficeQA 提升 7.3%、SealQA 提升 12.1%,而且只用了小量訓練子集。更驚人的是零樣本遷移能力——從 SealQA 學到的技能直接用在 BrowseComp 上,還能提升 5.3%。

這代表 EvoSkill 學到的不是針對特定任務的 hack,而是真正通用的能力。這對未來 AI Agent 的發展有重大意義。

OfficeQA 基準測試結果:skill-merge 配置達到 67.9% 準確率,比 baseline 提升 7.3%
OfficeQA 基準測試結果:skill-merge 配置達到 67.9% 準確率,比 baseline 提升 7.3%

對你有什麼影響?

如果你正在用 AI Agent 做自動化工作,EvoSkill 的概念意味著未來的 Agent 會越用越聰明。不是因為模型更新了,而是因為 Agent 自己在工作中學到了新技能。

這也暗示了一個趨勢:AI 工具的價值不只在模型本身,更在於它累積的技能庫。誰的 Agent 跑得越久、處理過越多任務,技能庫就越強大。

TAKEAWAY

EvoSkill 讓 AI Agent 從「被動執行指令」進化成「主動學習技能」。這不只是技術突破,更是 AI Agent 生態的範式轉移。

更多 AI 新聞

追蹤 IG 第一時間收到 AI 新聞推播。