
連 Meta 也承認,光靠開源和大算力不夠用了。旗艦模型 Avocado 的延期,暴露了開源陣營面臨的真實挑戰。
發生了什麼?
Meta 內部代號 Avocado 的下一代旗艦模型原定 2026 年 3 月發布,是 Llama 4 系列之後最受期待的開源大模型。但在 3 月初的內部測試中,團隊發現 Avocado 的表現遠不如預期,緊急決定延期至 5 月。
消息來源指出,延期不是因為技術故障或安全問題,而是品質不達標。Meta 的 AI 團隊設定了一個內部基準:新模型必須在核心能力上至少與 Google Gemini 3.0 Pro、OpenAI GPT-5 和 Anthropic Claude Opus 4.6 持平。Avocado 在多項測試中未能達到這個門檻。
輸在哪裡?
具體來說,三個核心能力全面落後。推理能力:在數學推理和邏輯推理基準測試上落後 Gemini 3.0 Pro。編碼能力:在 SWE-bench 和 HumanEval 等程式碼生成測試上輸給 GPT-5 和 Claude Opus 4.6。寫作品質:在人類偏好評測中排名墊底。
這三個領域恰好是目前 AI 模型最核心的應用場景。推理決定了模型能不能解決複雜問題,編碼決定了開發者體驗,寫作品質決定了一般用戶的日常使用感受。三項全輸,意味著如果硬推出去,市場反應會很難看。
對開源社群的影響
Meta 的 Llama 系列是開源 AI 的絕對領頭羊。Llama 2 和 3 帶動了整個開源生態的繁榮,從微調到部署到應用,無數企業和開發者建立在 Llama 之上。旗艦模型延期意味著開源與閉源的差距可能再次拉大。
更深層的問題是:開源模型的訓練資料和計算資源雖然可以追上閉源,但在 RLHF(人類回饋強化學習)和後訓練優化上,閉源公司有更多的專有數據和用戶互動資料。這可能是 Meta 需要更多時間的真正原因——不是訓練不夠,而是後訓練的精細調校還沒到位。
延期反而是好事
AI 競賽進入深水區,不是誰先發布誰就贏,而是誰的品質真正過關。Meta 選擇延期而非硬推,其實是負責任的做法。過去幾年我們看過太多模型匆忙上線、然後因為品質問題被使用者抱怨的案例。
對於依賴 Llama 生態的開發者來說,短期內需要關注替代方案。但長期來看,Meta 願意承認差距並投入時間改進,比虛報成績然後讓社群失望要好得多。開源社群的信任,不是靠速度建立的,是靠品質。
AI 競賽進入深水區。不是誰先發布誰就贏,而是誰的品質真正過關。Meta 選擇延期而非硬推,反而是對開源社群最負責任的態度。
更多 AI 新聞
追蹤 IG 第一時間收到 AI 新聞推播。