Gemini 3.1 Flash-Lite:2.5 倍速、$0.25/百萬 token,把 AI 成本打到地板
Product Update — Mar 16, 2026

Gemini 3.1 Flash-Lite:2.5 倍速、$0.25/百萬 token,把 AI 成本打到地板

Google 發布 Gemini 3.1 Flash-Lite,主打極致效率:比前代快 2.5 倍、輸出速度提升 45%,每百萬 input tokens 只要 $0.25。大量 API 調用的成本殺手。

當 AI API 便宜到幾乎免費,什麼應用都值得試——Google 用 Gemini 3.1 Flash-Lite 把 AI 的使用門檻打到前所未有的低點。

速度與成本

數字很驚人:回應速度比前代快 2.5 倍、每秒輸出 token 數提升 45%、每百萬 input tokens 只要 $0.25 美元。拿來對比:GPT-4o mini 的 input 價格是 $0.15/百萬 tokens,但 Flash-Lite 的模型能力更接近完整版 Gemini,而非縮水版。

Output tokens 的價格也壓到 $1.00/百萬 tokens。這意味著一個每天處理 10 萬筆查詢的應用,API 成本可能一個月不到 100 美元。在半年前,同等能力的模型 API 費用至少是現在的 5-8 倍。

Gemini 模型家族:Flash-Lite 定位為極致效率的輕量推理模型(圖片來源:Google DeepMind)
Gemini 模型家族:Flash-Lite 定位為極致效率的輕量推理模型(圖片來源:Google DeepMind)

適用場景

Flash-Lite 的定位很清楚:大量、快速、低成本。最適合的場景包括:即時客服回覆(毫秒級延遲)、大批量文件分類和標註、IoT 設備的邊緣推理、聊天機器人的第一層過濾、以及任何需要大量 API 調用但預算有限的應用。

它不適合需要深度推理的複雜任務——那是 Gemini Pro 和 Ultra 的戰場。但對於 80% 的日常 AI 應用來說,Flash-Lite 的能力綽綽有餘,而且速度和成本優勢壓倒性。這也是為什麼 Google 選擇在這個價位段猛攻。

市場影響

Flash-Lite 的定價等於向 OpenAI 和 Anthropic 宣戰:AI API 的價格戰正式進入白熱化。OpenAI 的 GPT-4o mini 剛推出時已經很便宜了,但 Flash-Lite 在維持更高能力的同時把價格壓到同一水平。Anthropic 的 Claude Haiku 也會面臨壓力。

更深層的影響是:當 AI API 便宜到幾乎可以忽略不計,「是否導入 AI」就不再是成本問題,而是純粹的意願問題。中小企業、獨立開發者、甚至個人專案,都能用得起頂級 AI 能力。AI 的民主化不再是口號,而是正在發生的事實。

TAKEAWAY

AI API 的價格正在以每季腰斬的速度下降。現在不是「用不用得起」的問題,而是「你還在等什麼」。Flash-Lite 讓每一個有想法的人都能用 AI 把想法變成產品。

更多 AI 新聞

追蹤 IG 第一時間收到 AI 新聞推播。