Product Update — Mar 16, 2026

Gemini 3.1 Flash-Lite：2.5 倍速、$0.25/百萬 token，把 AI 成本打到地板

Google 發布 Gemini 3.1 Flash-Lite，主打極致效率：比前代快 2.5 倍、輸出速度提升 45%，每百萬 input tokens 只要 $0.25。大量 API 調用的成本殺手。

當 AI API 便宜到幾乎免費，什麼應用都值得試——Google 用 Gemini 3.1 Flash-Lite 把 AI 的使用門檻打到前所未有的低點。

速度與成本

數字很驚人：回應速度比前代快 2.5 倍、每秒輸出 token 數提升 45%、每百萬 input tokens 只要 $0.25 美元。拿來對比：GPT-4o mini 的 input 價格是 $0.15/百萬 tokens，但 Flash-Lite 的模型能力更接近完整版 Gemini，而非縮水版。

Output tokens 的價格也壓到 $1.00/百萬 tokens。這意味著一個每天處理 10 萬筆查詢的應用，API 成本可能一個月不到 100 美元。在半年前，同等能力的模型 API 費用至少是現在的 5-8 倍。

Gemini 模型家族：Flash-Lite 定位為極致效率的輕量推理模型（圖片來源：Google DeepMind）

適用場景

Flash-Lite 的定位很清楚：大量、快速、低成本。最適合的場景包括：即時客服回覆（毫秒級延遲）、大批量文件分類和標註、IoT 設備的邊緣推理、聊天機器人的第一層過濾、以及任何需要大量 API 調用但預算有限的應用。

它不適合需要深度推理的複雜任務——那是 Gemini Pro 和 Ultra 的戰場。但對於 80% 的日常 AI 應用來說，Flash-Lite 的能力綽綽有餘，而且速度和成本優勢壓倒性。這也是為什麼 Google 選擇在這個價位段猛攻。

市場影響

Flash-Lite 的定價等於向 OpenAI 和 Anthropic 宣戰：AI API 的價格戰正式進入白熱化。OpenAI 的 GPT-4o mini 剛推出時已經很便宜了，但 Flash-Lite 在維持更高能力的同時把價格壓到同一水平。Anthropic 的 Claude Haiku 也會面臨壓力。

更深層的影響是：當 AI API 便宜到幾乎可以忽略不計，「是否導入 AI」就不再是成本問題，而是純粹的意願問題。中小企業、獨立開發者、甚至個人專案，都能用得起頂級 AI 能力。AI 的民主化不再是口號，而是正在發生的事實。

TAKEAWAY

AI API 的價格正在以每季腰斬的速度下降。現在不是「用不用得起」的問題，而是「你還在等什麼」。Flash-Lite 讓每一個有想法的人都能用 AI 把想法變成產品。

📎

資料來源：https://llm-stats.com/ai-news

Gemini 3.1 Flash-Lite：2.5 倍速、$0.25/百萬 token，把 AI 成本打到地板

速度與成本

適用場景

市場影響

更多 AI 新聞