
當 AI API 便宜到幾乎免費,什麼應用都值得試——Google 用 Gemini 3.1 Flash-Lite 把 AI 的使用門檻打到前所未有的低點。
速度與成本
數字很驚人:回應速度比前代快 2.5 倍、每秒輸出 token 數提升 45%、每百萬 input tokens 只要 $0.25 美元。拿來對比:GPT-4o mini 的 input 價格是 $0.15/百萬 tokens,但 Flash-Lite 的模型能力更接近完整版 Gemini,而非縮水版。
Output tokens 的價格也壓到 $1.00/百萬 tokens。這意味著一個每天處理 10 萬筆查詢的應用,API 成本可能一個月不到 100 美元。在半年前,同等能力的模型 API 費用至少是現在的 5-8 倍。

適用場景
Flash-Lite 的定位很清楚:大量、快速、低成本。最適合的場景包括:即時客服回覆(毫秒級延遲)、大批量文件分類和標註、IoT 設備的邊緣推理、聊天機器人的第一層過濾、以及任何需要大量 API 調用但預算有限的應用。
它不適合需要深度推理的複雜任務——那是 Gemini Pro 和 Ultra 的戰場。但對於 80% 的日常 AI 應用來說,Flash-Lite 的能力綽綽有餘,而且速度和成本優勢壓倒性。這也是為什麼 Google 選擇在這個價位段猛攻。
市場影響
Flash-Lite 的定價等於向 OpenAI 和 Anthropic 宣戰:AI API 的價格戰正式進入白熱化。OpenAI 的 GPT-4o mini 剛推出時已經很便宜了,但 Flash-Lite 在維持更高能力的同時把價格壓到同一水平。Anthropic 的 Claude Haiku 也會面臨壓力。
更深層的影響是:當 AI API 便宜到幾乎可以忽略不計,「是否導入 AI」就不再是成本問題,而是純粹的意願問題。中小企業、獨立開發者、甚至個人專案,都能用得起頂級 AI 能力。AI 的民主化不再是口號,而是正在發生的事實。
AI API 的價格正在以每季腰斬的速度下降。現在不是「用不用得起」的問題,而是「你還在等什麼」。Flash-Lite 讓每一個有想法的人都能用 AI 把想法變成產品。
更多 AI 新聞
追蹤 IG 第一時間收到 AI 新聞推播。