當我們邁入 2026 年,回顧 OpenRouter 的 2025 年 Token 使用數據,揭示了一段爆炸性增長的故事,以及 AI 力量平衡的根本轉變。最初由少數「前沿」巨頭主導的市場,已經演變成一個以成本效益和專業性能為定義的超競爭生態系統。
1. 8 倍的爆炸性增長:AI 擴展到大眾#
從 2025 年的圖表中,最引人注目的結論是其龐大的數量。在 2025 年 1 月,每週 Token 使用量遠低於 1T(兆)。到 11 月下旬,它達到接近 8T 的峰值,然後在年底穩定在 6T 左右。
這不僅僅是漸進式的增長;這是 AI 完全融入全球開發者工作流程的體現。我們不再只是「測試」 LLM;我們正在它們之上運行整個基礎設施。
2. 「Flash」和「Mini」的主導地位#
圖表的顏色講述了一個清晰的故事:效率贏得了 2025 年。
- Google 的 Gemini 時代: 代表 Gemini 2.5 Flash 和 Gemini 2.0 Flash 的巨大粉紅色和紅色區塊主導了年中到年末。Google 以低延遲提供大量上下文窗口的策略成功地佔據了大量流量。
- GPT-4.1 Mini: OpenAI 的「Mini」策略仍然是主流(橙色區塊),證明對於許多開發者來說,可靠的中階模型比用於日常任務的笨重、昂貴的旗艦模型更受歡迎。
3. 顛覆者的崛起:DeepSeek 和 Qwen#
2025 年是「價值模型」成為「性能領導者」的一年。
- DeepSeek 的激增: DeepSeek V3(0324 和 3.1) 在下半年的出現與對舊版模型的顯著擠壓相關。DeepSeek 不僅在價格上競爭;它在智能方面也具有競爭力,尤其是在編碼和邏輯方面。
- Qwen3 的後期加入: 仔細觀察 12 月的最後一週。Qwen3 30B A3B(黃色)顯著出現。雖然是 2025 年排行榜的後來者,但其迅速採用表明阿里巴巴的最新產品將在 2026 年成為一個巨頭。
4. 專業優勢:編碼和推理#
2025 年的格局也見證了「專家」的崛起:
- Grok Code Fast 1: 第四季度中的藍色尖峰突顯了 xAI 成功進軍開發者市場。當程式碼生成的速度成為優先事項時,Grok 獲得了大規模採用。
- Claude Sonnet 4: Anthropic 維持了忠誠、高價值的用戶群。即使「Flash」模型佔據了大量流量,Claude Sonnet 4 仍然是細緻推理和創意輸出的黃金標準,在排行榜上佔據了穩定的位置。
5. 「其他」的分散#
也許圖表中最有趣的部分是底部的廣大 「其他」 類別。這代表了 AI 革命的長尾效應——微調的 Llama 變體、利基垂直模型和實驗性架構。它表明我們正在擺脫「一種模型適用於所有」的世界,進入 多模型策略,開發者可以為特定任務選擇特定的工具。
最終想法#
2025 年是「智能稅」下降的一年。隨著 DeepSeek V3.1 和 Gemini 2.5 Flash 等模型使高階推理變得負擔得起,AI 原生新創公司的進入門檻消失了。
在 2024 年,我們問:「它可以做到這個嗎?」 在 2025 年,我們問:「它可以多麼便宜和快速地做到這個?」
當我們進入 2026 年時,重點再次轉移——這次轉向 自主性。有了如此快速和便宜的模型,自主 AI 代理的時代不再是預測;這是我們目前的現實。



