2025 年：效率革命之年

當我們邁入 2026 年，回顧 OpenRouter 的 2025 年 Token 使用數據，揭示了一段爆炸性增長的故事，以及 AI 力量平衡的根本轉變。最初由少數「前沿」巨頭主導的市場，已經演變成一個以成本效益和專業性能為定義的超競爭生態系統。

1. 8 倍的爆炸性增長：AI 擴展到大眾#

從 2025 年的圖表中，最引人注目的結論是其龐大的數量。在 2025 年 1 月，每週 Token 使用量遠低於 1T（兆）。到 11 月下旬，它達到接近 8T 的峰值，然後在年底穩定在 6T 左右。

這不僅僅是漸進式的增長；這是 AI 完全融入全球開發者工作流程的體現。我們不再只是「測試」 LLM；我們正在它們之上運行整個基礎設施。

圖表的顏色講述了一個清晰的故事：效率贏得了 2025 年。

Google 的 Gemini 時代： 代表 Gemini 2.5 Flash 和 Gemini 2.0 Flash 的巨大粉紅色和紅色區塊主導了年中到年末。Google 以低延遲提供大量上下文窗口的策略成功地佔據了大量流量。
GPT-4.1 Mini： OpenAI 的「Mini」策略仍然是主流（橙色區塊），證明對於許多開發者來說，可靠的中階模型比用於日常任務的笨重、昂貴的旗艦模型更受歡迎。

2025 年是「價值模型」成為「性能領導者」的一年。

DeepSeek 的激增： DeepSeek V3（0324 和 3.1） 在下半年的出現與對舊版模型的顯著擠壓相關。DeepSeek 不僅在價格上競爭；它在智能方面也具有競爭力，尤其是在編碼和邏輯方面。
Qwen3 的後期加入： 仔細觀察 12 月的最後一週。Qwen3 30B A3B（黃色）顯著出現。雖然是 2025 年排行榜的後來者，但其迅速採用表明阿里巴巴的最新產品將在 2026 年成為一個巨頭。

2025 年的格局也見證了「專家」的崛起：

Grok Code Fast 1： 第四季度中的藍色尖峰突顯了 xAI 成功進軍開發者市場。當程式碼生成的速度成為優先事項時，Grok 獲得了大規模採用。
Claude Sonnet 4： Anthropic 維持了忠誠、高價值的用戶群。即使「Flash」模型佔據了大量流量，Claude Sonnet 4 仍然是細緻推理和創意輸出的黃金標準，在排行榜上佔據了穩定的位置。

也許圖表中最有趣的部分是底部的廣大 「其他」 類別。這代表了 AI 革命的長尾效應——微調的 Llama 變體、利基垂直模型和實驗性架構。它表明我們正在擺脫「一種模型適用於所有」的世界，進入 多模型策略，開發者可以為特定任務選擇特定的工具。

2025 年是「智能稅」下降的一年。隨著 DeepSeek V3.1 和 Gemini 2.5 Flash 等模型使高階推理變得負擔得起，AI 原生新創公司的進入門檻消失了。

在 2024 年，我們問：「它可以做到這個嗎？」 在 2025 年，我們問：「它可以多麼便宜和快速地做到這個？」

當我們進入 2026 年時，重點再次轉移——這次轉向 自主性。有了如此快速和便宜的模型，自主 AI 代理的時代不再是預測；這是我們目前的現實。