2025 年:效率革命之年 – LLM 年度回顧

2025 年:效率革命之年 – LLM 年度回顧

2 min read

當我們邁入 2026 年,回顧 OpenRouter 的 2025 年 Token 使用數據,揭示了一段爆炸性增長的故事,以及 AI 力量平衡的根本轉變。最初由少數「前沿」巨頭主導的市場,已經演變成一個以成本效益和專業性能為定義的超競爭生態系統。

1. 8 倍的爆炸性增長:AI 擴展到大眾#

從 2025 年的圖表中,最引人注目的結論是其龐大的數量。在 2025 年 1 月,每週 Token 使用量遠低於 1T(兆)。到 11 月下旬,它達到接近 8T 的峰值,然後在年底穩定在 6T 左右。

這不僅僅是漸進式的增長;這是 AI 完全融入全球開發者工作流程的體現。我們不再只是「測試」 LLM;我們正在它們之上運行整個基礎設施。

2. 「Flash」和「Mini」的主導地位#

圖表的顏色講述了一個清晰的故事:效率贏得了 2025 年。

  • Google 的 Gemini 時代: 代表 Gemini 2.5 FlashGemini 2.0 Flash 的巨大粉紅色和紅色區塊主導了年中到年末。Google 以低延遲提供大量上下文窗口的策略成功地佔據了大量流量。
  • GPT-4.1 Mini: OpenAI 的「Mini」策略仍然是主流(橙色區塊),證明對於許多開發者來說,可靠的中階模型比用於日常任務的笨重、昂貴的旗艦模型更受歡迎。

3. 顛覆者的崛起:DeepSeek 和 Qwen#

2025 年是「價值模型」成為「性能領導者」的一年。

  • DeepSeek 的激增: DeepSeek V3(0324 和 3.1) 在下半年的出現與對舊版模型的顯著擠壓相關。DeepSeek 不僅在價格上競爭;它在智能方面也具有競爭力,尤其是在編碼和邏輯方面。
  • Qwen3 的後期加入: 仔細觀察 12 月的最後一週。Qwen3 30B A3B(黃色)顯著出現。雖然是 2025 年排行榜的後來者,但其迅速採用表明阿里巴巴的最新產品將在 2026 年成為一個巨頭。

4. 專業優勢:編碼和推理#

2025 年的格局也見證了「專家」的崛起:

  • Grok Code Fast 1: 第四季度中的藍色尖峰突顯了 xAI 成功進軍開發者市場。當程式碼生成的速度成為優先事項時,Grok 獲得了大規模採用。
  • Claude Sonnet 4: Anthropic 維持了忠誠、高價值的用戶群。即使「Flash」模型佔據了大量流量,Claude Sonnet 4 仍然是細緻推理和創意輸出的黃金標準,在排行榜上佔據了穩定的位置。

5. 「其他」的分散#

也許圖表中最有趣的部分是底部的廣大 「其他」 類別。這代表了 AI 革命的長尾效應——微調的 Llama 變體、利基垂直模型和實驗性架構。它表明我們正在擺脫「一種模型適用於所有」的世界,進入 多模型策略,開發者可以為特定任務選擇特定的工具。


最終想法#

2025 年是「智能稅」下降的一年。隨著 DeepSeek V3.1Gemini 2.5 Flash 等模型使高階推理變得負擔得起,AI 原生新創公司的進入門檻消失了。

在 2024 年,我們問:「它可以做到這個嗎?」 在 2025 年,我們問:「它可以多麼便宜和快速地做到這個?」

當我們進入 2026 年時,重點再次轉移——這次轉向 自主性。有了如此快速和便宜的模型,自主 AI 代理的時代不再是預測;這是我們目前的現實。

S
Author

Story321 AI Blog Team is dedicated to providing in-depth, unbiased evaluations of technology products and digital solutions. Our team consists of experienced professionals passionate about sharing practical insights and helping readers make informed decisions.

Start Creating with AI

Transform your creative ideas into reality with Story321 AI tools

Get Started Free

Related Articles