2025年:效率革命之年 – LLM年度回顾

2025年:效率革命之年 – LLM年度回顾

1 min read

当我们步入2026年,回顾OpenRouter的2025年token使用数据,揭示了一个爆炸性增长的故事,以及AI力量平衡的根本性转变。最初由少数"前沿"巨头主导的市场,已经演变成一个以成本效益和专业性能为特征的超竞争生态系统。

1. 8倍的爆发:AI扩展到大众#

从2025年的图表中得出的最引人注目的结论是其巨大的量。2025年1月,每周的token使用量远低于1T(万亿)。到11月下旬,它达到了接近8T的峰值,然后在年底稳定在6T左右。

这不仅仅是增量增长;这是AI完全融入全球开发者的工作流程。我们不再只是"测试"LLM;我们正在其上运行整个基础设施。

2. "Flash"和"Mini"的统治地位#

图表的颜色讲述了一个清晰的故事:效率赢得了2025年。

  • 谷歌的Gemini时代: 代表Gemini 2.5 FlashGemini 2.0 Flash的大片粉红色和红色块占据了年中到年末的主导地位。谷歌以低延迟提供大规模上下文窗口的策略成功地占据了大量流量。
  • GPT-4.1 Mini: OpenAI的"Mini"策略仍然是主流(橙色块),证明对于许多开发者来说,可靠的中端模型比用于日常任务的笨重、昂贵的旗舰模型更受欢迎。

3. 颠覆者的崛起:DeepSeek和Qwen#

2025年是"价值模型"成为"性能领导者"的一年。

  • DeepSeek的激增: **DeepSeek V3(0324和3.1)**在下半年的出现与对旧版模型的显著挤压相关。DeepSeek不仅仅在价格上竞争;它在智能方面竞争,尤其是在编码和逻辑方面。
  • Qwen3的后期加入: 仔细观察12月的最后一周。Qwen3 30B A3B(黄色)显著出现。虽然是2025年排行榜的后来者,但其迅速采用表明阿里巴巴的最新产品有望成为2026年的巨头。

4. 专业优势:编码和推理#

2025年的格局也见证了"专家"的崛起:

  • Grok Code Fast 1: 第四季度的蓝色峰值突显了xAI成功进军开发者市场。当代码生成的速度成为首要任务时,Grok获得了大规模采用。
  • Claude Sonnet 4: Anthropic保持了忠诚、高价值的用户群。即使"Flash"模型占据了大量流量,Claude Sonnet 4仍然是细致推理和创意输出的黄金标准,在排行榜上占据了稳定的位置。

5. "其他"的分散#

也许图表中最有趣的部分是底部的巨大**"其他"类别。这代表了AI革命的长尾——微调的Llama变体、利基垂直模型和实验性架构。它表明我们正在摆脱"一刀切"的世界,进入多模型策略**,开发者为特定任务选择特定工具。


最终想法#

2025年是"智能税"下降的一年。随着DeepSeek V3.1Gemini 2.5 Flash等模型使高水平推理变得负担得起,AI原生创业公司的准入门槛消失了。

2024年,我们问:"它能做到吗?" 2025年,我们问:"它能以多低的成本和多快的速度做到?"

当我们进入2026年时,焦点再次转移——这次是转向自主性。有了如此快速和廉价的模型,自主AI代理的时代不再是预测;这是我们当前的现实。

S
Author

Story321 AI Blog Team is dedicated to providing in-depth, unbiased evaluations of technology products and digital solutions. Our team consists of experienced professionals passionate about sharing practical insights and helping readers make informed decisions.

Start Creating with AI

Transform your creative ideas into reality with Story321 AI tools

Get Started Free

Related Articles