2025年：效率革命之年

当我们步入2026年，回顾OpenRouter的2025年token使用数据，揭示了一个爆炸性增长的故事，以及AI力量平衡的根本性转变。最初由少数"前沿"巨头主导的市场，已经演变成一个以成本效益和专业性能为特征的超竞争生态系统。

1. 8倍的爆发：AI扩展到大众#

从2025年的图表中得出的最引人注目的结论是其巨大的量。2025年1月，每周的token使用量远低于1T（万亿）。到11月下旬，它达到了接近8T的峰值，然后在年底稳定在6T左右。

这不仅仅是增量增长；这是AI完全融入全球开发者的工作流程。我们不再只是"测试"LLM；我们正在其上运行整个基础设施。

图表的颜色讲述了一个清晰的故事：效率赢得了2025年。

谷歌的Gemini时代： 代表Gemini 2.5 Flash和Gemini 2.0 Flash的大片粉红色和红色块占据了年中到年末的主导地位。谷歌以低延迟提供大规模上下文窗口的策略成功地占据了大量流量。
GPT-4.1 Mini： OpenAI的"Mini"策略仍然是主流（橙色块），证明对于许多开发者来说，可靠的中端模型比用于日常任务的笨重、昂贵的旗舰模型更受欢迎。

2025年是"价值模型"成为"性能领导者"的一年。

DeepSeek的激增： **DeepSeek V3（0324和3.1）**在下半年的出现与对旧版模型的显著挤压相关。DeepSeek不仅仅在价格上竞争；它在智能方面竞争，尤其是在编码和逻辑方面。
Qwen3的后期加入： 仔细观察12月的最后一周。Qwen3 30B A3B（黄色）显著出现。虽然是2025年排行榜的后来者，但其迅速采用表明阿里巴巴的最新产品有望成为2026年的巨头。

2025年的格局也见证了"专家"的崛起：

Grok Code Fast 1： 第四季度的蓝色峰值突显了xAI成功进军开发者市场。当代码生成的速度成为首要任务时，Grok获得了大规模采用。
Claude Sonnet 4： Anthropic保持了忠诚、高价值的用户群。即使"Flash"模型占据了大量流量，Claude Sonnet 4仍然是细致推理和创意输出的黄金标准，在排行榜上占据了稳定的位置。

也许图表中最有趣的部分是底部的巨大**"其他"类别。这代表了AI革命的长尾——微调的Llama变体、利基垂直模型和实验性架构。它表明我们正在摆脱"一刀切"的世界，进入多模型策略**，开发者为特定任务选择特定工具。

2025年是"智能税"下降的一年。随着DeepSeek V3.1和Gemini 2.5 Flash等模型使高水平推理变得负担得起，AI原生创业公司的准入门槛消失了。

2024年，我们问："它能做到吗？" 2025年，我们问："它能以多低的成本和多快的速度做到？"

当我们进入2026年时，焦点再次转移——这次是转向自主性。有了如此快速和廉价的模型，自主AI代理的时代不再是预测；这是我们当前的现实。