当我们步入2026年,回顾OpenRouter的2025年token使用数据,揭示了一个爆炸性增长的故事,以及AI力量平衡的根本性转变。最初由少数"前沿"巨头主导的市场,已经演变成一个以成本效益和专业性能为特征的超竞争生态系统。
1. 8倍的爆发:AI扩展到大众#
从2025年的图表中得出的最引人注目的结论是其巨大的量。2025年1月,每周的token使用量远低于1T(万亿)。到11月下旬,它达到了接近8T的峰值,然后在年底稳定在6T左右。
这不仅仅是增量增长;这是AI完全融入全球开发者的工作流程。我们不再只是"测试"LLM;我们正在其上运行整个基础设施。
2. "Flash"和"Mini"的统治地位#
图表的颜色讲述了一个清晰的故事:效率赢得了2025年。
- 谷歌的Gemini时代: 代表Gemini 2.5 Flash和Gemini 2.0 Flash的大片粉红色和红色块占据了年中到年末的主导地位。谷歌以低延迟提供大规模上下文窗口的策略成功地占据了大量流量。
- GPT-4.1 Mini: OpenAI的"Mini"策略仍然是主流(橙色块),证明对于许多开发者来说,可靠的中端模型比用于日常任务的笨重、昂贵的旗舰模型更受欢迎。
3. 颠覆者的崛起:DeepSeek和Qwen#
2025年是"价值模型"成为"性能领导者"的一年。
- DeepSeek的激增: **DeepSeek V3(0324和3.1)**在下半年的出现与对旧版模型的显著挤压相关。DeepSeek不仅仅在价格上竞争;它在智能方面竞争,尤其是在编码和逻辑方面。
- Qwen3的后期加入: 仔细观察12月的最后一周。Qwen3 30B A3B(黄色)显著出现。虽然是2025年排行榜的后来者,但其迅速采用表明阿里巴巴的最新产品有望成为2026年的巨头。
4. 专业优势:编码和推理#
2025年的格局也见证了"专家"的崛起:
- Grok Code Fast 1: 第四季度的蓝色峰值突显了xAI成功进军开发者市场。当代码生成的速度成为首要任务时,Grok获得了大规模采用。
- Claude Sonnet 4: Anthropic保持了忠诚、高价值的用户群。即使"Flash"模型占据了大量流量,Claude Sonnet 4仍然是细致推理和创意输出的黄金标准,在排行榜上占据了稳定的位置。
5. "其他"的分散#
也许图表中最有趣的部分是底部的巨大**"其他"类别。这代表了AI革命的长尾——微调的Llama变体、利基垂直模型和实验性架构。它表明我们正在摆脱"一刀切"的世界,进入多模型策略**,开发者为特定任务选择特定工具。
最终想法#
2025年是"智能税"下降的一年。随着DeepSeek V3.1和Gemini 2.5 Flash等模型使高水平推理变得负担得起,AI原生创业公司的准入门槛消失了。
2024年,我们问:"它能做到吗?" 2025年,我们问:"它能以多低的成本和多快的速度做到?"
当我们进入2026年时,焦点再次转移——这次是转向自主性。有了如此快速和廉价的模型,自主AI代理的时代不再是预测;这是我们当前的现实。



