2026年を迎え、OpenRouterの2025年のトークン使用量データを振り返ると、爆発的な成長とAIの勢力均衡における根本的な変化が見て取れます。当初は少数の「フロンティア」企業が市場を支配していましたが、コスト効率と特化したパフォーマンスによって定義される、競争の激しいエコシステムへと進化しました。
1. 8倍の爆発:AIが一般大衆へ#
2025年のチャートで最も顕著な点は、その圧倒的な量です。2025年1月には、週間のトークン使用量は1T(兆)を大きく下回っていました。しかし、11月下旬には8T近くまでピークに達し、年末には6T前後で安定しました。
これは単なる漸進的な成長ではありません。AIがグローバルな開発者のワークフローに完全に統合されたのです。私たちはもはやLLMを「テスト」しているのではなく、LLM上でインフラ全体を稼働させています。
2. 「Flash」と「Mini」の支配#
チャートの色は明確な物語を語っています。2025年は効率が勝利したのです。
- GoogleのGemini時代: Gemini 2.5 FlashとGemini 2.0 Flashを表す巨大なピンクと赤色のブロックが、年の中盤から後半にかけて圧倒的な存在感を示しました。低レイテンシーで大規模なコンテキストウィンドウを提供するというGoogleの戦略は、大量のトラフィックをうまく獲得しました。
- GPT-4.1 Mini: OpenAIの「Mini」戦略は定番であり続け(オレンジ色のブロック)、多くの開発者にとって、信頼性が高く、中程度のモデルが、日々のタスクには重くて高価なフラッグシップモデルよりも好ましいことを証明しました。
3. ディスラプターの台頭:DeepSeekとQwen#
2025年は、「バリューモデル」が「パフォーマンスリーダー」になった年でした。
- DeepSeekの急増: 年後半に**DeepSeek V3(0324および3.1)**が登場したことは、古いレガシーモデルの大幅な圧迫と相関関係があります。DeepSeekは価格競争だけでなく、特にコーディングとロジックにおいて、知能でも競争しました。
- Qwen3の遅れての参入: 12月の最終週をよく見てください。Qwen3 30B A3B(黄色)が注目すべき登場を果たしています。2025年のリーダーボードへの参加は遅れましたが、その急速な採用は、Alibabaの最新の製品が2026年には巨大な存在になることを示唆しています。
4. 特化した強み:コーディングと推論#
2025年の状況では、「スペシャリスト」の台頭も見られました。
- Grok Code Fast 1: 第4四半期の青いスパイクは、xAIが開発者市場への進出に成功したことを示しています。コード生成のスピードが優先されるようになると、Grokは大規模な採用を見ました。
- Claude Sonnet 4: Anthropicは、忠実で価値の高いユーザーベースを維持しました。「Flash」モデルがボリュームを占める中でも、Claude Sonnet 4は、ニュアンスのある推論と創造的なアウトプットのためのゴールドスタンダードであり続け、リーダーボードの安定した部分を占めていました。
5. 「その他」の断片化#
おそらくチャートで最も興味深い部分は、下部にある広大な**「その他」のカテゴリでしょう。これは、AI革命のロングテール、つまり、ファインチューニングされたLlamaバリアント、ニッチな垂直モデル、実験的なアーキテクチャを表しています。これは、私たちが「1つのモデルですべてに対応できる」世界から、開発者が特定のタスクに特定のツールを選択するマルチモデル戦略**へと移行していることを示しています。
最終的な考え#
2025年は、「知能税」が下がった年でした。DeepSeek V3.1やGemini 2.5 Flashのようなモデルが高度な推論を手頃な価格にしたことで、AIネイティブなスタートアップの参入障壁がなくなりました。
2024年には、*「これはできるのか?」と問いかけました。 2025年には、「これはどれだけ安く、速くできるのか?」*と問いかけました。
2026年に向けて、焦点は再びシフトします。今回は**自律性(Agency)**です。これほど高速で安価なモデルが登場したことで、自律的なAIエージェントの時代はもはや予測ではなく、現在の現実となっています。



