Alors que nous entrons dans l'année 2026, un regard rétrospectif sur les données d'utilisation des jetons d'OpenRouter en 2025 révèle une histoire de croissance explosive et un changement fondamental dans l'équilibre des forces de l'IA. Ce qui a commencé comme un marché dominé par quelques géants "pionniers" a évolué vers un écosystème hypercompétitif défini par la rentabilité et la performance spécialisée.
1. L'explosion par 8 : l'IA à l'échelle des masses#
La conclusion la plus frappante du graphique de 2025 est le volume pur et simple. En janvier 2025, l'utilisation hebdomadaire des jetons était bien inférieure à 1T (mille milliards). Fin novembre, elle a culminé près de 8T, avant de se stabiliser autour de 6T en fin d'année.
Il ne s'agit pas seulement d'une croissance progressive ; c'est une intégration totale de l'IA dans le flux de travail mondial des développeurs. Nous ne faisons plus seulement des "tests" de LLM ; nous exécutons des infrastructures entières sur eux.
2. La domination de "Flash" et "Mini"#
Les couleurs du graphique racontent une histoire claire : L'efficacité a gagné en 2025.
- L'ère Gemini de Google : Les énormes blocs roses et rougeâtres représentant Gemini 2.5 Flash et Gemini 2.0 Flash ont dominé le milieu et la fin de l'année. La stratégie de Google consistant à offrir des fenêtres de contexte massives à faible latence a permis de capter la part du lion du trafic à volume élevé.
- GPT-4.1 Mini : La stratégie "Mini" d'OpenAI est restée un élément de base (bloc orange), prouvant que pour de nombreux développeurs, un modèle de niveau intermédiaire fiable est préférable à un modèle phare lourd et coûteux pour les tâches quotidiennes.
3. L'ascension des perturbateurs : DeepSeek & Qwen#
2025 a été l'année où les "modèles de valeur" sont devenus des "leaders de la performance".
- La poussée de DeepSeek : L'émergence de DeepSeek V3 (0324 et 3.1) dans la seconde moitié de l'année est corrélée à une compression significative des anciens modèles hérités. DeepSeek n'a pas seulement rivalisé sur le prix ; il a rivalisé sur l'intelligence, en particulier dans le codage et la logique.
- L'entrée tardive de Qwen3 : Regardez attentivement la dernière semaine de décembre. Qwen3 30B A3B (jaune) fait une apparition notable. Bien qu'il soit arrivé tardivement au classement de 2025, son adoption rapide suggère que la dernière offre d'Alibaba est sur le point de devenir un titan en 2026.
4. Forces spécialisées : Codage et raisonnement#
Le paysage de 2025 a également vu l'essor des "spécialistes" :
- Grok Code Fast 1 : Les pics bleus au quatrième trimestre mettent en évidence la percée réussie de xAI sur le marché des développeurs. Lorsque la vitesse de génération de code est devenue la priorité, Grok a connu une adoption massive.
- Claude Sonnet 4 : Anthropic a maintenu une base d'utilisateurs fidèles et de grande valeur. Même si les modèles "Flash" ont pris le volume, Claude Sonnet 4 est resté l'étalon-or pour le raisonnement nuancé et la production créative, conservant une section stable du classement.
5. La fragmentation des "Autres"#
La partie la plus intéressante du graphique est peut-être la vaste catégorie "Autres" en bas. Elle représente la longue traîne de la révolution de l'IA : les variantes Llama affinées, les modèles verticaux de niche et les architectures expérimentales. Elle signale que nous nous éloignons d'un monde "un modèle pour tous" et que nous nous dirigeons vers une stratégie multi-modèles où les développeurs choisissent l'outil spécifique pour la tâche spécifique.
Réflexions finales#
2025 a été l'année où la "taxe sur l'intelligence" a chuté. Alors que des modèles comme DeepSeek V3.1 et Gemini 2.5 Flash ont rendu le raisonnement de haut niveau abordable, la barrière à l'entrée pour les startups natives de l'IA a disparu.
En 2024, nous avons demandé : "Peut-il faire ça ?" En 2025, nous avons demandé : "À quel point peut-il le faire à moindre coût et rapidement ?"
Alors que nous entrons dans l'année 2026, l'attention se déplace à nouveau, cette fois vers l'autonomie. Avec des modèles aussi rapides et aussi bon marché, l'ère des agents d'IA autonomes n'est plus une prévision ; c'est notre réalité actuelle.



