Terwijl we 2026 ingaan, onthullen de tokengebruiksgegevens van OpenRouter uit 2025 een verhaal van explosieve groei en een fundamentele verschuiving in de machtsverhoudingen binnen de AI. Wat begon als een markt die werd gedomineerd door een paar "frontier"-reuzen, is geëvolueerd naar een hypercompetitief ecosysteem dat wordt gekenmerkt door kostenefficiëntie en gespecialiseerde prestaties.
1. De 8x Explosie: AI Geschaald naar de Massa#
De meest opvallende conclusie uit de grafiek van 2025 is het enorme volume. In januari 2025 lag het wekelijkse tokengebruik ruim onder de 1T (biljoen). Eind november piekte het bijna 8T, om tegen het einde van het jaar te stabiliseren rond de 6T.
Dit is niet zomaar incrementele groei; het is een totale integratie van AI in de wereldwijde workflow van ontwikkelaars. We zijn niet langer alleen "aan het testen" met LLM's; we draaien er complete infrastructuren op.
2. De Dominantie van "Flash" en "Mini"#
De kleuren in de grafiek vertellen een duidelijk verhaal: Efficiëntie won 2025.
- Google's Gemini Tijdperk: De enorme roze en roodachtige blokken die Gemini 2.5 Flash en Gemini 2.0 Flash vertegenwoordigen, domineerden het midden tot het einde van het jaar. Google's strategie om enorme contextvensters aan te bieden met lage latentie, veroverde met succes het leeuwendeel van het high-volume verkeer.
- GPT-4.1 Mini: OpenAI's "Mini"-strategie bleef een vaste waarde (oranje blok), wat bewijst dat voor veel ontwikkelaars een betrouwbaar model uit het middensegment de voorkeur heeft boven een zwaar, duur vlaggenschip voor dagelijkse taken.
3. De Opkomst van de Disruptors: DeepSeek & Qwen#
2025 was het jaar waarin "Value Models" "Performance Leaders" werden.
- DeepSeek's Opkomst: De opkomst van DeepSeek V3 (0324 en 3.1) in de tweede helft van het jaar correleert met een aanzienlijke druk op oudere, legacy modellen. DeepSeek concurreerde niet alleen op prijs; het concurreerde op intelligentie, met name in codering en logica.
- Qwen3's Late Intrede: Kijk goed naar de laatste week van december. Qwen3 30B A3B (geel) maakt een opmerkelijke verschijning. Hoewel het een laatkomer is op het leaderboard van 2025, suggereert de snelle adoptie dat Alibaba's nieuwste aanbod klaar is om een reus te worden in 2026.
4. Gespecialiseerde Sterke Punten: Codering en Redeneren#
Het landschap van 2025 zag ook de opkomst van de "Specialisten":
- Grok Code Fast 1: De blauwe pieken in het vierde kwartaal benadrukken xAI's succesvolle push in de ontwikkelaarsmarkt. Toen snelheid bij het genereren van code de prioriteit werd, zag Grok een enorme adoptie.
- Claude Sonnet 4: Anthropic behield een loyaal, hoogwaardig gebruikersbestand. Zelfs toen "Flash"-modellen het volume overnamen, bleef Claude Sonnet 4 de gouden standaard voor genuanceerd redeneren en creatieve output, en behield het een stabiel deel van het leaderboard.
5. De Fragmentatie van "Anderen"#
Misschien wel het meest interessante deel van de grafiek is de enorme categorie "Anderen" onderaan. Dit vertegenwoordigt de lange staart van de AI-revolutie: fijn afgestemde Llama-varianten, niche verticale modellen en experimentele architecturen. Het signaleert dat we weggaan van een "one-model-fits-all"-wereld en naar een multi-model strategie waarin ontwikkelaars de specifieke tool kiezen voor de specifieke taak.
Laatste Gedachten#
2025 was het jaar waarin de "Intelligence Tax" daalde. Omdat modellen zoals DeepSeek V3.1 en Gemini 2.5 Flash redeneren op hoog niveau betaalbaar maakten, verdween de drempel voor AI-native startups.
In 2024 vroegen we: "Kan het dit?" In 2025 vroegen we: "Hoe goedkoop en snel kan het dit?"
Terwijl we 2026 ingaan, verschuift de focus opnieuw - dit keer naar Agency. Met modellen die zo snel en zo goedkoop zijn, is het tijdperk van autonome AI-agenten niet langer een voorspelling; het is onze huidige realiteit.



