Når vi går inn i 2026 og ser tilbake på dataene for tokenbruk i 2025 fra OpenRouter, avdekkes en historie om eksplosiv vekst og et fundamentalt skifte i maktbalansen innen AI. Det som startet som et marked dominert av noen få «grense»-giganter, har utviklet seg til et hyperkonkurransedyktig økosystem definert av kostnadseffektivitet og spesialisert ytelse.
1. 8x-eksplosjonen: AI skalert til massene#
Det mest slående med 2025-diagrammet er det enorme volumet. I januar 2025 lå det ukentlige tokenbruket godt under 1T (billion). Mot slutten av november nådde det en topp nær 8T, før det stabiliserte seg rundt 6T ved årsslutt.
Dette er ikke bare inkrementell vekst; det er en total integrering av AI i den globale utviklerarbeidsflyten. Vi bare «tester» ikke LLM-er lenger; vi kjører hele infrastrukturer på dem.
2. Dominansen til «Flash» og «Mini»#
Fargene i diagrammet forteller en tydelig historie: Effektivitet vant 2025.
- Googles Gemini-æra: De massive rosa og rødaktige blokkene som representerer Gemini 2.5 Flash og Gemini 2.0 Flash dominerte midten til slutten av året. Googles strategi med å tilby massive kontekstvinduer med lav latens fanget vellykket løvens andel av høytrafikkvolumet.
- GPT-4.1 Mini: OpenAIs «Mini»-strategi forble en stift (oransje blokk), noe som beviste at for mange utviklere er en pålitelig modell i mellomklassen å foretrekke fremfor en tung, dyr flaggskipmodell for daglige oppgaver.
3. Fremveksten av utfordrerne: DeepSeek & Qwen#
2025 var året «Verdimodeller» ble «Ytelsesledere».
- DeepSeeks fremgang: Fremveksten av DeepSeek V3 (0324 og 3.1) i andre halvdel av året korrelerer med en betydelig innstramming av eldre, tradisjonelle modeller. DeepSeek konkurrerte ikke bare på pris; de konkurrerte på intelligens, spesielt innen koding og logikk.
- Qwen3s sene inntreden: Se nøye på den siste uken i desember. Qwen3 30B A3B (gul) gjør en bemerkelsesverdig opptreden. Selv om den kom sent til 2025-ledertavlen, antyder den raske adopsjonen at Alibabas nyeste tilbud er satt til å bli en titan i 2026.
4. Spesialiserte styrker: Koding og resonnering#
2025-landskapet så også fremveksten av «Spesialistene»:
- Grok Code Fast 1: De blå piggene i fjerde kvartal fremhever xAIs vellykkede satsing på utviklermarkedet. Da hastighet i kodegenerering ble prioritert, opplevde Grok massiv adopsjon.
- Claude Sonnet 4: Anthropic opprettholdt en lojal, høyt verdsatt brukerbase. Selv om «Flash»-modeller tok volumet, forble Claude Sonnet 4 gullstandarden for nyansert resonnering og kreativ produksjon, og holdt en jevn del av ledertavlen.
5. Fragmenteringen av «Andre»#
Kanskje den mest interessante delen av diagrammet er den store «Andre»-kategorien nederst. Dette representerer den lange halen av AI-revolusjonen – finjusterte Llama-varianter, nisjemodeller for vertikaler og eksperimentelle arkitekturer. Det signaliserer at vi beveger oss bort fra en «én-modell-passer-alle»-verden og inn i en multi-modellstrategi der utviklere velger det spesifikke verktøyet for den spesifikke oppgaven.
Avsluttende tanker#
2025 var året «Intelligensskatten» falt. Da modeller som DeepSeek V3.1 og Gemini 2.5 Flash gjorde resonnering på høyt nivå rimelig, forsvant barrieren for inntreden for AI-native startups.
I 2024 spurte vi: «Kan den gjøre dette?» I 2025 spurte vi: «Hvor billig og raskt kan den gjøre dette?»
Når vi beveger oss inn i 2026, skifter fokuset igjen – denne gangen mot Agency. Med modeller som er så raske og så billige, er æraen med autonome AI-agenter ikke lenger en prognose; det er vår nåværende virkelighet.



