Вступая в 2026 год, оглядываясь на данные об использовании токенов в 2025 году от OpenRouter, мы видим историю взрывного роста и фундаментального сдвига в балансе сил в сфере ИИ. То, что начиналось как рынок, где доминировали несколько "передовых" гигантов, превратилось в гиперконкурентную экосистему, определяемую экономической эффективностью и специализированной производительностью.
1. 8-кратный взрыв: ИИ масштабируется для масс#
Самый поразительный вывод из графика 2025 года — это огромный объем. В январе 2025 года еженедельное использование токенов было значительно ниже 1T (триллиона). К концу ноября оно достигло пика около 8T, а к концу года стабилизировалось около 6T.
Это не просто постепенный рост; это полная интеграция ИИ в глобальный рабочий процесс разработчиков. Мы больше не просто "тестируем" LLM; мы запускаем на них целые инфраструктуры.
2. Доминирование "Flash" и "Mini"#
Цвета графика рассказывают четкую историю: Эффективность победила в 2025 году.
- Эра Gemini от Google: Массивные розовые и красноватые блоки, представляющие Gemini 2.5 Flash и Gemini 2.0 Flash, доминировали в середине и конце года. Стратегия Google, предлагающая огромные контекстные окна с низкой задержкой, успешно захватила львиную долю трафика с большим объемом.
- GPT-4.1 Mini: Стратегия "Mini" от OpenAI оставалась основной (оранжевый блок), доказывая, что для многих разработчиков надежная модель среднего уровня предпочтительнее тяжелой, дорогой флагманской модели для повседневных задач.
3. Восстание Разрушителей: DeepSeek и Qwen#
2025 год стал годом, когда "Ценные Модели" стали "Лидерами Производительности".
- Взлет DeepSeek: Появление DeepSeek V3 (0324 и 3.1) во второй половине года коррелирует со значительным вытеснением старых устаревших моделей. DeepSeek конкурировал не только по цене; он конкурировал по интеллекту, особенно в кодировании и логике.
- Поздний выход Qwen3: Присмотритесь к последней неделе декабря. Qwen3 30B A3B (желтый) заметно появляется. Несмотря на то, что он поздно вошел в таблицу лидеров 2025 года, его быстрое внедрение предполагает, что последнее предложение Alibaba станет титаном в 2026 году.
4. Специализированные Сильные стороны: Кодирование и Рассуждение#
В 2025 году также наблюдался рост числа "Специалистов":
- Grok Code Fast 1: Синие всплески в четвертом квартале подчеркивают успешное продвижение xAI на рынок разработчиков. Когда скорость генерации кода стала приоритетом, Grok получил массовое распространение.
- Claude Sonnet 4: Anthropic поддерживал лояльную, ценную базу пользователей. Даже когда модели "Flash" заняли основной объем, Claude Sonnet 4 оставался золотым стандартом для тонких рассуждений и творческого вывода, занимая устойчивую часть таблицы лидеров.
5. Фрагментация "Других"#
Пожалуй, самая интересная часть графика — это обширная категория "Другие" внизу. Она представляет собой длинный хвост ИИ-революции — точно настроенные варианты Llama, нишевые вертикальные модели и экспериментальные архитектуры. Это сигнализирует о том, что мы уходим от мира "одна модель подходит для всего" и переходим к многомодельной стратегии, где разработчики выбирают конкретный инструмент для конкретной задачи.
Заключительные мысли#
2025 год стал годом, когда "Налог на Интеллект" упал. Поскольку такие модели, как DeepSeek V3.1 и Gemini 2.5 Flash, сделали рассуждения высокого уровня доступными, барьер для входа для стартапов, занимающихся ИИ, исчез.
В 2024 году мы спросили: "Может ли это сделать это?" В 2025 году мы спросили: "Как дешево и быстро это может это сделать?"
По мере того, как мы переходим в 2026 год, фокус снова смещается — на этот раз в сторону Автономности. С такими быстрыми и дешевыми моделями эра автономных ИИ-агентов больше не является прогнозом; это наша текущая реальность.



