Крупные технологические компании всё с большим трудом оправдывают стремительно растущие счета за интенсивное использование ИИ. Даже такие гиганты, как Microsoft и Uber, пересматривают свои подходы к работе с искусственным интеллектом. После недавнего вирусного поста технического директора Uber Правина Непалли Наги о том, что компания израсходовала весь годовой бюджет на ИИ всего за несколько месяцев, президент и операционный директор Uber Эндрю Макдональд признал: объём потребляемых токенов, похоже, не имеет прямой связи с полезными для пользователей функциями. Сам Макдональд назвал это явление «токенмаксингом» (tokenmaxxing) — наращиванием расхода токенов без пропорциональной отдачи.

Сатья Наделла, генеральный директор MicrosoftИсточник изображения - David Paul Morris/Bloomberg via Getty Images

На фоне этого Goldman Sachs оценивает: потребление токенов агентным ИИ может вырасти более чем в 24 раза уже в ближайшие несколько лет. Нарастает разрыв между тем, что бизнесу нужно от ИИ, тем, что он хочет от ИИ, и реальной способностью ИИ-компаний оплачивать эти расходы по мере их роста.

Токены в обмен на обещания

Уже несколько месяцев приходят сообщения о том, как компании и их руководители безуспешно ищут ощутимую выгоду от масштабного внедрения ИИ. По данным отраслевых опросов, более 80% компаний пока не зафиксировали прироста производительности от ИИ, несмотря на миллиардные вложения. Uber оказался очередной активно продвигавшей ИИ компанией, пережившей момент прозрения, — после взрывного заявления технического директора об исчерпании годовых бюджетов за считанные месяцы.

Поводом стало откровение Правина Непалли Наги в интервью изданию The Information: к апрелю Uber полностью израсходовала заложенный на весь 2026 год бюджет на инструменты Claude Code и Cursor. Затраты на исследования и разработки выросли в 2025 году на 9% — до $3,4 млрд, и ИИ стал одним из ключевых драйверов этого роста. Внутри компании заявление вызвало, по словам Макдональда, «момент, от которого взрывается голова», и запустило общекорпоративную дискуссию о соотношении расхода токенов и численности персонала.

В беседе с Business Insider Макдональд посетовал: чёткой связи между деньгами, которые Uber вкладывает в использование ИИ, и реальными потребительскими функциями просто не существует. Поговорив со старшими инженерами, он заключил, что роста расхода токенов не сопровождается пропорциональным увеличением числа функций, приносящих реальную пользу клиентам. Кода действительно выпускается больше, но «провести прямую линию» между этим и улучшениями в продукте, по его словам, очень трудно. Масштаб внедрения при этом колоссальный: ИИ-инструментами ежемесячно пользуются около 95% инженеров Uber, а до 70% попадающего в репозиторий кода генерируется ИИ. Показателен и сам характер расходов: типичный счёт на инженера составлял $150–250 в месяц, у самых активных пользователей доходил до $500–2000, а во время одной демонстрации технический директор лично «сжёг» токенов на $1200 всего за два часа.

Тем временем Microsoft, открывшая своим сотрудникам подписки на Claude Code в декабре прошлого года, теперь отзывает эту возможность. Доступ получили тысячи работников — не только инженеры, но и проектные менеджеры и дизайнеры, которым предлагали самостоятельно прототипировать код. За полгода Claude Code стал внутри компании настолько популярен, что, по выражению источников The Verge, оказался «пожалуй, чересчур популярным», фактически потеснив собственный инструмент Microsoft. Теперь подразделение Experiences + Devices — команды, отвечающие за Windows, Microsoft 365, Outlook, Teams и Surface, — должно к 30 июня полностью перейти на GitHub Copilot CLI. Официально исполнительный вице-президент Раджеш Джа объяснил это унификацией инструментов и возможностью дорабатывать Copilot CLI совместно с GitHub под собственные репозитории и требования безопасности. Однако 30 июня совпадает с окончанием финансового года Microsoft, что намекает на сокращение расходов перед новым периодом. Подкрепляет эту версию и то, что ранее в этом году Microsoft перевела Copilot на GitHub на оплату по токенам — из-за резко выросшей стоимости эксплуатации инструмента.

Основная причина происходящего — взрывной рост использования агентного ИИ. В зависимости от числа шагов, необходимых для выполнения задачи, такие агенты способны потреблять более чем в 1000 раз больше токенов, чем единичный запрос к ИИ-чат-боту.

Действительно ли больше токенов — это ответ?

Генеральный директор Nvidia Дженсен Хуанг в марте этого года заявил, что был бы «глубоко встревожен», если бы инженер Nvidia с зарплатой $500 000 в год не израсходовал хотя бы $250 000 на токены за тот же период. Более того, Хуанг рассматривает токены как инструмент найма: к базовому окладу он готов добавлять токены примерно на половину зарплаты, считая, что это «усилит» инженера в десять раз. И это не единичное мнение — руководители всё чаще хвастаются масштабами использования ИИ, словно один лишь объём расхода токенов равнозначен росту производительности.

Как сообщает Business Insider, генеральный директор Airbnb с гордостью рассказал инвесторам, что 60% кода компании теперь создаётся ИИ. Chime заявила о 84% ИИ-кода в начале года, а Google утверждает, что ИИ генерирует 50% её кода (хотя, что принципиально, всегда под проверкой инженера-человека). Эти цифры подозрительно похожи на показатели самой Uber: в шокирующем отчёте технического директора говорилось, что более 80% инженеров-программистов компании пользовались агентным ИИ, а более 60% кода генерировалось ИИ. И даже при этом игра не стоит свеч.

А без ограничителей затраты становятся экстремальными. Создатель проекта OpenClaw, а ныне сотрудник OpenAI Питер Штайнбергер опубликовал снимок счёта на $1 305 088,81: его команда из трёх человек за один месяц израсходовала 603 млрд токенов в 7,6 млн запросов, держа в облаке около сотни экземпляров агента Codex (основная модель — GPT-5.5). Оплачивает всё это сама OpenAI, где Штайнбергер работает с февраля, рассматривая расходы как исследование того, как выглядела бы разработка, если бы стоимость токенов не имела значения. Показательна и оговорка: счёт отражает «быстрый» режим Codex, и при его отключении затраты падают примерно до $300 000 в месяц.

Всё это подкрепляет тревожную мысль: стоимость ИИ выходит за пределы стоимости работников, которых он призван заменить. А значит, многие увольнения, оправдываемые эффективностью и производительностью ИИ, выглядят всё более сомнительно — если только компании не соревнуются в том, кто быстрее достигнет дна.

Ставка на более эффективное оборудование

Точнее — гонка за новым оборудованием. Недавний отчёт Goldman Sachs об ИИ-агентах предполагает, что колоссальный прирост эффективности от чипов для вывода следующего поколения сделает использование ИИ настолько дешевле, что инвестиции смогут продолжаться без остановки, а прибыль должна последовать — при этом ИИ-агенты значительно нарастят доходы ИИ-компаний.

Nvidia представила платформу Vera Rubin ещё на конференции GTC 2026 в марте и продолжает продвигать её, в том числе на Computex; официальный запуск и поставки запланированы на вторую половину этого года. Платформа использует новый технологический процесс (3-нм нормы TSMC), а флагманский ускоритель Rubin R100 с двухкристальной компоновкой содержит около 336 млрд транзисторов. Nvidia заявляет о кратном росте производительности и обещает до 10 раз большую производительность на ватт и примерно десятикратное снижение стоимости одного токена по сравнению с предшественником Grace Blackwell — при том что энергопотребление вырастает примерно вдвое. В числе ожидаемых заказчиков — OpenAI, Anthropic, Amazon, Google и Microsoft.

Такой скачок дал бы компаниям, которые первыми развернут эти ускорители, огромное преимущество перед теми, кто всё ещё работает на оборудовании Blackwell, и тем более перед более старыми решениями Hopper. Однако более 50% проектов дата-центров, анонсированных в расчёте на оборудование Blackwell, уже отменены или отложены. А из тех, что будут завершены в следующем году, — насколько охотно разработчики станут менять GPU, едва начав их эксплуатировать?

В конце 2025 года Google, Oracle и Microsoft скорректировали планы по оборудованию в прямо противоположном направлении, заявив, что будут эксплуатировать его шесть лет до замены. Совместить это с амбициозными планами по ИИ и ежегодными скачками производительности железа кажется невозможным.

Больше токенов на менее эффективном железе

Реальность такова: даже если стоимость части токенов снижается, взрывной рост запросов агентного ИИ не компенсировать приростом эффективности оборудования, до эффективного развёртывания которого ещё много лет — если оно вообще когда-нибудь достигнет масштабов, нужных, чтобы угнаться за этим ростом спроса на ИИ.

Это значит, что в краткосрочной перспективе даже такие крупные игроки, как Microsoft и Uber, перестраивают своё использование ИИ, пытаясь понять, как продолжать применять его в масштабе, не уничтожая при этом бюджеты. И если эти компании не могут разобраться, как себе это позволить, всё труднее представить, как с этим справятся все остальные.

А если использование сократится из-за растущих затрат, ИИ-компании так и не получат краткосрочную прибыль, необходимую им, чтобы окупить огромные инфраструктурные расходы, которые они до сих пор пытаются оправдать.