Amazon столкнулась с накруткой потребления ИИ-токенов сотрудниками

Amazon стала последним из хайперскейлеров, чьих сотрудников уличили в искусственном завышении потребления ИИ-токенов ради выполнения внутренних целей. Об этом сообщает Financial Times, и история уже подхвачена индустриальными изданиями от Retail Gazette до Built In. Похожие сюжеты в апреле 2026 года всплывали в Meta, OpenAI и Anthropic — там фигурировали внутренние лидерборды, рекордные счета и неформальные титулы вроде «Token Legend».

(Image credit: Getty / Smith Collection/Gado)

MeshClaw и «извращённые стимулы»

В центре сюжета — недавно развёрнутый внутри Amazon продукт MeshClaw. Это агентская платформа, позволяющая сотрудникам создавать ИИ-агентов, которые подключаются к рабочим приложениям и выполняют задачи: запускают развёртывание кода, сортируют электронную почту, взаимодействуют со Slack. Компания публично описывает её как инструмент, дающий «тысячам Amazonians ежедневно автоматизировать рутинные задачи», и подчёркивает приверженность «безопасному, надёжному и ответственному» использованию генеративного ИИ.

Параллельно компания установила и формальные требования к адаптации технологии:

Более 80% разработчиков обязаны использовать ИИ-инструменты еженедельно.
Внутренние лидерборды публично ранжируют сотрудников по объёму потреблённых токенов.
Amazon официально заявила, что статистика использования не учитывается в оценке эффективности.
Тем не менее, несколько сотрудников в разговоре с FT сказали, что менеджеры явно мониторят эти данные.

Результат предсказуем. Один из сотрудников описал «огромное давление с требованием использовать эти инструменты», другой — что отслеживание создаёт «извращённые стимулы» (perverse incentives) лезть наверх лидербордов. Практика быстро получила собственное название — tokenmaxxing, по аналогии с интернет-сленгом «looksmaxxing». Изначально это термин из субкультуры мужчин, оптимизирующих свою внешность; теперь его применяют к инженерам, оптимизирующим расход токенов.

Контекст: «Claudenomics» в Meta и счета на $150 000 у Anthropic

Дискуссия раскрутилась ещё в начале апреля 2026 года, когда отраслевое издание The Information сообщило о внутреннем дашборде в Meta Platforms: один из сотрудников самостоятельно поднял лидерборд под названием «Claudenomics», ранжирующий коллег по личному расходу токенов и присваивающий титулы вроде «Token Legend». По данным The Information, сотрудники Meta за 30 дней суммарно потребили 60 триллионов токенов. Дашборд впоследствии был отключён, но Meta признала, что использует и отдельный инструмент «AI Insights», который отслеживает использование ИИ более «холистически».

Колонка Кевина Руза в New York Times подкинула дров в дискуссию ещё несколькими цифрами:

Один инженер OpenAI обработал 210 миллиардов токенов за неделю — это эквивалентно примерно 33 полным копиям английской Википедии.
Один пользователь Claude Code внутри Anthropic накрутил счёт на $150 000 за месяц.
В Writer (корпоративный ИИ-стартап) топовые сотрудники в марте потратили около 11 и 6 миллиардов токенов соответственно — на внутренней платформе это около $50 000.

«Outcome maxxing» против «token maxxing»: позиции сторон

Индустрия раскололась на лагеря. На стороне «токенов как метрики продуктивности» — генеральный директор Nvidia Дженсен Хуан (Jensen Huang). Именно он сделал расход токенов на инженера ключевым показателем, заявив, что «глубоко встревожился бы, если бы инженер с зарплатой $500 000 в год потреблял менее $250 000 в токенах». Сама Nvidia рассматривает план по выдаче инженерам токен-бюджета размером примерно с половину базовой зарплаты. Рид Хоффман (сооснователь LinkedIn) поддерживает мысль, что отслеживать расход токенов — хорошая идея: «вам нужно, чтобы самые разные люди использовали инструмент коллективно и одновременно».

На другом конце спектра — нарастающее сопротивление:

Ямини Ранган (CEO HubSpot) сформулировала контртезис на LinkedIn в виде формулы: «Outcome maxxing >> token maxxing» (максимизация результата важнее максимизации токенов).
Эндрю Лау (сооснователь Jellyfish) предупреждает, что можно «токенмаксить весь день» и при этом производить плохие результаты.
Брайан Эллиотт (CEO Blitzy) сравнивает метрику с измерением выручки компании по количеству холодных звонков.
Мэтт Калкинс (CEO Appian) уподобил происходящее советской практике оценивать качество люстр по их весу.

Salesforce пытается продвигать альтернативную единицу — AWU (Agentic Work Units), привязанную к фактической пользе для клиента. Сингапурские авиалинии, по данным Salesforce, используют AWU для измерения времени обработки клиентских обращений; Williams Sonoma — для отслеживания того, как ИИ-агенты выводят товарные рекомендации. К четвёртому кварталу 2026 года на платформе было сгенерировано 2,4 миллиарда AWU с трёхзначным годовым ростом. Критики, впрочем, указывают на ту же проблему: Salesforce сам определяет формулу и сам контролирует бенчмарк.

Почему это важно для всей индустрии

На уровне отдельной компании tokenmaxxing — это просто корпоративная политика, которая стимулирует не те поведения. Но на уровне индустрии возникает гораздо более тревожный вопрос: если значительная часть потребления ИИ фиктивна, насколько надёжны данные о спросе, на основе которых распределяются сотни миллиардов долларов на закупку GPU и строительство дата-центров?

Каждый накрученный токен — это реальное время работы GPU. Если внутренние KPI крупных технологических компаний толкают сотрудников «прожигать» токены без бизнес-смысла, рост выручки Nvidia и спрос на её ускорители в моменте выглядит более устойчивым, чем он есть на самом деле. Учитывая, что вся капитальная программа гиперскейлеров на ближайшие годы построена на ожиданиях экспоненциального роста, любое расхождение между «номинальным» и «полезным» потреблением — это потенциальная мина для прогнозов.

Прогноз IDC здесь выглядит почти комично: к 2030 году в мире, по их оценке, будет работать 2,216 миллиарда активных ИИ-агентов, а годовое потребление токенов вырастет с 0,0005 петатокенов (1 петатокен = 1000 триллионов) в 2025 году до 152 000 петатокенов — рост в более чем 300 миллионов раз. Часть этой цифры — реальная экономическая активность. Часть — KPI-маневрирование инженеров, которым проще запустить агента в холостую, чем объяснять менеджеру, почему сегодня в лидерборде они на 47-м месте.

Под давлением ценовой реальности крупные провайдеры моделей уже начали повышать цены — это касается и Amazon с Google, и китайских Alibaba Cloud, Tencent Cloud, Zhipu. Когда субсидирование закончится, стартапы и рабочие процессы, построенные на массивном потреблении токенов, окажутся в очень жёсткой ценовой ловушке. Как образно сформулировал один из аналитиков: «Эта „игра в инфляцию токенов" продлится ещё какое-то время. Но когда отлив случится, мы увидим, какие инженеры плавали без купальника».