Сотрудники Amazon искусственно раздувают потребление токенов в внутреннем ИИ-инструменте MeshClaw, чтобы выполнять корпоративные KPI
Компания требовала от более 80% разработчиков еженедельного использования ИИ и вела внутренние рейтинги
Практика получила название «tokenmaxxing» — отсылка к «looksmaxxing» и интернет-культуре оптимизации показателей
Аналогичные дашборды и «легенды токенов» ранее всплывали в Meta, OpenAI и Anthropic
Каждый накрученный токен — это реальное время работы GPU, что искажает прогнозы спроса на ИИ-инфраструктуру в сотни миллиардов долларов
Amazon стала последним из хайперскейлеров, чьих сотрудников уличили в искусственном завышении потребления ИИ-токенов ради выполнения внутренних целей. Об этом сообщает Financial Times, и история уже подхвачена индустриальными изданиями от Retail Gazette до Built In. Похожие сюжеты в апреле 2026 года всплывали в Meta, OpenAI и Anthropic — там фигурировали внутренние лидерборды, рекордные счета и неформальные титулы вроде «Token Legend».
(Image credit: Getty / Smith Collection/Gado)
MeshClaw и «извращённые стимулы»
В центре сюжета — недавно развёрнутый внутри Amazon продукт MeshClaw. Это агентская платформа, позволяющая сотрудникам создавать ИИ-агентов, которые подключаются к рабочим приложениям и выполняют задачи: запускают развёртывание кода, сортируют электронную почту, взаимодействуют со Slack. Компания публично описывает её как инструмент, дающий «тысячам Amazonians ежедневно автоматизировать рутинные задачи», и подчёркивает приверженность «безопасному, надёжному и ответственному» использованию генеративного ИИ.
Параллельно компания установила и формальные требования к адаптации технологии:
- Более 80% разработчиков обязаны использовать ИИ-инструменты еженедельно.
- Внутренние лидерборды публично ранжируют сотрудников по объёму потреблённых токенов.
- Amazon официально заявила, что статистика использования не учитывается в оценке эффективности.
- Тем не менее, несколько сотрудников в разговоре с FT сказали, что менеджеры явно мониторят эти данные.
Результат предсказуем. Один из сотрудников описал «огромное давление с требованием использовать эти инструменты», другой — что отслеживание создаёт «извращённые стимулы» (perverse incentives) лезть наверх лидербордов. Практика быстро получила собственное название — tokenmaxxing, по аналогии с интернет-сленгом «looksmaxxing». Изначально это термин из субкультуры мужчин, оптимизирующих свою внешность; теперь его применяют к инженерам, оптимизирующим расход токенов.
Контекст: «Claudenomics» в Meta и счета на $150 000 у Anthropic
Дискуссия раскрутилась ещё в начале апреля 2026 года, когда отраслевое издание The Information сообщило о внутреннем дашборде в Meta Platforms: один из сотрудников самостоятельно поднял лидерборд под названием «Claudenomics», ранжирующий коллег по личному расходу токенов и присваивающий титулы вроде «Token Legend». По данным The Information, сотрудники Meta за 30 дней суммарно потребили 60 триллионов токенов. Дашборд впоследствии был отключён, но Meta признала, что использует и отдельный инструмент «AI Insights», который отслеживает использование ИИ более «холистически».
Колонка Кевина Руза в New York Times подкинула дров в дискуссию ещё несколькими цифрами:
- Один инженер OpenAI обработал 210 миллиардов токенов за неделю — это эквивалентно примерно 33 полным копиям английской Википедии.
- Один пользователь Claude Code внутри Anthropic накрутил счёт на $150 000 за месяц.
- В Writer (корпоративный ИИ-стартап) топовые сотрудники в марте потратили около 11 и 6 миллиардов токенов соответственно — на внутренней платформе это около $50 000.
«Outcome maxxing» против «token maxxing»: позиции сторон
Индустрия раскололась на лагеря. На стороне «токенов как метрики продуктивности» — генеральный директор Nvidia Дженсен Хуан (Jensen Huang). Именно он сделал расход токенов на инженера ключевым показателем, заявив, что «глубоко встревожился бы, если бы инженер с зарплатой $500 000 в год потреблял менее $250 000 в токенах». Сама Nvidia рассматривает план по выдаче инженерам токен-бюджета размером примерно с половину базовой зарплаты. Рид Хоффман (сооснователь LinkedIn) поддерживает мысль, что отслеживать расход токенов — хорошая идея: «вам нужно, чтобы самые разные люди использовали инструмент коллективно и одновременно».
На другом конце спектра — нарастающее сопротивление:
- Ямини Ранган (CEO HubSpot) сформулировала контртезис на LinkedIn в виде формулы: «Outcome maxxing >> token maxxing» (максимизация результата важнее максимизации токенов).
- Эндрю Лау (сооснователь Jellyfish) предупреждает, что можно «токенмаксить весь день» и при этом производить плохие результаты.
- Брайан Эллиотт (CEO Blitzy) сравнивает метрику с измерением выручки компании по количеству холодных звонков.
- Мэтт Калкинс (CEO Appian) уподобил происходящее советской практике оценивать качество люстр по их весу.
Salesforce пытается продвигать альтернативную единицу — AWU (Agentic Work Units), привязанную к фактической пользе для клиента. Сингапурские авиалинии, по данным Salesforce, используют AWU для измерения времени обработки клиентских обращений; Williams Sonoma — для отслеживания того, как ИИ-агенты выводят товарные рекомендации. К четвёртому кварталу 2026 года на платформе было сгенерировано 2,4 миллиарда AWU с трёхзначным годовым ростом. Критики, впрочем, указывают на ту же проблему: Salesforce сам определяет формулу и сам контролирует бенчмарк.
Почему это важно для всей индустрии
На уровне отдельной компании tokenmaxxing — это просто корпоративная политика, которая стимулирует не те поведения. Но на уровне индустрии возникает гораздо более тревожный вопрос: если значительная часть потребления ИИ фиктивна, насколько надёжны данные о спросе, на основе которых распределяются сотни миллиардов долларов на закупку GPU и строительство дата-центров?
Каждый накрученный токен — это реальное время работы GPU. Если внутренние KPI крупных технологических компаний толкают сотрудников «прожигать» токены без бизнес-смысла, рост выручки Nvidia и спрос на её ускорители в моменте выглядит более устойчивым, чем он есть на самом деле. Учитывая, что вся капитальная программа гиперскейлеров на ближайшие годы построена на ожиданиях экспоненциального роста, любое расхождение между «номинальным» и «полезным» потреблением — это потенциальная мина для прогнозов.
Прогноз IDC здесь выглядит почти комично: к 2030 году в мире, по их оценке, будет работать 2,216 миллиарда активных ИИ-агентов, а годовое потребление токенов вырастет с 0,0005 петатокенов (1 петатокен = 1000 триллионов) в 2025 году до 152 000 петатокенов — рост в более чем 300 миллионов раз. Часть этой цифры — реальная экономическая активность. Часть — KPI-маневрирование инженеров, которым проще запустить агента в холостую, чем объяснять менеджеру, почему сегодня в лидерборде они на 47-м месте.
Под давлением ценовой реальности крупные провайдеры моделей уже начали повышать цены — это касается и Amazon с Google, и китайских Alibaba Cloud, Tencent Cloud, Zhipu. Когда субсидирование закончится, стартапы и рабочие процессы, построенные на массивном потреблении токенов, окажутся в очень жёсткой ценовой ловушке. Как образно сформулировал один из аналитиков: «Эта „игра в инфляцию токенов" продлится ещё какое-то время. Но когда отлив случится, мы увидим, какие инженеры плавали без купальника».
