Подписка Claude Max за 200 долларов в месяц при максимальной нагрузке обходится поставщику почти в 8 тысяч долларов токенов
OpenAI начинает терять деньги на ChatGPT Pro, если пользователи загружают модель более чем на 5,7%
Одна компания потратила 500 миллионов долларов за месяц, не сумев установить лимит на ИИ-токены
Бизнес массово переходит на DeepSeek ради экономии до 95% затрат, оставляя топовые модели лишь для сложных задач
Фиксированная месячная плата за подписку помогла стремительному распространению таких инструментов, как ChatGPT и Claude, однако новый анализ показывает, что эти сборы могут далеко не покрывать реальную стоимость интенсивного использования. По мере того как пользователи нагружают системы всё сильнее, а требовательные ИИ-сценарии входят в обиход, разрыв между выручкой и затратами на вычисления становится всё заметнее.
Стоимость предоставления ИИ-услуг по подписке для поставщиков неуклонно растёт — особенно на фоне того, что снижение цены за токен не поспевает за резким увеличением их потребления. Согласно данным исследовательской фирмы SemiAnalysis, подписки, предлагаемые Anthropic и OpenAI, заметно дешевле фактической стоимости при максимальной нагрузке. Фирма приобрела все доступные тарифы у обоих поставщиков, после чего прогоняла на них длительные задачи по программированию, пока не упёрлась в недельные лимиты, и пересчитала использованные токены по ценам интерфейса разработчика (API). Выяснилось, что примерный максимально возможный расход намного превышает ежемесячную плату пользователей. Так, Claude Max 20x стоит $200 в месяц, но выработка токенов «под завязку» составила бы около $8 000 в месяц, тогда как ChatGPT Pro 20x, также за $200 в месяц, имеет максимальный потенциальный расход порядка $14 000.
Источник изображения - Getty Images
Та же картина повторяется и на младших тарифах: подписка Claude Pro за $20 при максимальной выработке даёт токенов примерно на $400, а ChatGPT Plus за те же $20 — почти на $700. Любопытная закономерность: чем дороже тариф, тем выше кратность субсидии. У Claude для тарифа за $20 множитель составляет около 20 раз, а для тарифа за $200 — уже порядка 40 раз; у OpenAI разрыв ещё резче — от 35 до 70 раз.
Объяснение кроется отчасти в самой архитектуре цен (старшие тарифы дают непропорционально большие квоты — фактически оптовую скидку крупным клиентам), а отчасти в поведении пользователей. Тот, кто готов отдать $200 за план 20x, нацелен израсходовать квоту полностью, тогда как «лёгкие» пользователи такой тариф попросту не выбирают. В страховании этот эффект называют неблагоприятным отбором: когда цена полиса притягивает только клиентов с наивысшим риском, такая модель теряет актуарную устойчивость.
Где проходит точка безубыточности
Именно поэтому показатели загрузки так важны для поставщиков. Anthropic выходит в ноль на двух младших тарифах (Claude Pro и Claude Max 5x) при загрузке около 20%, тогда как OpenAI начинает терять деньги, если использование базовых планов (ChatGPT Plus и ChatGPT Pro 5x) превышает 11,4%. Для топовых предложений ситуация заметно хуже: у Anthropic валовая маржа падает до 0% уже при загрузке в 10%, а OpenAI уходит в минус, если использование превышает 5,7%.
В пиковых сценариях цифры выглядят почти абсурдно. Если исходить из валовой маржи API на уровне 75%, при полной загрузке расчётная маржа уходит в район минус 900% для Claude Max 20x и минус 1 650% для старшего тарифа OpenAI. Иными словами, не нужно экстремального использования, чтобы подписка стала убыточной. Резать функции или поднимать цены компании, вероятно, тоже не готовы — это рискует разозлить именно тех разработчиков, кто выстроил вокруг продукта ежедневные рабочие процессы.
Недавно мы приобрели по одному экземпляру каждого тарифа Anthropic и OpenAI и в случайном порядке запускали длительные задачи по программированию, пока не исчерпали недельный лимит. Широко распространено мнение, что план за $200 в месяц упирается в потолок примерно на $2 000 токенов в месяц (по ценам API). Однако мы обнаружили, что на деле подписки куда щедрее… — SemiAnalysis, 10 июня 2026 года
Почему агентный ИИ ломает бюджеты
Как показал разбор SemiAnalysis, подписочные тарифы доступнее прямого доступа через API. Однако именно последний нужен для полного раскрытия возможностей этих моделей — и именно здесь бюджеты начинают трещать по швам. Мощный агентный ИИ потребляет в сотни и тысячи раз больше токенов, чем обычный диалог, и крупные игроки вроде Microsoft, Meta и Amazon отказываются от «токенмаксинга» (tokenmaxxing), поскольку затраты выходят из-под контроля. Одна неназванная компания умудрилась потратить $500 миллионов за один месяц, не сумев выставить лимит расхода на лицензии своих сотрудников.
Это уже не единичные случаи. GitHub недавно отказался от фиксированной подписки на Copilot в пользу оплаты по факту использования — после того как сессии агентного программирования разогнали расходы выше любого посильного месячного сбора; часть подписчиков получала счета в несколько раз больше привычных. Uber, по имеющимся данным, израсходовал весь годовой ИИ-бюджет на 2026 год всего за четыре месяца, во многом из-за инструментов агентного программирования, и операционный директор компании усомнился, оправдывают ли результаты такие траты. На фоне этой переоценки Linux Foundation при поддержке Google, Microsoft, IBM и Salesforce запустила инициативу по выработке открытых стандартов для учёта стоимости ИИ-токенов — признание того, что у бизнеса пока нет единого способа измерять и контролировать эти расходы.
Бегство к дешёвым и открытым моделям
Из-за этого часть компаний взяла на вооружение инструменты, которые подменяют дорогие передовые модели на более доступные, в том числе на китайские модели с открытым исходным кодом — например, DeepSeek. По данным Wall Street Journal, расходы можно сократить вплоть до 95%, позволяя агентам переключаться между моделями по мере необходимости. «Вам не нужна модель, которая разбирается в квантовой гравитации», — сказал изданию Вишал Мишра, заместитель декана Колумбийского университета. «Эти модели с открытым исходным кодом весьма способны, и возможность брать большую наценку за ИИ будет сходить на нет».
Фло Кривелло, основатель Lindy (стартапа, предлагающего ИИ-ассистента для рабочих задач), сообщил WSJ, что компания перешла на DeepSeek V4: модель оказалась не менее способной, чем Sonnet, но обходилась в разы дешевле. Позже Кривелло объявил, что перевёл на DeepSeek V4 весь трафик Lindy, полностью отказавшись от моделей Anthropic: по его словам, это «сэкономило компании миллионы долларов», причём на многих ключевых сценариях производительность даже выросла. Для бизнеса вроде Lindy, где модели работают непрерывно от лица пользователей, оплата вычислений — главная статья расходов; ещё в апреле Кривелло называл её затратой «номер один, причём с большим отрывом — больше, чем фонд оплаты труда».
Разрыв в цене действительно резкий. По оценке аналитиков, прогон полного набора тестов Artificial Analysis Intelligence Index обходится в $1 071 на DeepSeek V4-Pro против $4 811 на Claude Opus 4.7 — более чем вчетверо дешевле. Когда счёт обращений к модели идёт на миллиарды в месяц, такие коэффициенты напрямую превращаются в миллионы долларов годовой экономии.
Другие компании пошли дальше и строят собственный ИИ на базе открытых моделей, адаптируя их под конкретные задачи и дообучая на внутренних данных. На первый взгляд это кажется сложным и дорогим, но в долгосрочной перспективе способно сэкономить средства: не приходится зависеть от сторонних поставщиков. Некоторые даже утверждают, что такие узкоспециализированные модели могут превзойти передовые универсальные разработки именно потому, что заточены под нужды конкретного бизнеса.
Что дальше
Впрочем, не всё так мрачно: с появлением новых моделей и вводом в строй большего числа центров обработки данных стоимость обслуживания существующих систем неизбежно снизится. SemiAnalysis прогнозирует, что обслуживание моделей уровня Opus 4.8 за $20 в месяц вскоре может стать прибыльным. Передовые же системы вроде Mythos по-прежнему будут существенно дороже в эксплуатации, поэтому самые новые и продвинутые возможности, скорее всего, останутся доступны преимущественно через API, корпоративные каналы и оплату по факту использования — то есть за каждый токен придётся платить отдельно.
Доступность дешёвых моделей и ИИ-агентов, оптимизирующих операционные затраты и обращающихся к дорогим вариантам лишь по необходимости, давит на OpenAI и Anthropic, вынуждая их снижать цены. Генеральный директор OpenAI Сэм Альтман уже признавал, что растущая стоимость ИИ-токенов превращается в серьёзную проблему, и заявлял, что компания ищет способы помочь пользователям «получать больше за меньшие деньги» при работе с ChatGPT. Показательно и расстановка сил: компания, теряющая больше всех, вынуждена дешеветь первой, тогда как та, что ближе к прибыльности, диктует условия — классическая жёсткая конкуренция в чистом виде.















