DeepSeek делает решительную ставку на то, чтобы стать самым экономичным выбором для ИИ-агентов. Согласно объявлению на сайте, китайский разработчик окончательно фиксирует цены на свою флагманскую модель DeepSeek V4 Pro на уровне четверти от первоначальной стоимости. Это решение делает постоянной 75-процентную скидку, которая ранее должна была завершиться 31 мая 2026 года в 18:59 МСК.
Источник изображения - Justin Sullivan/Getty Images
Что изменилось в прайс-листе
Как указано на странице тарифов, стоимость DeepSeek V4 Pro теперь составляет от $0,003625 до $0,87 за миллион токенов против прежнего диапазона $0,0145–$3,48. В юанях это 0,025–6 юаней вместо 0,1–24 юаней — конкретная ставка зависит от типа обращения (попадание в кэш входных данных, обычный ввод или вывод).
Решение о бессрочном снижении принято спустя месяц после выпуска линейки V4 Pro и V4 Flash, которые DeepSeek представляла как начало «эры экономичного контекста на 1 миллион токенов». Параллельно компания ещё в апреле срезала стоимость попаданий в кэш входных запросов до 1/10 от стартовой цены — это особенно ощутимо для длинных диалогов и агентских сценариев с повторяющимися префиксами.
Сколько стоят конкуренты
Новые цены DeepSeek заметно ниже, чем у крупнейших западных провайдеров. Для сравнения, стоимость за миллион токенов выглядит так:
- DeepSeek V4 Pro — от $0,003625 до $0,87
- Google Gemini 3.5 Flash — $0,15 на ввод и $0,60 на вывод
- OpenAI GPT-5 — $2,50 на ввод и $10 на вывод
- Anthropic Claude Opus 4.7 — $5 на ввод и $25 на вывод
Иначе говоря, исходящие токены V4 Pro обходятся примерно в 29 раз дешевле Claude Opus 4.7 и в 11,5 раза дешевле GPT-5. Даже против бюджетной Gemini 3.5 Flash китайская модель выглядит привлекательно — с учётом контекстного окна на 1 миллион токенов это критично для анализа документов, юридического разбора и работы с большими кодовыми базами.
Почему DeepSeek смогла так сильно снизить цены
Компания напрямую не раскрыла причины перехода скидки в разряд постоянных, но рынок уверенно связывает решение с инфраструктурой. Линейка V4 стала первой крупной серией DeepSeek, изначально оптимизированной под Huawei Ascend, а не Nvidia. Рост поставок ускорителей Ascend 950 и 950PR позволяет наращивать мощности без зависимости от американских GPU, закрытых санкциями.
По отраслевым оценкам, Huawei рассчитывает отгрузить около 750 000 ИИ-ускорителей в 2026 году — в 2,5 раза больше прошлогоднего выпуска чипов 910C. При запуске V4 в апреле DeepSeek прямо предупреждала: версия Pro дороже Flash почти в 12 раз именно из-за «ограничений в высокопроизводительных вычислительных мощностях», а заметное снижение цен обещали лишь во втором полугодии — после массовых поставок Ascend 950. Постоянная скидка пришла на несколько месяцев раньше намеченного срока, и это воспринимается как сигнал уверенности в стабильности китайской цепочки поставок.
Удар по западным разработчикам ИИ
Глубокий демпинг DeepSeek обернётся весомой экономией для корпоративных клиентов и активных разработчиков, прогоняющих через ИИ миллионы токенов ежедневно. По мере того как компании начнут перенаправлять задачи попроще на дешёвый V4 Pro, оставляя Claude или GPT-5 только для сложных рассуждений, выручка западных провайдеров за токен может ощутимо просесть — даже при сохранении общего объёма запросов.
Ценовое давление со стороны DeepSeek неизбежно обострит отношения с Anthropic. В феврале 2026 года американская компания публично обвинила DeepSeek, MiniMax и Moonshot AI в «дистилляционных атаках»: по данным Anthropic, китайские лаборатории создали более 24 000 фиктивных аккаунтов и сгенерировали свыше 16 миллионов обменов с Claude — чтобы натренировать собственные модели агентскому рассуждению, использованию инструментов и программированию. Отдельно Anthropic насчитала около 150 000 целевых обращений именно со стороны DeepSeek, сфокусированных на логике и обходе встроенных в Claude ограничений.
На фоне этих разногласий уход цен V4 Pro вниз выглядит не просто маркетинговым ходом, а частью более широкой стратегии: захватить разработчиков, пока санкции и ограничения экспорта чипов сужают пространство для манёвра у американских лабораторий, а ужесточающиеся лимиты Claude и Gemini вытесняют пользователей в поиск альтернатив.












