Прогнозы роста рынка серверных процессоров для ИИ резко пересмотрены вверх: с 18% до более чем 35% в год, объём рынка к 2030 году превысит $120 млрд
Соотношение CPU к GPU в ИИ-инфраструктуре меняется из-за перехода от чат-ботов к агентному ИИ, где критична низкая задержка
На процессоры приходится около 91% всех задержек в ответах ИИ-систем — это превращает их в ключевой узел для оптимизации
Гиперскейлеры массово переходят на специализированные процессорные архитектуры Arm, на которые в 2025 году пришлась почти половина всех поставок вычислительных мощностей крупнейшим облачным провайдерам
Развитие искусственного интеллекта не показывает признаков замедления и временами напоминает золотую лихорадку. Слух о новом дефицитном ресурсе мгновенно расходится по отрасли — и вот уже наблюдается всплеск спроса, когда все бросаются скупать всё доступное. Бо́льшую часть эпохи ChatGPT раздобыть видеокарту (GPU) для дата-центра было практически невозможно: спрос был настолько высок, что Nvidia фактически вела собственный лист ожидания.
Источник изображения - Getty Images / I-Hwa Cheng
Основное внимание прессы — и львиная доля инвестиций — долгое время были прикованы к гонке за как можно бо́льшим количеством GPU. Совсем недавно в центр внимания попала ещё и оперативная память: её дефицит уже начал сказываться на ценах потребительских комплектующих.
Но в последние недели и месяцы всё чаще звучит вопрос о том, справляются ли с этими задачами центральные процессоры. Десятилетиями центральный процессор (CPU) оставался незаметной рабочей лошадкой аппаратного стека: запускал операционную систему, распределял задачи, поддерживал систему в рабочем состоянии — и попадал в новости разве что при дефиците или резком скачке производительности между поколениями.
И вдруг о нём заговорили в том же ключе, что и о дефицитных GPU. Что же происходит?
Невидимая основа, на которой держится весь ИИ
«Массовое развёртывание ИИ заставило компании присмотреться к инфраструктуре, скрытой за всей этой шумихой», — отмечает Джейсон Беккет, технический директор подразделения Hitachi Vantara в регионе EMEA. По его словам, всё внимание достаётся GPU, потому что именно они исполняют ИИ-модели, однако CPU не менее важны, ведь на них держится «всё остальное».
По мере того как агентный ИИ (системы, способные самостоятельно выполнять многошаговые задачи) становится нормой, растёт и потребность в прочном процессорном фундаменте. «Постоянно активные системы многошаговых рассуждений не создают коротких всплесков нагрузки вокруг вычислений на GPU. Им нужны многоядерные процессоры, непрерывно работающие под устойчивой нагрузкой, — поясняет Беккет. — Требования к инфраструктуре всегда были структурными. Просто теперь их уже не получится игнорировать».
Почему чат-ботам хватало GPU, а агентам — нет
Когда на заре революции генеративного ИИ проектировались дата-центры под обучение и работу моделей, разработчики закладывали огромный перекос в пользу GPU. Для общения с чат-ботом требовалось от четырёх до восьми GPU на каждый CPU: параллельные вычисления, необходимые для обработки пользовательских запросов, ложились в первую очередь на видеокарты.
Но когда главный сценарий использования ИИ сместился от чат-ботов к агентам, изменились и требования. Небольшая задержка, пока модель «думает» над глубоким ответом, прежде считалась приемлемой. Однако агентному ИИ нужны быстрые ответы, плавная координация вызовов внешних инструментов и многое другое — и здесь задержка становится фатальной. Наращивание числа процессоров помогает избежать сбоев, которые иначе быстро разрастаются и обрушивают весь агентный стек.
Компания AMD, один из крупнейших производителей процессоров, наблюдает этот сдвиг воочию. Раньше она прогнозировала рост рынка серверных CPU примерно на 18% в год, но утверждает, что изменение требований кардинально перекроило рынок. По оценке AMD, темпы роста удвоились до 35% в год, и к 2030 году объём рынка превысит $120 млрд. Эти цифры озвучила глава компании Лиза Су на отчётном звонке за первый квартал 2026 года, отметив, что по итогам квартала выручка датацентрового подразделения AMD достигла $5,8 млрд (рост на 57% год к году), а продажи серверных процессоров выросли более чем на 50%.
«Результаты AMD и Arm говорят о том, что этот спрос структурный, а не циклический, — отмечает Роджер Каммингс, генеральный директор PEAK:AIO. — По сути, рост спроса подстёгивают два структурных сдвига: подъём агентного ИИ и потребность в детерминированной, предсказуемой производительности на уровне стоек».
91% задержки приходится на процессор
Значительную часть спроса на CPU формируют гиперскейлеры — крупнейшие облачные операторы, которые осознали ключевую роль процессоров в построении ИИ-кластеров, способных в ближайшие годы питать целые отрасли экономики. «По мере масштабирования GPU-кластеров процессоры берут на себя всё более крупные роли: оркестровку, управление памятью, работу с сетью, координацию хранения данных и обработку части вычислений», — поясняет Джефф Мур, вице-президент по стратегическому партнёрству в Aegis Cooling, которая специализируется на жидкостном охлаждении для ИИ- и высокопроизводительной (HPC) инфраструктуры.
Соотношение CPU к GPU внутри ИИ-развёртываний растёт, отмечает Мур, «особенно потому, что распределённые ИИ-нагрузки создают серьёзный спрос на универсальные вычисления, пропускную способность памяти и перемещение данных внутри дата-центра». Недавний анализ TrendForce показывает: на процессоры приходится почти 91% всех задержек в ответах ИИ-систем — именно с этим узким местом разработчики отчаянно пытаются бороться.
«Очень быстрый, очень глупый двигатель»
Этот сдвиг теперь заметен не только в финансовых прогнозах, но и в самом устройстве ИИ-инфраструктуры. В ранних развёртываниях генеративного ИИ стойки строились вокруг плотных конфигураций GPU, а CPU считались вспомогательными — достаточными, чтобы система работала, но не критичными. Сейчас всё иначе. «В СМИ ИИ-стойку изображают как гигантский ящик, набитый GPU, — говорит Хоммер Чжао, основатель OurPCB, производителя печатных плат с более чем 15-летним опытом. — Но с точки зрения проектирования железа GPU — это просто очень быстрый и очень глупый двигатель. Он не умеет общаться с интернетом и не может сам достать данные с накопителя».
Вместо одного хост-процессора, слабо связанного с несколькими GPU, гиперскейлеры теперь разворачивают конфигурации с процессорами, у которых больше ядер, больше каналов памяти, а порой и по нескольку CPU на узел — чтобы поспевать за объёмами перемещаемых данных.
Свою роль в компоновке стоек играют и тепловые, и энергетические соображения. Многоядерные процессоры, особенно оптимизированные под облачные нагрузки, выбирают не только за чистую производительность, но и за энергоэффективность при постоянной нагрузке. В системах с жидкостным охлаждением CPU всё чаще попадают в тот же тепловой контур, что и GPU, а не охлаждаются отдельно воздухом, как раньше.
Arm и заказные чипы: ставка гиперскейлеров
Недавние результаты AMD и Arm подтверждают: это не краткосрочная коррекция, а более глубокий архитектурный сдвиг. AMD отчиталась о сильном росте в сегменте датацентровых CPU — во многом за счёт спроса гиперскейлеров на процессоры EPYC с высоким числом ядер и большой пропускной способностью памяти, хорошо подходящие под задачи оркестровки ИИ. Компания ожидает, что во втором квартале выручка от серверных процессоров вырастет более чем на 70% год к году.
Arm, в свою очередь, выигрывает от того, что гиперскейлеры разрабатывают собственные заказные чипы. «На Arm придётся почти половина всех вычислительных мощностей, поставленных крупнейшим гиперскейлерам в 2025 году — это более миллиарда развёрнутых ядер Neoverse, — говорит Беккет. — Это архитектурные решения уровня стоек, принятые годы назад». Чипы AWS Graviton, Google Axion и Microsoft Cobalt отражают движение к процессорным архитектурам, заточенным под конкретные задачи: высокая пропускная способность, энергоэффективность и тесная интеграция с сетью и хранилищами. Лицензионная модель Arm ставит компанию в центр этого тренда, а её финансовые отчёты показывают, насколько мощным стал спрос со стороны гиперскейлеров.
От взаимозаменяемого железа к специализированному узлу
Оба набора результатов указывают на перемену в том, как теперь оценивают CPU. В традиционном корпоративном мире железо было универсальным и взаимозаменяемым. В среде гиперскейлеров оно превращается в специализированный компонент инфраструктуры, настроенный под конкретные роли в ИИ-системах — будь то оркестровка, вычисления на периферии или предварительная обработка данных.
В совокупности изменения в проектировании стоек и показатели вендоров говорят о том, что CPU больше не второстепенный фактор при планировании ИИ-инфраструктуры. Напротив — они становятся критическим элементом, определяющим и общую эффективность системы, и её стоимость.
«Прожектор не высветил ничего нового, — заключает Беккет. — Он просто наконец-то осветил то, на чём серьёзные инфраструктурные команды никогда и не переставали строить».




















