Процессоры снова в центре внимания: Почему CPU становится критическим компонентом ИИ-инфраструктуры

Развитие искусственного интеллекта не показывает признаков замедления и временами напоминает золотую лихорадку. Слух о новом дефицитном ресурсе мгновенно расходится по отрасли — и вот уже наблюдается всплеск спроса, когда все бросаются скупать всё доступное. Бо́льшую часть эпохи ChatGPT раздобыть видеокарту (GPU) для дата-центра было практически невозможно: спрос был настолько высок, что Nvidia фактически вела собственный лист ожидания.

Источник изображения - Getty Images / I-Hwa Cheng

Основное внимание прессы — и львиная доля инвестиций — долгое время были прикованы к гонке за как можно бо́льшим количеством GPU. Совсем недавно в центр внимания попала ещё и оперативная память: её дефицит уже начал сказываться на ценах потребительских комплектующих.

Но в последние недели и месяцы всё чаще звучит вопрос о том, справляются ли с этими задачами центральные процессоры. Десятилетиями центральный процессор (CPU) оставался незаметной рабочей лошадкой аппаратного стека: запускал операционную систему, распределял задачи, поддерживал систему в рабочем состоянии — и попадал в новости разве что при дефиците или резком скачке производительности между поколениями.

И вдруг о нём заговорили в том же ключе, что и о дефицитных GPU. Что же происходит?

Невидимая основа, на которой держится весь ИИ

«Массовое развёртывание ИИ заставило компании присмотреться к инфраструктуре, скрытой за всей этой шумихой», — отмечает Джейсон Беккет, технический директор подразделения Hitachi Vantara в регионе EMEA. По его словам, всё внимание достаётся GPU, потому что именно они исполняют ИИ-модели, однако CPU не менее важны, ведь на них держится «всё остальное».

По мере того как агентный ИИ (системы, способные самостоятельно выполнять многошаговые задачи) становится нормой, растёт и потребность в прочном процессорном фундаменте. «Постоянно активные системы многошаговых рассуждений не создают коротких всплесков нагрузки вокруг вычислений на GPU. Им нужны многоядерные процессоры, непрерывно работающие под устойчивой нагрузкой, — поясняет Беккет. — Требования к инфраструктуре всегда были структурными. Просто теперь их уже не получится игнорировать».

Почему чат-ботам хватало GPU, а агентам — нет

Когда на заре революции генеративного ИИ проектировались дата-центры под обучение и работу моделей, разработчики закладывали огромный перекос в пользу GPU. Для общения с чат-ботом требовалось от четырёх до восьми GPU на каждый CPU: параллельные вычисления, необходимые для обработки пользовательских запросов, ложились в первую очередь на видеокарты.

Но когда главный сценарий использования ИИ сместился от чат-ботов к агентам, изменились и требования. Небольшая задержка, пока модель «думает» над глубоким ответом, прежде считалась приемлемой. Однако агентному ИИ нужны быстрые ответы, плавная координация вызовов внешних инструментов и многое другое — и здесь задержка становится фатальной. Наращивание числа процессоров помогает избежать сбоев, которые иначе быстро разрастаются и обрушивают весь агентный стек.

Компания AMD, один из крупнейших производителей процессоров, наблюдает этот сдвиг воочию. Раньше она прогнозировала рост рынка серверных CPU примерно на 18% в год, но утверждает, что изменение требований кардинально перекроило рынок. По оценке AMD, темпы роста удвоились до 35% в год, и к 2030 году объём рынка превысит $120 млрд. Эти цифры озвучила глава компании Лиза Су на отчётном звонке за первый квартал 2026 года, отметив, что по итогам квартала выручка датацентрового подразделения AMD достигла $5,8 млрд (рост на 57% год к году), а продажи серверных процессоров выросли более чем на 50%.

Источник изображения - AMD

«Результаты AMD и Arm говорят о том, что этот спрос структурный, а не циклический, — отмечает Роджер Каммингс, генеральный директор PEAK:AIO. — По сути, рост спроса подстёгивают два структурных сдвига: подъём агентного ИИ и потребность в детерминированной, предсказуемой производительности на уровне стоек».

91% задержки приходится на процессор

Значительную часть спроса на CPU формируют гиперскейлеры — крупнейшие облачные операторы, которые осознали ключевую роль процессоров в построении ИИ-кластеров, способных в ближайшие годы питать целые отрасли экономики. «По мере масштабирования GPU-кластеров процессоры берут на себя всё более крупные роли: оркестровку, управление памятью, работу с сетью, координацию хранения данных и обработку части вычислений», — поясняет Джефф Мур, вице-президент по стратегическому партнёрству в Aegis Cooling, которая специализируется на жидкостном охлаждении для ИИ- и высокопроизводительной (HPC) инфраструктуры.

Соотношение CPU к GPU внутри ИИ-развёртываний растёт, отмечает Мур, «особенно потому, что распределённые ИИ-нагрузки создают серьёзный спрос на универсальные вычисления, пропускную способность памяти и перемещение данных внутри дата-центра». Недавний анализ TrendForce показывает: на процессоры приходится почти 91% всех задержек в ответах ИИ-систем — именно с этим узким местом разработчики отчаянно пытаются бороться.

Источник изображения - Nvidia

«Очень быстрый, очень глупый двигатель»

Этот сдвиг теперь заметен не только в финансовых прогнозах, но и в самом устройстве ИИ-инфраструктуры. В ранних развёртываниях генеративного ИИ стойки строились вокруг плотных конфигураций GPU, а CPU считались вспомогательными — достаточными, чтобы система работала, но не критичными. Сейчас всё иначе. «В СМИ ИИ-стойку изображают как гигантский ящик, набитый GPU, — говорит Хоммер Чжао, основатель OurPCB, производителя печатных плат с более чем 15-летним опытом. — Но с точки зрения проектирования железа GPU — это просто очень быстрый и очень глупый двигатель. Он не умеет общаться с интернетом и не может сам достать данные с накопителя».

Вместо одного хост-процессора, слабо связанного с несколькими GPU, гиперскейлеры теперь разворачивают конфигурации с процессорами, у которых больше ядер, больше каналов памяти, а порой и по нескольку CPU на узел — чтобы поспевать за объёмами перемещаемых данных.

Свою роль в компоновке стоек играют и тепловые, и энергетические соображения. Многоядерные процессоры, особенно оптимизированные под облачные нагрузки, выбирают не только за чистую производительность, но и за энергоэффективность при постоянной нагрузке. В системах с жидкостным охлаждением CPU всё чаще попадают в тот же тепловой контур, что и GPU, а не охлаждаются отдельно воздухом, как раньше.

Arm и заказные чипы: ставка гиперскейлеров

Недавние результаты AMD и Arm подтверждают: это не краткосрочная коррекция, а более глубокий архитектурный сдвиг. AMD отчиталась о сильном росте в сегменте датацентровых CPU — во многом за счёт спроса гиперскейлеров на процессоры EPYC с высоким числом ядер и большой пропускной способностью памяти, хорошо подходящие под задачи оркестровки ИИ. Компания ожидает, что во втором квартале выручка от серверных процессоров вырастет более чем на 70% год к году.

Arm, в свою очередь, выигрывает от того, что гиперскейлеры разрабатывают собственные заказные чипы. «На Arm придётся почти половина всех вычислительных мощностей, поставленных крупнейшим гиперскейлерам в 2025 году — это более миллиарда развёрнутых ядер Neoverse, — говорит Беккет. — Это архитектурные решения уровня стоек, принятые годы назад». Чипы AWS Graviton, Google Axion и Microsoft Cobalt отражают движение к процессорным архитектурам, заточенным под конкретные задачи: высокая пропускная способность, энергоэффективность и тесная интеграция с сетью и хранилищами. Лицензионная модель Arm ставит компанию в центр этого тренда, а её финансовые отчёты показывают, насколько мощным стал спрос со стороны гиперскейлеров.

От взаимозаменяемого железа к специализированному узлу

Оба набора результатов указывают на перемену в том, как теперь оценивают CPU. В традиционном корпоративном мире железо было универсальным и взаимозаменяемым. В среде гиперскейлеров оно превращается в специализированный компонент инфраструктуры, настроенный под конкретные роли в ИИ-системах — будь то оркестровка, вычисления на периферии или предварительная обработка данных.

В совокупности изменения в проектировании стоек и показатели вендоров говорят о том, что CPU больше не второстепенный фактор при планировании ИИ-инфраструктуры. Напротив — они становятся критическим элементом, определяющим и общую эффективность системы, и её стоимость.

«Прожектор не высветил ничего нового, — заключает Беккет. — Он просто наконец-то осветил то, на чём серьёзные инфраструктурные команды никогда и не переставали строить».

Процессоры снова в центре внимания: Почему CPU становится критическим компонентом ИИ-инфраструктуры

Спрос на CPU для ИИ растет вдвое быстрее прогнозов: как эра агентного ИИ меняет баланс сил между процессорами и ускорителями

Невидимая основа, на которой держится весь ИИ

Почему чат-ботам хватало GPU, а агентам — нет

91% задержки приходится на процессор

«Очень быстрый, очень глупый двигатель»

Arm и заказные чипы: ставка гиперскейлеров

От взаимозаменяемого железа к специализированному узлу

Популярное

Новый шедевр художника Hisko Hulsing: анимационный фильм «Danse Macabre», вдохновленный искусством Позднего Средневековья

Baldur's Gate 3: Бонусы и постоянные баффы в игре и Как их получить

Steam Machine: очередь резерваций может растянуться до декабря 2026 года — Valve выпустила CAD-файлы корпуса

Цены на SSD в 2026 году выросли в 3–4 раза: почему дорожают накопители и что брать при сборке ПК

Baldur's Gate 3: Одурманенная лягушка и тайник в Гнилостной трясине

Лучшие материалы

Как правильно расположить роутер и антенны для сильного Wi-Fi дома

Colibrì: как запустить ИИ-модель на 744 млрд параметров всего на 25 ГБ ОЗУ без видеокарты

Midjourney против Голливуда: зачем нейросеть требует раскрыть ИИ-секреты Disney и Warner Bros.

«Электрическая Дейзи» возвращается: культовая сёдзё-манга станет аниме в 2027 году — и да, это снова про загадочного защитника

Razer выпускает гибридный микрофон Seiren V3 Pro для стримеров и подкастеров

Обновление Riven Tides для Arc Raiders: новая карта и массивный враг

Как получить редких маунтов WoW быстрее: упрощённые ачивы и обновлённые рейды — подробный гайд

Activision Blizzard не намерена прекращать разработку серии Crash Bandicoot

Поездка в Америку 2 получит рейтинг PG-13

Процессоры снова в центре внимания: Почему CPU становится критическим компонентом ИИ-инфраструктуры

Спрос на CPU для ИИ растет вдвое быстрее прогнозов: как эра агентного ИИ меняет баланс сил между процессорами и ускорителями

Невидимая основа, на которой держится весь ИИ

Почему чат-ботам хватало GPU, а агентам — нет

91% задержки приходится на процессор

«Очень быстрый, очень глупый двигатель»

Arm и заказные чипы: ставка гиперскейлеров

От взаимозаменяемого железа к специализированному узлу

Запрет соцсетей для подростков в Австралии: первые итоги — более 80% детей всё равно онлайн

ИИ-гонка большой четвёрки: триллион долларов, скрытый долг и рост цен на память и электричество

Amazon переплачивает миллионы из-за неудачных ИИ-проектов

Friend 2.0: ИИ-кулон обзавёлся голосом и подорожал до 249 долларов

Новый шедевр художника Hisko Hulsing: анимационный фильм «Danse Macabre», вдохновленный искусством Позднего Средневековья

Baldur's Gate 3: Бонусы и постоянные баффы в игре и Как их получить

Steam Machine: очередь резерваций может растянуться до декабря 2026 года — Valve выпустила CAD-файлы корпуса

Цены на SSD в 2026 году выросли в 3–4 раза: почему дорожают накопители и что брать при сборке ПК

Baldur's Gate 3: Одурманенная лягушка и тайник в Гнилостной трясине

Как правильно расположить роутер и антенны для сильного Wi-Fi дома

Colibrì: как запустить ИИ-модель на 744 млрд параметров всего на 25 ГБ ОЗУ без видеокарты

Midjourney против Голливуда: зачем нейросеть требует раскрыть ИИ-секреты Disney и Warner Bros.

«Электрическая Дейзи» возвращается: культовая сёдзё-манга станет аниме в 2027 году — и да, это снова про загадочного защитника

Razer выпускает гибридный микрофон Seiren V3 Pro для стримеров и подкастеров

Обновление Riven Tides для Arc Raiders: новая карта и массивный враг

Как получить редких маунтов WoW быстрее: упрощённые ачивы и обновлённые рейды — подробный гайд

Activision Blizzard не намерена прекращать разработку серии Crash Bandicoot

Поездка в Америку 2 получит рейтинг PG-13