Оптические межсоединения позволят объединять ресурсы дата-центров на расстоянии в тысячи километров
Представлено когерентное оптическое решение Colorz 1600 на 1.6 Тбит/с с 2-нм DSP — для связи между ЦОД
Главная идея: оптика проникнет внутрь серверов, разделив процессоры, ускорители и память на отдельные пулы
Переход на оптику расширит масштаб систем со 144 ускорителей до тысячи и более
Пока операторы гипермасштаба наперегонки расширяются на фоне растущего спроса на ИИ-дата-центры, на втором дне Computex 2026 прозвучало развёрнутое видение будущего оптических межсоединений. Технически такое решение позволяет объединять ресурсы отдельных ЦОД, разнесённых на тысячи километров. Ключевой доклад под названием «Будущее масштабирования ИИ зависит от связности» представил генеральный директор компании-производителя сетевых и накопительных чипов — и тезис был прямым: следующим узким местом инфраструктуры станет именно связность.
Источник изображения — Marvell
Оптические межсоединения постепенно внедряются по всей отрасли — как на коротких, так и на длинных дистанциях, — и в будущем их станет гораздо больше. Глава компании выстроил всё выступление вокруг одной мысли: за последнее десятилетие узкие места ИИ-инфраструктуры менялись по очереди. Сначала им были вычисления — именно они вывели рыночную капитализацию ведущего производителя ускорителей на отметку в триллионы долларов. Затем узким местом стала память. Следующим, по его убеждению, станет связность.
«Представьте себе дата-центры будущего — глобально и оптически связанную инфраструктуру данных. Те жёсткие границы, которые существуют сегодня, и системы, которые у нас есть, начинают исчезать. Вычисления теперь можно объединять в пулы, память можно объединять в пулы, а инфраструктуру — динамически собирать в нужном масштабе».
Кластеры перерастают границы одного ЦОД
Рабочие нагрузки больше не помещаются в рамках одного дата-центра, поэтому операторы гипермасштаба всё чаще вынуждены строить целые кампусы из нескольких ЦОД, соединённых высокоскоростными линиями. Кластеры становятся крупнее, чем отдельно взятый дата-центр.
Сегодня соединить несколько ЦОД в пределах одного кампуса непросто и недёшево, но относительно прямолинейно. Однако в будущем, как ожидается, потребуется связывать дата-центры, разнесённые на значительные расстояния. Именно поэтому ставка делается на технологии когерентной оптики и масштабирования на большие дистанции — они позволят соединять ЦОД, разделённые тысячами километров.
Для этой задачи уже есть готовый продукт — Colorz 1600, когерентное оптическое решение на 1.6 Тбит/с на базе 2-нм DSP, предназначенное для межсоединений между ЦОД. В его основе — кремниевая фотоника уже четвёртого поколения. Образцы должны появиться к концу года.
Для разных дистанций нужны принципиально разные инженерные решения. Самая длинная — это связь между дата-центрами, от сотен до тысяч километров; здесь требуется когерентная модуляция и когерентные DSP. Внутри самого ЦОД дистанции доходят примерно до 500 метров — тут работает оптика с модуляцией PAM4, которая лучше оптимизирована по энергопотреблению. А вот на уровне scale-up, где расстояния составляют от 2.5 до 7 метров, пока царит медь: используются медные SerDes, растянутые настолько, насколько это физически возможно.
Линейка решений и коммутатор на 102.4 Тбит/с
Помимо Colorz, анонсировано семейство интерконнект-решений Ara 1.6 Тбит/с для ЦОД на 3-нм DSP, а также Ethernet-коммутатор Teralynx T100 с пропускной способностью 102.4 Тбит/с. Он поддерживает 512 портов по 200 Гбит/с либо 64 порта по 1.6 Тбит/с.
T100 — это монолитный чип на передовом 3-нм техпроцессе, и заявлен он как первый в отрасли коммутатор такого класса, спроектированный именно под эпоху ИИ, без «наследия» прежних корпоративных и облачных архитектур. По заявлению производителя, он потребляет менее 1000 Вт при типовой нагрузке и расходует до 25% меньше энергии, чем конкурирующие решения, при меньшей задержке. Вопрос энергоэффективности здесь не косметический: стойки с ускорителями приближаются к 120 кВт, и каждая неэффективность сети оборачивается простаивающими ускорителями и удорожанием обучения. Чип начинает поставляться образцами уже в текущем квартале и будет доступен в нескольких вариантах корпусировки — включая стандартный BGA, со-упакованную медь и со-упакованную оптику (CPO).
Источник изображения — Marvell
«Медная стена» и почему она сдвигается
Сегодняшние архитектуры ограничены расстоянием из-за медных соединений. Процессоры располагают рядом с памятью, потому что важна задержка; ускорители — рядом с памятью, потому что важна пропускная способность. В результате рабочие нагрузки приходится дробить в соответствии с этими физическими ограничениями. Но как только оптические межсоединения проникнут в связи масштабирования (scale-up), эти домены перестанут быть привязанными к длине медного кабеля — и ограничения начнут растворяться.
На стыке меди и оптики лежит так называемая «медная стена» — максимальная дистанция, на которой медь ещё остаётся жизнеспособной. За её пределами начинается оптика: дороже и сложнее. Но стена сдвигается. Поколение 200 Гбит/с на линию, по оценке докладчика, станет последним, где меди ещё хватает; дальше связность на уровне стойки неизбежно уйдёт в оптику, потому что нужные скорости медь на требуемых длинах уже не вытянет. И каждый раз, когда стена смещается вправо, число оптических соединений вырастает на порядок.
Главным технологическим «включателем» этого перехода станет со-упакованная оптика (CPO). Прежние оптические модули для этого не годятся — не хватит ни мощности, ни места; оптику придётся выносить прямо на корпус чипа. На сцене для наглядности показали традиционный коммутатор и его CPO-аналог: второй оказался кардинально компактнее — помимо самого коммутирующего кристалла в центре, под оптические соединения уходит минимум пространства.
Сегодня решения для scale-up ИИ соединяются медными проводами, а для связей scale-out обычно применяют оптику. По мере роста числа ускорителей в scale-up-системах им тоже придётся переходить на оптические линии. Это означает, что практически все межсоединения уровня ЦОД станут оптическими — и разработчикам оборудования, вероятно, придётся переосмыслить саму архитектуру дата-центров.
Дата-центр без расстояний: разборка на пулы
Видение будущего выглядит так. Сначала оптика расширит домены scale-up со 144 ускорителей до тысячи и более. Затем оптические соединения проникнут уже внутрь самих серверов. Это позволит разнести процессоры, ускорители (их обозначают термином XPU) и память по отдельным пулам — ведь расстояние перестанет иметь значение, а значит, вырастут гибкость конфигурации и утилизация оборудования.
«Это дата-центр без расстояния, где вычисления, память, сети и фотоника работают как единая система, где миллионы ресурсов по всему ЦОД могут взаимодействовать так, словно они одна машина».
Учитывая, что операторы гипермасштаба разворачивают оборудование на миллиарды долларов, даже прирост утилизации на 10% оборачивается колоссальной экономией — и крупнейшие игроки рынка ускорителей это прекрасно видят.
«В нынешних системах соотношение процессоров и XPU зафиксировано, оно задаётся ещё на этапе сборки и развёртывания. Но не существует двух рабочих нагрузок, которым нужна была бы абсолютно одинаковая пропорция. Представьте полностью разобранную архитектуру: XPU в одной системе, память в другой, универсальные процессоры в третьей».
Сегодня компания покупает готовую систему и получает жёстко зафиксированное соотношение процессоров, ускорителей и памяти — эффективное для одних задач и расточительное для других. В будущем оператор сможет собирать виртуальную машину из общих пулов под конкретный тип нагрузки. Если задаче нужно больше памяти, чем вычислений, сегодня нередко приходится докупать ускорители только ради дополнительной памяти HBM; завтра, если видение сбудется, можно будет взять просто память.
«Как только мы разложим систему на отдельные пулы вычислений и памяти и свяжем их оптикой, мы сможем собирать специализированные системы на лету — оптимизированные под конкретную нагрузку. Впервые архитекторы смогут проектировать ИИ-системы исходя из потребностей модели, а не из ограничений интерконнекта».
Два видения, которые не обязаны пересекаться
Здесь важна оговорка. Технологии для связи ЦОД на тысячи километров и технологии для объединения ресурсов в пулы — это не одно и то же, и пересекаться они не обязаны. Дата-центры, разнесённые на тысячи километров, не смогут совместно использовать ресурсы в реальном времени: путь света туда-обратно на 1000 км занимает около 10 мс, что делает удалённое совместное использование ресурсов неэффективным с точки зрения задержки.
Зато такие технологии позволяют операторам гипермасштаба синхронизировать ИИ-кампусы, обращаться к распределённым хранилищам, реплицировать данные и выполнять прочие операции, нечувствительные к задержке. И именно межконтинентальная синхронизация ИИ-кампусов в течение нескольких часов может оказаться той самой «убойной возможностью», ради которой всё это и строится.
Контекст: ставка на инфраструктуру данных
Чтобы оценить вес этих заявлений, стоит держать в голове масштаб трансформации самой компании. Десятилетие назад на дата-центры приходилось менее 10% её выручки; сегодня этот сегмент даёт уже около 75% и продолжает расти. Путь сюда стоил порядка $36 млрд инвестиций в платформу инфраструктуры данных — через собственные разработки и серию поглощений, включая недавние покупки активов в области фотоники и коммутации для scale-up. Параллельно компания перешла от роли «догоняющего» по техпроцессам к работе на передовых нормах, перепрыгнув сразу несколько поколений ради выхода на 5 нм.
Отдельный сигнал рынку — присутствие на сцене главы крупнейшего производителя ускорителей, чья компания ранее вложила в докладчика около $2 млрд и сделала его партнёром по своей технологии связывания чипов. Совместная логика проста: масштабировать медью, пока возможно, затем — оптикой, и связывать всё вместе тоже оптикой. «Оптика там, где обязаны; медь там, где можем». По сути, обе стороны ставят на один и тот же неизбежный переход — просто с разных концов цепочки.













