Источник изображения - AMDИсточник изображения - AMD

Китайский суперкомпьютер LineShine занял первое место в 67-й редакции рейтинга TOP500, представленной 23 июня 2026 года на конференции ISC 2026 в Гамбурге. В тесте High Performance Linpack система показала 2,198 экзафлопса, опередив прежнего лидера — машину El Capitan на процессорах и ускорителях AMD — более чем на 20%. LineShine установлен в Национальном суперкомпьютерном центре Шэньчжэня (NSCS) и построен Шэньчжэньским центром облачных вычислений. Главная особенность: система не использует ни графических процессоров, ни каких-либо ускорителей, достигнув результата на 13 789 440 ядрах процессоров отечественной разработки. Это первая в истории рейтинга машина, преодолевшая отметку в два экзафлопса двойной точности исключительно на универсальных процессорах, и пятая в мире система экзафлопсного класса. Кроме того, это первый китайский суперкомпьютер во главе TOP500 с 2017 года, когда лидером был Sunway TaihuLight.

Почему важен не только результат, но и сам факт публикации

То, что страна под санкциями смогла построить экзафлопсный флагман без единого западного ускорителя, само по себе примечательно. Однако ещё показательнее то, что Китай решил заявить эту систему в рейтинг. Долгие годы его самые мощные машины оставались за пределами списка, и решение представить систему-лидера выглядит как намеренная смена тактики. По имеющимся данным, LineShine разрабатывался без государственного финансирования, что снижает политические риски его раскрытия. Полностью отечественная конструкция означает и отсутствие зависимости от западных компонентов, доступ к которым внешние ограничения могли бы перекрыть позднее.

Архитектура: ставка на широкий процессор с памятью HBM

LineShine построен на платформе LingKun, разработанной NSCS. Каждый из 20 480 вычислительных узлов содержит два процессора LX2 — кристаллы на архитектуре Armv9 с 304 ядрами, работающими на частоте 1,55 ГГц и сгруппированными в восемь кластеров по 38 ядер. Каждое ядро располагает блоками Arm Scalable Vector Extension и Arm Scalable Matrix Extension для операций FP64, FP32, BF16, FP16 и INT8. Один такой процессор выдаёт около 60,3 ТФлопс в FP64, до 240 ТФлопс в BF16/FP16 и до 960 ТОПС в INT8, потребляя при этом порядка 690 Вт.

Память устроена нетипично для серверного процессора. Каждый LX2 несёт 32 ГБ встроенной HBM с пропускной способностью до 4 ТБ/с и до 256 ГБ внешней DDR5, причём топология асимметричная: на кристалл приходится несколько областей NUMA со своей HBM и отдельным механизмом переноса данных между HBM и DDR. Такая конфигурация ближе к процессору A64FX от Fujitsu в японском суперкомпьютере Fugaku, чем к классическому серверному решению. Узлы связаны фирменным межсоединением LingQi (1,6 Тбит/с на узел по топологии «толстого дерева»), а работает система под управлением отечественной операционной системы Kylin. Иными словами, отечественным здесь является каждый слой — от кристалла до сети и операционной системы.

Кто сделал процессор LX2

Официально разработчик LX2 не назван — NSCS не раскрывает производителя. Однако аналитики Jon Peddie Research приписывают чип Huawei, а ряд изданий уточняет, что кристалл создан при участии подразделения HiSilicon; пилотная фаза проекта, по сообщениям, проходила на серверах Huawei Kunpeng. Техпроцесс и фабрика тоже не подтверждены. Поскольку доступ к EUV-литографии и мощностям TSMC закрыт, наиболее очевидным кандидатом выглядит 7-нм техпроцесс SMIC, но документального подтверждения этому нет.

Где система действительно сильна, а где — нет

LineShine занял первое место и в тесте HPCG, который оценивает производительность в задачах с интенсивным обменом данными, более приближенных к реальным научным расчётам, показав 22,00 петафлопса (для сравнения: El Capitan — 17,41, Fugaku — 16,00). Дополнительно система демонстрирует параллельную эффективность около 80% от теоретического пика — выше, чем у всех трёх американских экзафлопсных машин, которые удерживают 50–65%. Это говорит о том, что широкий процессор с HBM хорошо масштабируется под классические вычисления двойной точности.

А вот в тесте HPL-MxP, который имитирует математику обучения искусственного интеллекта в смешанной точности, LineShine занял лишь четвёртое место с результатом 7,92 экзафлопса — это всего в 3,6 раза выше его показателя FP64. Системы с ускорителями, которые он обошёл в Linpack, при снижении точности резко вырываются вперёд: El Capitan показывает 16,7 экзафлопса (прирост 9,2×), Aurora — 11,6 (11,5×), Frontier — 11,4 (8,4×). Производительность при пониженной точности — именно та область, где графические процессоры и APU превосходят универсальные процессоры, и компенсировать этот разрыв простым наращиванием ядер невозможно.

Похожая картина и в энергопотреблении. LineShine потребляет 42 220 кВт (около 42 МВт — сопоставимо с потреблением небольшого города), обеспечивая 52,07 гигафлопса на ватт в Linpack. Это лучше показателя Intel Aurora, но уступает 60,94 гигафлопса на ватт у El Capitan. То есть LineShine производит больше вычислений FP64, чем система в Ливерморе, но тратит на это примерно на 42% больше энергии. В рейтинге энергоэффективности Green500 машина расположилась лишь на 50-м месте — самое высокое энергопотребление среди первой десятки TOP500.

Почему корона достаётся именно на FP64

Это различие принципиально, поскольку место в TOP500 определяется по тесту FP64 Linpack — единственному режиму, где широкий процессор с HBM ещё способен конкурировать с ускорителями. LineShine — настоящий чемпион двойной точности, но не лидер в обучении ИИ, и его четвёртое место в HPL-MxP это подтверждает. Корона TOP500 переехала в Шэньчжэнь, но на эталонном тесте, который ведущие западные лаборатории давно не используют для оценки своих самых быстрых систем.

Почему Китай молчал почти десять лет

Китай перестал заявлять свои самые мощные системы в TOP500 примерно в 2021 году, после того как под ограничения попали уханьский центр Sunway и компания Sugon. Специалисты давно предполагали, что страна эксплуатировала экзафлопсное оборудование задолго до этого: преемник Sunway OceanLight и Tianhe-3 от Университета оборонных технологий упоминались в научных статьях — лауреатах премии Gordon Bell, но в рейтинге не фигурировали. Сооснователь TOP500 Джек Донгарра не раз говорил, что китайские исследователи ссылались на запрет публиковать данные, и что умолчание было способом не привлекать лишнего внимания, а не следствием отсутствия возможностей. Включение LineShine ломает эту схему: представить систему номер один на полностью отечественной аппаратной базе — значит публично заявить, что внешние ограничения не закрыли тот технологический разрыв, который Китай считал критическим.

Остальная часть рейтинга почти не изменилась

Верхушка списка сменилась, но его основная часть — нет. США сохраняют доминирование: три системы в первой пятёрке — El Capitan (1,809 экзафлопса), Frontier (1,353 экзафлопса) и Aurora (1,012 экзафлопса). Германский JUPITER Booster остаётся первой и единственной европейской экзафлопсной системой с результатом ровно 1,000 экзафлопса. Появление LineShine увеличило число машин, преодолевших порог в один экзафлопс на Linpack, с четырёх до пяти, и впервые системы такого класса работают одновременно в Азии, Северной Америке и Европе.

Процессоры и ускорители AMD по-прежнему лежат в основе большинства ускоренных систем рейтинга. По данным компании, она теперь обеспечивает работу 191 системы в списке — на 11% больше год к году, и это 41% новых систем в текущей редакции. AMD занимает три места в первой десятке — El Capitan, Frontier и недавно развёрнутая HPC7 в итальянской энергетической компании Eni — и обеспечивает более 40% суммарной производительности Linpack первой десятки. По эффективности AMD стоит за 56% систем в первой полусотне Green500. Первые машины на ускорителях Instinct MI355X — две системы Cambridge Zenith в Великобритании — заняли 67-е и 68-е места.

Что всё это значит

Достижение LineShine это не умаляет, тем более что машины не конкурируют за одни и те же задачи. Ускорители AMD MI300A и MI355X создавались под вычисления ИИ в смешанной точности — ту самую область, где LineShine лишь четвёртый, — и западные лаборатории оптимизируют свои системы именно под неё, а не под лидерство в рейтинге FP64. El Capitan, Frontier и Aurora показывают в HPL-MxP результаты в несколько раз выше своих Linpack-показателей благодаря аппаратным блокам, которых у LineShine нет.

Главный итог формулируется так: внешние ограничения не помешали Китаю построить выдающуюся машину для классической науки — расчётов климата и погоды, материаловедения, молекулярной динамики, инженерного моделирования. Но в гонке за вычислениями для обучения ИИ разрыв пока сохраняется, и закрыть его наращиванием числа универсальных ядер не получится — для этого нужны производственные процессы и архитектуры, доступ к которым остаётся ограниченным.