NEC SX-Aurora TSUBASA: различия между версиями
Строка 15: | Строка 15: | ||
На сервере, поставляемом NEC может размещаться до восьми VE, кластеры VH могут масштабироваться до произвольного количества узлов. | На сервере, поставляемом NEC может размещаться до восьми VE, кластеры VH могут масштабироваться до произвольного количества узлов. | ||
+ | |||
+ | По состоянию на 2023 год были разработаны и выпущены на рынок следующие версии TSUBASA: | ||
+ | |||
+ | '''Version 1 Vector Engine''' | ||
+ | |||
+ | Версия 1.0 Vector Engine была произведена по 16-нм техпроцессу [[FinFET]] (от [[TSMC]]) и выпущена в трех основных версиях продукта (в доработанных версиях добавляется буква E в конце): | ||
+ | {| class="wikitable" | ||
+ | |+ | ||
+ | !SKU | ||
+ | !10A | ||
+ | !10B | ||
+ | !10C | ||
+ | !10AE | ||
+ | !10BE | ||
+ | !10CE | ||
+ | |- | ||
+ | |Частота процессора Ггц | ||
+ | |1.6 | ||
+ | |1.4 | ||
+ | |1.4 | ||
+ | |1.584 | ||
+ | |1.408 | ||
+ | |1.400 | ||
+ | |- | ||
+ | |Число векторных ядер в процессоре | ||
+ | |8 | ||
+ | |8 | ||
+ | |8 | ||
+ | |8 | ||
+ | |8 | ||
+ | |8 | ||
+ | |- | ||
+ | |Пиковая производительность ядра | ||
+ | (double precision GFLOPS) | ||
+ | |307.2 | ||
+ | |268.8 | ||
+ | |268.8 | ||
+ | |304 | ||
+ | |270 | ||
+ | |268 | ||
+ | |- | ||
+ | |Пиковая производительность ядра | ||
+ | (single precision GFLOPS) | ||
+ | | | ||
+ | |537 | ||
+ | | | ||
+ | |608 | ||
+ | |540 | ||
+ | |537 | ||
+ | |- | ||
+ | |Пиковая производительность процессора | ||
+ | (double precision TFLOPS) | ||
+ | |2.45 | ||
+ | |2.15 | ||
+ | |2.15 | ||
+ | |2.43 | ||
+ | |2.16 | ||
+ | |2.15 | ||
+ | |- | ||
+ | |Пиковая производительность процессора | ||
+ | (single precision TFLOPS) | ||
+ | |4.9 | ||
+ | |4.3 | ||
+ | |4.3 | ||
+ | |4.86 | ||
+ | |4.32 | ||
+ | |4.30 | ||
+ | |- | ||
+ | |Пропускная способность памяти (ТБ/с) | ||
+ | |1.2 | ||
+ | |1.2 | ||
+ | |0.75 | ||
+ | |1.35 | ||
+ | |1.35 | ||
+ | |1.00 | ||
+ | |- | ||
+ | |Ёмкость памяти (Гб) | ||
+ | |48 | ||
+ | |48 | ||
+ | |24 | ||
+ | |48 | ||
+ | |48 | ||
+ | |24 | ||
+ | |} | ||
+ | '''Version 2 Vector Engine''' | ||
+ | |||
+ | Была выпущена в двух вариантах | ||
+ | {| class="wikitable" | ||
+ | |+ | ||
+ | !SKU | ||
+ | !20A | ||
+ | !20B | ||
+ | |- | ||
+ | |Частота процессора Ггц | ||
+ | |1.6 | ||
+ | |1.6 | ||
+ | |- | ||
+ | |Число векторных ядер в процессоре | ||
+ | |10 | ||
+ | |8 | ||
+ | |- | ||
+ | |Пиковая производительность ядра | ||
+ | (double precision GFLOPS) | ||
+ | |307 | ||
+ | |307 | ||
+ | |- | ||
+ | |Пиковая производительность ядра | ||
+ | (single precision GFLOPS) | ||
+ | |614 | ||
+ | |614 | ||
+ | |- | ||
+ | |Пиковая производительность процессора | ||
+ | (double precision TFLOPS) | ||
+ | |3.07 | ||
+ | |2.45 | ||
+ | |- | ||
+ | |Пиковая производительность процессора | ||
+ | (single precision TFLOPS) | ||
+ | |6.14 | ||
+ | |4.91 | ||
+ | |- | ||
+ | |Пропускная способность памяти (ТБ/с) | ||
+ | |1.53 | ||
+ | |1.53 | ||
+ | |- | ||
+ | |Ёмкость памяти (Гб) | ||
+ | |48 | ||
+ | |48 | ||
+ | |} | ||
+ | '''Version 3 Vector Engine''' | ||
== Примечания == | == Примечания == |
Версия от 22:39, 18 ноября 2023
NEC SX-Aurora TSUBASA — векторный процессор семейства NEC SX[1][2]. В отличие от предыдущих суперкомпьютеров этого семейства, SX-Aurora TSUBASA поставляется в виде карты PCIe, называемой NEC «Vector Engine» (VE). Восемь карт Vector Engine можно вставить в векторный хост (VH), который обычно представляет собой сервер x86-64 под управлением операционной системы Linux.
О продукте было объявлено в пресс-релизе 25 октября 2017 года, а начало продаж состоялось в феврале 2018 года.
Модель NEC SX-Aurora TSUBASA пришла на смену SX-ACE.
Оборудование
SX-Aurora TSUBASA является преемником серий NEC SX и SUPER-UX, векторных компьютерных систем, на которых основан суперкомпьютер Earth Simulator.
Его аппаратное обеспечение состоит из хостов Linux x86 с векторными движками (VE), подключенными через соединение PCI Express (PCIe).
Высокая пропускная способность памяти (0,75–1,2 ТБ/с) обеспечивается за счет восьми ядер и шести модулей памяти HBM2, объединённых на кремниевом интерпозере, оформленном в форм-факторе карты PCIe полной длины, полной высоты и двойной ширины. Функциональность операционной системы для VE переносится на VH и обрабатывается в основном демонами пользовательского пространства, на которых работает VEOS.
В зависимости от тактовой частоты (1,4 или 1,6 ГГц) каждый процессор VE имеет восемь ядер и пиковую производительность 2,15 или 2,45 терафлопс при вычислениях с двойной точностью. Процессор впервые в мире оснащен шестью модулями HBM2 на кремниевом интерпозере с общим объемом памяти 24 или 48 ГБ с высокой пропускной способностью.
На сервере, поставляемом NEC может размещаться до восьми VE, кластеры VH могут масштабироваться до произвольного количества узлов.
По состоянию на 2023 год были разработаны и выпущены на рынок следующие версии TSUBASA:
Version 1 Vector Engine
Версия 1.0 Vector Engine была произведена по 16-нм техпроцессу FinFET (от TSMC) и выпущена в трех основных версиях продукта (в доработанных версиях добавляется буква E в конце):
SKU | 10A | 10B | 10C | 10AE | 10BE | 10CE |
---|---|---|---|---|---|---|
Частота процессора Ггц | 1.6 | 1.4 | 1.4 | 1.584 | 1.408 | 1.400 |
Число векторных ядер в процессоре | 8 | 8 | 8 | 8 | 8 | 8 |
Пиковая производительность ядра
(double precision GFLOPS) |
307.2 | 268.8 | 268.8 | 304 | 270 | 268 |
Пиковая производительность ядра
(single precision GFLOPS) |
537 | 608 | 540 | 537 | ||
Пиковая производительность процессора
(double precision TFLOPS) |
2.45 | 2.15 | 2.15 | 2.43 | 2.16 | 2.15 |
Пиковая производительность процессора
(single precision TFLOPS) |
4.9 | 4.3 | 4.3 | 4.86 | 4.32 | 4.30 |
Пропускная способность памяти (ТБ/с) | 1.2 | 1.2 | 0.75 | 1.35 | 1.35 | 1.00 |
Ёмкость памяти (Гб) | 48 | 48 | 24 | 48 | 48 | 24 |
Version 2 Vector Engine
Была выпущена в двух вариантах
SKU | 20A | 20B |
---|---|---|
Частота процессора Ггц | 1.6 | 1.6 |
Число векторных ядер в процессоре | 10 | 8 |
Пиковая производительность ядра
(double precision GFLOPS) |
307 | 307 |
Пиковая производительность ядра
(single precision GFLOPS) |
614 | 614 |
Пиковая производительность процессора
(double precision TFLOPS) |
3.07 | 2.45 |
Пиковая производительность процессора
(single precision TFLOPS) |
6.14 | 4.91 |
Пропускная способность памяти (ТБ/с) | 1.53 | 1.53 |
Ёмкость памяти (Гб) | 48 | 48 |
Version 3 Vector Engine