NEC SX-Aurora TSUBASA: различия между версиями

Материал из in.wiki
Перейти к навигации Перейти к поиску
Строка 16: Строка 16:
 
На сервере, поставляемом NEC может размещаться до восьми VE, кластеры VH могут масштабироваться до произвольного количества узлов.
 
На сервере, поставляемом NEC может размещаться до восьми VE, кластеры VH могут масштабироваться до произвольного количества узлов.
  
 +
=== Версии Vector Engine ===
 
По состоянию на 2023 год были разработаны и выпущены на рынок следующие версии TSUBASA:
 
По состоянию на 2023 год были разработаны и выпущены на рынок следующие версии TSUBASA:
  
Строка 96: Строка 97:
 
|48
 
|48
 
|24
 
|24
 +
|-
 +
|Ёмкость кэш-памяти (Мб)
 +
|16
 +
|16
 +
|16
 +
|16
 +
|16
 +
|16
 
|}
 
|}
 
Версия 1.0 Vector Engine была произведена по 16-нм техпроцессу [[FinFET]] (от [[TSMC]]) и выпущена в трех основных версиях продукта  (в доработанных версиях добавляется буква E в конце):
 
Версия 1.0 Vector Engine была произведена по 16-нм техпроцессу [[FinFET]] (от [[TSMC]]) и выпущена в трех основных версиях продукта  (в доработанных версиях добавляется буква E в конце):
Строка 143: Строка 152:
 
|48
 
|48
 
|48
 
|48
 +
|-
 +
|Ёмкость кэш-памяти (Мб)
 +
|16
 +
|16
 
|}
 
|}
 +
 +
{| class="wikitable"
 +
|+
 
'''Version 3 Vector Engine'''
 
'''Version 3 Vector Engine'''
 
+
!SKU
== Внутреннее устройство оборудования ==
+
!30A
 +
|-
 +
|Частота процессора Ггц
 +
|1.6
 +
|-
 +
|Число векторных ядер в процессоре
 +
|16
 +
|-
 +
|Пиковая производительность ядра
 +
(double precision GFLOPS)
 +
|307
 +
|-
 +
|Пиковая производительность ядра
 +
(single precision GFLOPS)
 +
|614
 +
|-
 +
|Пиковая производительность процессора
 +
(double precision TFLOPS)
 +
|4.912
 +
|-
 +
|Пиковая производительность процессора
 +
(single precision TFLOPS)
 +
|9,824
 +
|-
 +
|Пропускная способность памяти (ТБ/с)
 +
|2.45
 +
|-
 +
|Ёмкость памяти (Гб)
 +
|96
 +
|-
 +
|Ёмкость кэш-памяти (Мб)
 +
|64
 +
|}
  
 
=== Архитектура процессора ===
 
=== Архитектура процессора ===

Версия от 01:26, 19 ноября 2023

NEC SX-Aurora TSUBASA — векторный процессор семейства NEC SX[1][2]. В отличие от предыдущих суперкомпьютеров этого семейства, SX-Aurora TSUBASA поставляется в виде карты PCIe, называемой NEC «Vector Engine» (VE). Восемь карт Vector Engine можно вставить в векторный хост (VH), который обычно представляет собой сервер x86-64 под управлением операционной системы Linux.

О продукте было объявлено в пресс-релизе 25 октября 2017 года, а начало продаж состоялось в феврале 2018 года.

Модель NEC SX-Aurora TSUBASA пришла на смену SX-ACE.

Оборудование

SX-Aurora TSUBASA является преемником серий NEC SX и SUPER-UX, векторных компьютерных систем, на которых основан суперкомпьютер Earth Simulator.

Его аппаратное обеспечение состоит из хостов Linux x86 с векторными движками (VE), подключенными через соединение PCI Express (PCIe).

Высокая пропускная способность памяти (0,75–1,2 ТБ/с) обеспечивается за счет восьми ядер и шести модулей памяти HBM2, объединённых на кремниевом интерпозере, оформленном в форм-факторе карты PCIe полной длины, полной высоты и двойной ширины. Функциональность операционной системы для VE переносится на VH и обрабатывается в основном демонами пользовательского пространства, на которых работает VEOS.

В зависимости от тактовой частоты (1,4 или 1,6 ГГц) каждый процессор VE имеет восемь ядер и пиковую производительность 2,15 или 2,45 терафлопс при вычислениях с двойной точностью. Процессор впервые в мире оснащен шестью модулями HBM2 на кремниевом интерпозере с общим объемом памяти 24 или 48 ГБ с высокой пропускной способностью.

На сервере, поставляемом NEC может размещаться до восьми VE, кластеры VH могут масштабироваться до произвольного количества узлов.

Версии Vector Engine

По состоянию на 2023 год были разработаны и выпущены на рынок следующие версии TSUBASA:

Version 1 Vector Engine
SKU 10A 10B 10C 10AE 10BE 10CE
Частота процессора Ггц 1.6 1.4 1.4 1.584 1.408 1.400
Число векторных ядер в процессоре 8 8 8 8 8 8
Пиковая производительность ядра

(double precision GFLOPS)

307.2 268.8 268.8 304 270 268
Пиковая производительность ядра

(single precision GFLOPS)

537 608 540 537
Пиковая производительность процессора

(double precision TFLOPS)

2.45 2.15 2.15 2.43 2.16 2.15
Пиковая производительность процессора

(single precision TFLOPS)

4.9 4.3 4.3 4.86 4.32 4.30
Пропускная способность памяти (ТБ/с) 1.2 1.2 0.75 1.35 1.35 1.00
Ёмкость памяти (Гб) 48 48 24 48 48 24
Ёмкость кэш-памяти (Мб) 16 16 16 16 16 16

Версия 1.0 Vector Engine была произведена по 16-нм техпроцессу FinFET (от TSMC) и выпущена в трех основных версиях продукта (в доработанных версиях добавляется буква E в конце):

По состоянию на ноябрь 2023 года из перечисленных моделей поставляются только модели 10AE и 10CE.

Version 2 Vector Engine
SKU 20A 20B
Частота процессора Ггц 1.6 1.6
Число векторных ядер в процессоре 10 8
Пиковая производительность ядра

(double precision GFLOPS)

307 307
Пиковая производительность ядра

(single precision GFLOPS)

614 614
Пиковая производительность процессора

(double precision TFLOPS)

3.07 2.45
Пиковая производительность процессора

(single precision TFLOPS)

6.14 4.91
Пропускная способность памяти (ТБ/с) 1.53 1.53
Ёмкость памяти (Гб) 48 48
Ёмкость кэш-памяти (Мб) 16 16
Version 3 Vector Engine
SKU 30A
Частота процессора Ггц 1.6
Число векторных ядер в процессоре 16
Пиковая производительность ядра

(double precision GFLOPS)

307
Пиковая производительность ядра

(single precision GFLOPS)

614
Пиковая производительность процессора

(double precision TFLOPS)

4.912
Пиковая производительность процессора

(single precision TFLOPS)

9,824
Пропускная способность памяти (ТБ/с) 2.45
Ёмкость памяти (Гб) 96
Ёмкость кэш-памяти (Мб) 64

Архитектура процессора

Память и кэш

Поставляемые платформы

Программное обеспечение

Операционная система

Разработка ПО

Перспективы развития

Aurora TSUBASA в России

Примечания

  1. Ошибка цитирования Неверный тег <ref>; для сносок nec-product-page не указан текст
  2. Ошибка цитирования Неверный тег <ref>; для сносок 2017-next-platform не указан текст