В проектировании суперкомпьютеров нет единого стандарта и архитектуры: строятся системы как на базе x86-совместимых процессоров, но активно используются и уникальные решения, такие как векторные процессоры NEC. Идёт своим путём и Китай, разрабатывая специально для этой цели серию процессоров Sunway (ShenWei). За разработку отвечает Национальный центр по проектированию высокопроизводительных интегральных схем, расположенный в Шанхае.
Исторически эти процессоры родились как ответ на запрос военных из НОАК, считается что основой послужили знаменитые в своё время чипы DEC Alpha. Последнее поколение Sunway, 260-ядерные процессоры SW26010 стали «сердцами» для одного из самых мощных суперкомпьютеров в мире — TaihuLight, который по-прежнему возглавляет список TOP500 по состоянию на июнь 2017 года. Архитектурно эти процессоры чем-то напоминают современные GPU, так как содержат внутри четыре кластера, в каждом из которых организована матрица 8 × 8 из относительно простых вычислительных элементов, а за управление отвечает приставленное к каждому кластеру ядро с более традиционной архитектурой.
Каждый кластер имеет свой контроллер памяти и использует собственное адресное пространство. Вычислительные блоки имеют по 64 Кбайт кеша данных и 16 Кбайт кеша инструкций, но традиционная иерархия кешей на этом заканчивается и объединены эти блоки единой сетью класса NoC (network-on-chip); управляющие ядра, впрочем, построены более привычным образом — каждое из них располагает 256 Кбайт собственного кеша L2. Судя по экспозиции на ISC 2017, разработчики серии Sunway решили продвигать свои решения и в другие, не столь масштабные сферы. Были продемонстрированы новые системные платы Sunway Micro с двумя процессорами SW26010 на каждой, причём они изначально ориентированы на жидкостное охлаждение, на что явно указывают не лишённые китайского изящества водоблоки.
Речь, скорее, о модуле, нежели о системной плате в полном смысле этого слова, поскольку оперативная память распаяна в виде набора чипов, а не установлена модулями DIMM. В зависимости от конфигурации, её объем может составлять от 64 до 256 Гбайт на плату. Производительность такой платы составляет 6 терафлопс, она может нести на борту до 12 Тбайт дискового пространства. Эффективность SW26010 высока: каждый вычислительный блок может выполнять 8 операций над числами с плавающей запятой. Тактовая частота невысока, она составляет всего 1,45 ГГц, но для 260-ядерного процессора это серьёзное значение.
Новинки предназначаются для использования в науке и инженерии для моделирования различных процессов, подходят они и для набирающих популярность систем глубинного машинного обучения (deep learning). Аккуратное шасси с двумя иероглифами на передней панели напоминает шкафы TaihuLight, но, разумеется, занимает намного меньше места. Оно может вместить в себя несколько плат Sunway Micro и представляет собой суперкомпьютер в миниатюре.
Аппаратное обеспечение, особенно такое уникальное, как Sunway, требует программной поддержки, и она у китайских разработчиков есть: потенциальным партнёрам будут доступны всевозможные средства и среды разработки, базирующиеся на языках C/C++ и Fortran, отладочные механизмы, а также средства многопоточной оптимизации и автоматической векторизации кода. В этом платформа Sunway Micro ничуть не уступает японской NEC Vector Engine.
Источник: