Китай инвестирует сразу в три проекта по созданию экзафлопсного суперкомпьютера

 

Одна из причин, по которой у Китая есть неплохие шансы выполнить свою амбициозную цель по достижению экзафлопсных вычислений к 2020 году, заключается в том, что правительство страны финансирует сразу три отличающихся по своей архитектуре проекта по созданию сверхмощного суперкомпьютера. Национальный университет оборонных технологий (National University of Defense Technology, NUDT), Национальный исследовательский центр параллельной вычислительной техники (National Research Center of Parallel Computer, NRCPC) и компания Sugon (также известная как Dawnning) столкнутся во внутреннем соревновании друг с другом, чтобы создать первый в стране (и, возможно, во всём мире) суперкомпьютер с производительностью в 1 экзафлопс.

Для скорейшего создания суперкомпьютера с производительностью свыше 1 экзафлопа правительство Китая инвестирует сразу в три конкурирующих проекта

Для скорейшего создания суперкомпьютера с производительностью в 1 экзафлопс правительство Китая инвестирует сразу в три конкурирующих проекта

На данный момент каждый из участников соревнования разработал и развернул прототип будущей высокопроизводительной системы, состоящий пока что только из 512 узлов. Дальнейшее их масштабирование в суперкомпьютеры с набором из более чем 100 000 узлов будет непростой задачей не только потому, что это огромный скачок, но также и потому, что Китай привержен идее создания собственных суперкомпьютеров с использованием относительно незрелых отечественных процессоров.

На недавней презентации Руибо Ван (Ruibo Wang) из NUDT поделился подробностями о трёх прототипах, которые были развернуты в 2018 году, и рассказал о некоторых деталях плана его организации в отношении их будущего суперкомпьютера Tianhe-3.

Прототип от NRCPC создан только на базе микропроцессоров без использования каких-либо ускорителей и потому, вероятно, самый классический в сравнении с двумя конкурентами. Фактически, это единственная «не ускоренная» архитектура, которая в настоящее время борется за будущее звание топ 1 суперкомпьютера в Поднебесной. Каждый из его узлов оснащён двумя процессорами ShenWei 26010 (SW26010), тем же чипом, который используется для суперкомпьютера Sunway TaihuLight. 26010 имеет 260 ядер и обеспечивает производительность около 3 терафлопс. Предположительно, у проекта Sunway в разработке есть более мощный чип ShenWei следующего поколения для будущей экзафлопсной системы NRCPC. По мнению портала The Next Platform, его производительность должна составить около 10 терафлопс.

Только в суперкомпьютере от NRCPC не планируется использование каких-либо ускорителей

Только в суперкомпьютере от NRCPC не планируется использование каких-либо ускорителей

Прототип от компании Sugon представляет собой гетерогенную вычислительную систему, состоящую из узлов, каждый из которых оснащён двумя процессорами Hygon x86 и двумя ускорителями DCU, соединённых между собой по топологии 6D-тор, разработанной японской компанией Fujitsu. Процессор представляет собой лицензионную копию первого поколения EPYC от AMD, а DCU - фирменные ускорители, созданные китайской компанией Hygon самостоятельно. В своей презентации Депей Цянь (Depei Qian) из университета Сиань Цзяотун ещё в 2017 году говорил, что производительность DCU в будущем составит до 15 терафлопс. Один из интересных аспектов прототипа от Sugon заключается в том, что он охлаждается иммерсионной СЖО, что может указывать на то, что чип DCU рассеивает просто огромное количество тепла.

Sugon делает ставку на ускорители компании Hygon и её лицензионные копии процессоров первого поколения AMD EPYC

Sugon делает ставку на ускорители компании Hygon и её лицензионные копии процессоров первого поколения EPYC от AMD

Прототип NUDT — это ещё одна гетерогенная архитектура, в данном случае использующая процессоры неизвестного происхождения, а также ускоритель Matrix-2000+, представляющий собой 128-ядерный DSP-чип общего назначения. Можно предположить, что Matrix-2000+ является преемником Matrix-2000, ускорителя, используемого в суперкомпьютере Tianhe-2A с производительностью в 100 петафлопс, который в настоящее время является четвёртым в рейтинге суперкомпьютеров TOP500. На пике Matrix-2000+ обеспечивает производительность в два терафлопса и потребляет около 130 Вт. Если бы данные ускорители использовались для работы суперкомпьютера с производительностью в 1 экзафлопс, то только они потребовали бы около 65 мегаватт для своей работы.

NUDT используют в виде сопроцессора DSP-чип собственного производства — Matrix-2000

NUDT используют в виде ускорителя DSP-чип собственного производства — Matrix-2000+

Однако для будущего суперкомпьютера Tianhe-3 NUDT планирует использовать разрабатываемый на данный момент DSP-чип Matrix-3000 вместе с неизвестным процессором. Ожидается, что будущий DSP будет иметь не менее 96 ядер и производительность более 10 терафлопс, а 64-ядерный процессор обеспечит дополнительно 2 терафлопса. Каждый узел будет оснащён восемью парами таких ускорителей и процессоров, обеспечивая производительность 96 терафлопс в сумме.

Для будущего суперкомпьютера NUDT планируют использовать следующее поколение своего сопроцессора — Matrix-3000, в котором стало заметно меньше ядер, а вот их производительность выросла в разы

Для будущего суперкомпьютера NUDT планируют использовать следующее поколение своего ускорителя — Matrix-3000, в котором стало заметно меньше ядер, а вот их производительность выросла в разы

Вся система будет состоять из 100 шкафов, каждый из которых содержит 128 блейдов, что дает 1,29 экзафлопс в пике. Все узлы будут подключены к собственной сети с пропускной способностью 400 Гбит/с, используя топологию "3D-бабочки" (3D butterfly). Данная топология обеспечит максимум пять переходов между любыми двумя узлами. Охлаждение будет обеспечиваться гибридной воздушно-водной системой, которая, как ожидается, обеспечит показатель PUE менее 1,1.

Будущие суперкомпьютер будет состоять из 100 шкафов, каждый из которых содержит 128 блейдов, которые в свою очередь имеют 8 процессоров и сопроцессоров Matrix, выдающих производительность в 1,29 экзафлопс в сумме

Суперкомпьютер от NUDT будет состоять из 100 шкафов, каждый из которых содержит 128 блейдов, которые в свою очередь имеют 8 процессоров и ускорителей Matrix-3000, выдающих производительность в 1,29 экзафлопс в сумме

Главной загадкой остается происхождение процессоров Tianhe-3. Портал The Next Platform предполагает, что это будет некий процессор на архитектуре Arm. И это вполне вероятно, так как Китай уже некоторое время намекает на то, что одна из его супервычислительных систем будет использовать эту архитектуру. Учитывая ожидаемую производительность процессора в 2 терафлопса, он может даже оказаться реализацией Armv8-A с масштабируемым векторным расширением (SVE).

Если NUDT решит пойти по этому пути, одним из возможных вариантов будет лицензирование у Fujitsu производства процессоров A64FX с технологией Arm SVE, стоящих за разрабатываемым на данный момент японским суперкомпьютером с экзафлопсной производительностью — Post-K. Эти процессоры обеспечивают 2,7 терафлопс производительности, а сама Fujitsu предлагает для них набор необходимых HPC-библиотек. В пользу этого варианта свидетельствует и тот факт, что ранее компания уже заявляла о планах продать некоторые технологии, разработанные ею для Post-K.

В любом случае, если разработка Tianhe-3 будет идти по графику, скоро мы узнаем, какой всё-таки процессор в NUDT используют для своего суперкомпьютера.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

Источник:

Постоянный URL: http://servernews.ru/987026
Поделиться:  

Комментарии

Система Orphus