Материалы по тегу: hpc

26.04.2018 [15:49], Алексей Степин

Verne Global представила новый сервис hpcDIRECT

Компания Verne Global, известный производитель и поставщик решений для ЦОД и сферы супервычислений, анонсировала системы hpcDIRECT, главное назначение которых — работа в составе кластеров, задействованных в области вычислительной биологии и генетики. Новинки относятся к модному нынче классу «супервычисления как облачный сервис», и клиент может выбирать из многочисленных опций.

К примеру, в зависимости от задачи, Verne Global предлагает разные ускорители на базе графических процессоров, выделенные или разделяемые хранилища данных, а также гарантирует наличие скоростной сетевой среды. Типичная спецификация включает в себя 32 физических ядра с частотой 2,1 ГГц, 512 Гбайт оперативной памяти (16 Гбайт на ядро) и сетевое подключение InfiniBand FDR со скоростью 56 Гбит/с.

Решения hpcDIRECT устанавливаются в безопасном ЦОД, оптимизированном с учётом сферы супервычислений, и обслуживаются командой квалифицированных специалистов. Клиентам предоставляется настоящая вычислительная мощность без виртуализации; иными словами, процессорную производительность не приходится делить с другими заказчиками. Стоимость трёхлетней резервации мощностей стоит 0,03 евро за одно ядро в час, мгновенный доступ «по требованию» дороже — 0,07 евро. Подробности можно узнать на сайте сервиса по приведённой выше ссылке.

Постоянный URL: http://servernews.ru/968954
03.04.2018 [13:45], Сергей Карасёв

ПаВТ 2018: самый мощный суперкомпьютер России нарастил производительность

Научно-исследовательский вычислительный центр МГУ имени М.В.Ломоносова и Межведомственный суперкомпьютерный центр РАН представили двадцать восьмую редакцию рейтинга самых мощных компьютеров СНГ — списка Тор50.

Лидером рейтинга уже семь редакций подряд остаётся суперкомпьютер «Ломоносов-2» производства компании «Т-Платформы», установленный в Московском государственном университете имени М.В.Ломоносова. Причём эта система была модернизирована. Её производительность на тесте Linpack поднялась с 2,1 петафлопса (квадриллиона операций с плавающей запятой в секунду) до 2,48 петафлопса, а пиковое быстродействие увеличилось с 2,96 до 4,95 петафлопса.

На втором месте оказался новый суперкомпьютер производства компаний «T-Платформы» и CRAY, установленный в Главном вычислительном центре Федеральной службы по гидрометеорологии и мониторингу окружающей среды. Производительность этого комплекса на тесте Linpack составляет 1,2 петафлопса.

Замыкает первую тройку суперкомпьютер «Ломоносов», установленный в Московском государственном университете имени М.В.Ломоносова. Его быстродействие составляет около 0,9 петафлопса.

Любопытно, что все системы в рейтинге используют в качестве основных процессоров решения Intel. Число гибридных суперкомпьютеров, использующих для вычислений графические процессоры, по сравнению с предыдущей редакцией рейтинга уменьшилось с 19 до 18, а количество систем, использующих ускорители Intel Xeon Phi, осталось равным 9.

Суммарная производительность систем на тесте Linpack за полгода выросла с 8,7 до 10,7 петафлопса. Суммарная пиковая производительность систем списка составила 17,4 петафлопса против 13,4 петафлопса в предыдущей редакции.

Количество систем, используемых в науке и образовании, осталось равным 18; количество систем, ориентированных на конкретные прикладные исследования, уменьшилось с 16 до 14; число систем, используемых в промышленности, уменьшилось с 5 до 4; число систем в финансовой области осталось равным 3. 

Постоянный URL: http://servernews.ru/967909
28.03.2018 [14:00], Иван Грудцын

Ускоритель NVIDIA Quadro GV100 оперирует 32 Гбайт памяти HBM2

Одним из ключевых анонсов в рамках конференции GTC 2018 (26–29 марта, г. Сан-Хосе, США) стала презентация профессионального графического ускорителя NVIDIA Quadro GV100 для рабочих станций. Подобно Quadro GP100, новый адаптер назван в честь графического чипа, ставшего его основой — Volta GV100. Напомним, что последний уже используется в ускорителях Tesla V100 и TITAN V.

Quadro GV100 выполнен в виде двухслотовой карты расширения с интерфейсом PCI Express 3.0 x16. Устройство характеризуется значительным сходством с TITAN V, правда, в отличие от последнего, оперирует не 12, а 32 Гбайт памяти HBM2 с более высокой пропускной способностью — 870 Гбайт/с. Ещё одно важное различие между Quadro GV100 и TITAN V заключается в том, что новая модель Quadro обладает поддержкой интерфейса NVLink с пропускной способностью 200 Гбайт/с. Наконец, вместо разъёма HDMI 2.0b на задней панели TITAN V в Quadro GV100 используется четвёртый DisplayPort 1.4.

В новом ускорителе задействована полноценная версия 12-нм ядра NVIDIA GV100 с 5120 потоковыми процессорами Volta, 320 TMU, 128 ROP и 640 блоками матричных вычислений (Tensor). Разрядность шины памяти составляет 4096 бит, частотная формула — 1450/850(1700) МГц для ядра (с учётом boost-режима) и памяти HBM2 соответственно. «Чистая» производительность Quadro GV100 оценивается в 7,4 Тфлопс для операций с числами двойной точности, 14,8 Тфлопс — одинарной, и 118,5 Тфлопс — Tensor-вычислений.

Перечень поддерживаемых Quadro GV100 разрешений включает 4 × 4096 × 2160 при 120 Гц (т. е. предусмотрена возможность подключения четырёх 120-Гц 4K-мониторов), 4 × 5120 × 2880 при 60 Гц и 2 × 7680 × 4320 при 60 Гц. В числе поддерживаемых технологий отдельно упоминаются NVIDIA RTX (трассировка лучей в реальном времени), API OptiX (графический движок с поддержкой трассировки лучей), Microsoft DXR и Vulkan. Рекомендованная цена нового ускорителя для заказчиков из США составляет $9000 без учёта налога с продаж.

Параллельно стало известно о переводе HPC-ускорителя Tesla V100 на конфигурацию кристалла GPU с двойным объёмом буферной памяти HBM2 — 32 Гбайт. Изменения затронули как SMX2-версию V100, так и вариант данного адаптера в виде карты расширения PCI-E. Повлияло ли обновление ускорителя на его стоимость, пока не ясно.

Постоянный URL: http://servernews.ru/967626
20.03.2018 [13:45], Сергей Карасёв

Самый мощный российский суперкомпьютер станет существенно производительнее

Московский государственный университет (МГУ) имени М.В.Ломоносова сообщил о завершении разработки и начале опытной эксплуатации нового вычислительного кластера суперкомпьютера «Ломоносов-2».

На сегодняшний день «Ломоносов-2» является самым мощным вычислительным комплексом в России. Сейчас этот суперкомпьютер демонстрирует производительность на тесте Linpack на уровне 2,1 петафлопса (квадриллиона операций с плавающей запятой в секунду). Пиковое быстродействие достигает 2,96 петафлопса.

Новый кластер системы обладает пиковой производительностью в 1,8 петафлопса. Он базируется на многоядерных процессорах Intel Skylake и процессорах NVIDIA Pascal P100 с аппаратной поддержкой высокоскоростного интерфейса NVLink.

Утверждается, что по сравнению с предыдущими поколениями суперкомпьютеров МГУ в новой системе увеличен объём и улучшена структура оперативной памяти, что позитивно скажется на эффективности практически всех приложений пользователей, работающих на суперкомпьютере «Ломоносов-2».

Таким образом, с вводом нового кластера в строй пиковое быстродействие вычислительного комплекса вплотную приблизится к отметке в 5 петафлопсов. «Это значительно ослабит острейший дефицит высокопроизводительных вычислительных ресурсов, доступных для научно-образовательного сообщества России: на суперкомпьютерах МГУ работают 2500 пользователей из 20 подразделений вуза, более 100 институтов Российской академии наук, более 100 университетов России, решая задачи, отвечающие всем направлениям стратегии научно-технологического развития Российской Федерации», — отмечает МГУ. 

Постоянный URL: http://servernews.ru/967204
30.01.2018 [13:03], Сергей Карасёв

Китай готовит суперкомпьютер с пиковой производительностью более 200 петафлопсов

Сетевые источники сообщают о том, что Китай намерен ввести в строй новый вычислительный комплекс, который сможет превзойти по производительности готовящийся к запуску американский суперкомпьютер Summit.

Сейчас самым мощным на планете суперкомпьютером является китайский комплекс Sunway TaihuLight. Его быстродействие составляет 93 петафлопса (квадриллиона операций с плавающей запятой в секунду), а пиковая производительность теоретически может достигать 125 петафлопсов.

В середине нынешнего года, как ожидается, заработает система Summit, сборка которой осуществляется в Окриджской Национальной лаборатории Министерства энергетики США. Пиковая производительность этого суперкомпьютера планируется на уровне 200 петафлопсов или более.

Как теперь стало известно, в Китае планируется запуск комплекса, который будет предвещать начало эпохи экзафлопсных вычислений. Сообщается, что пиковая производительность готовящейся системы будет в 200 раз больше показателя системы Tianhe-1, у которой эта величина равна 1,2 петафлопса. Таким образом, теоретически новый комплекс сможет демонстрировать пиковое быстродействие на уровне 240 петафлопсов.

Запуск китайского вычислительного монстра намечен уже на текущий год. Иными словами, система Summit рискует не стать самым быстрым суперкомпьютером на планете. 

Постоянный URL: http://servernews.ru/964831
31.12.2017 [12:07], Алексей Степин

NVIDIA Volta экономит электричество в суперкомпьютерах

Джек Донгарра (Jack Dongarra), заслуженный профессор университета Теннесси, известный исследователь, работающий в лаборатории Ок-Ридж (Oak Ridge National Laboratory, ORNL), один из отцов-создателей кластерной системы Summit, в докладе, сделанном на мероприятии SC17, подробно осветил тему экономичности суперкомпьютеров, и как в этом помогает новое поколение ускорителей NVIDIA Volta.

Сам по себе доклад также весьма интересен — хотя бы графиком роста производительности кластерных систем с 1994 года по настоящее время. Если в начале пути суперкомпьютеры могли похвастаться мощностями порядка 1,17 терафлопс, и это в лучшем случае, то сегодня мы вплотную приближаемся к отметке 1 экзафлопс, что на шесть порядков выше (1012 против 1018). Петафлопсный масштаб освоен нашей цивилизацией полностью: по состоянию на 2017 год в мире действует 181 система с таким порядком производительности.

Что касается Volta, то в тесте MAGMA 2.3 LU (факторизация, двойная точность), V100 демонстрирует десятикратное превосходство над классическими процессорами (Haswell E5-2650 v3, 2×10 ядер, 2,3 ГГц) при равном уровне энергопотребления. Не стоит и говорить, насколько это важно при масштабах энергопотребления и тепловыделения суперкомпьютеров. Помогают V100 и тензорные ядра: на задачах с математикой смешанной точности в режиме FP16 чип выдает 120 терафлопс, в то время, как без них этот показатель составляет лишь 30 терафлопс. В целом, всё звучит вполне логично: время обычных ЦП ушло, а на их место пришли специализированные решения с особой архитектурой и высокой степенью параллелизма.

Постоянный URL: http://servernews.ru/963580
21.12.2017 [18:50], Алексей Степин

POWER9 идёт в народ: описание сервера IBM AC922

Инициатива OpenPOWER, как мы уже рассказывали читателям, приносит свои плоды, особенно вместе с проектом OpenCAPI. Итоговая платформа получается более универсальной и сбалансированной, нежели Intel Purley или AMD EPYC. Хотя бы потому, что имеет поддержку PCI Express 4.0 и умеет работать с интерфейсами CAPI и NVLink, а это настоящая находка при проектировании кластерных систем, основанных на использовании дополнительных ускорителей, будь то NVIDIA Volta или платы на базе FPGA. Всё это собрано в едином узле или сервере под названием IBM Winterspoon. Система отличается от другого варианта под названием Cumulus использованием процессоров POWER9 с менее развитым SMT (как известно, POWER9 существует в вариантах SMT4 и SMT8; столь развитой многопоточностью не может похвастаться ни один процессор x86). В Winterspoon использована версия SMT4.

Новинка уже поставляется на рынок с модельным номером AC922. AC в этом случае означает гибридную систему на базе ЦП и ГП, цифра 9 указывает на модель процессора, а две двойки означают два процессорных разъёма и высоту корпуса 2U. IBM очень активно рекламирует платформу POWER9 для задач искусственного интеллекта и машинного обучения, однако AC922 является универсальной системой, подходящей для любого рода задач. Серия процессоров POWER9 Nimbus может насчитывать от 16 до 24 ядер, серверы AC922 поставляются с 22-ядерными чипами, частоты которых мы не знаем. Но речь об опытных поставках. Коммерческие версии получают либо 16-ядерные процессоры с частотной формулой 2,6/3,09 ГГц, либо 20-ядерные с формулой 2,0/2,87 ГГц. Оба варианта удерживаются в рамках теплопакета 190 ватт, так что место для роста ещё есть: к примеру, Intel Xeon SP-8180M имеет теплопакет целых 205 ватт. Стоят процессоры достаточно дорого: 16-ядерный вариант POWER9 обойдётся в $3000, а 20-ядерный будет стоить $4000. Впрочем, на фоне ускорителей Volta это недорого — те оцениваются в $11500 за модуль.

Узел AC922 имеет 16 слотов для установки регистровых модулей DDR4 с коррекцией ошибок. Память, в отличие от POWER8, не использует специального чипа-буфера и подключается к интегрированному в ЦП контроллеру напрямую, что понижает задержки. Поддерживаются модули DDR4-2667 ёмкостью до 64 Гбайт, что позволяет оснащать систему 1 Тбайт оперативной памяти. Обещается поддержка и модулей объёмом 128 Гбайт, что даст AC922 уже 2 Тбайт памяти. Совокупная ПСП при заполнении всех слотов достигает 306 Гбайт/с. Серверы специально ориентированы на использование ускорителей серии NVIDIA Volta в формате SXM2, которые на сегодня можно считать одними из самых мощных. Поддерживается конфигурация либо с четырьмя, либо с шестью модулями Volta G100, причём последняя требует жидкостного охлаждения. Проблем с пропускной способностью нет: четыре линии NVLink 2.0 ускорители используют для общения между собой, а ещё четыре — для общения с процессором; во всех случаях скорость составляет 100 Гбайт/с.

Для суперкомпьютера Summit, о котором мы писали ранее, выбран более мощный вариант с СЖО. Было бы обидно при такой плотности упаковки вычислительных мощностей терять два модуля Volta на узел. Но есть преимущества и у версии с четырьмя ГП: здесь каждый ускоритель имеет канал общения с соседями и процессором шириной уже 150 Гбайт/с, а в некоторых задачах это может оказаться важнее. Подход к подсистеме ввода-вывода у систем AC922 минималистский: каждая имеет два сетевых порта InfiniBand со скоростью 100 Гбит/с, контроллеры которых напрямую подключены к ЦП посредством PCIe x8 4.0. Каждый разъём имеет также слот x16, совместимый с CAPI. Он предназначен для установки специализированных ускорителей или кеширующих модулей, таких, как Intel Optane или решений на базе ReRAM. Имеется дополнительный интерфейс PCIe x4 4.0. Коммутатор PLX Technologies PEX 8733 соединяет всю систему с ЦП и ГП с контроллером подсистемы хранения данных, так что ускорители Volta могут получать данные с SSD, минуя ЦП. AC922 располагает также четырьмя традиционными портами 10GbE, а контроллеры USB, базовый хаб и средства дистанционного управления подключены к первому процессору в системе посредством шины PCIe x1 всё той же версии 4.0.

Локальная система хранения данных представлена двумя двухдюймовыми корзинами SATA, причём, опционально можно использовать и традиционные жесткие диски со скоростью вращения шпинделя 7200 об/мин. Среди опций имеются платы NVMe объёмом 1,6 Тбайт ($3100), а к концу года появится версия объёмом 3,2 Тбайт. Их роль, по словам представителя проекта, в основном, кеширующая, чтобы узлам не приходилось лишний раз нагружать сеть. На данный момент IBM AC922 сертифицирован для использования совместно с Red Hat Enterprise Linux 7.4 (версия little endian for POWER), а во втором квартале появятся специализированные серверные версии Ubuntu. Возможность использования SUSE Linux Enterprise Server пока рассматривается, но остаётся под вопросом, что странно, учитывая популярность именно этой ОС в секторе HPC и платформ SAP HANA. Что касается цен на готовые системы, то предыдущий узел на базе POWER8 под кодовым названием Minksy стоил порядка $65 тысяч, и IBM говорит о сохранении порядка цен. Так что примерно за ту же сумму можно будет получить вдвое больше процессорной мощности и в 2‒6 раз больше мощности ускорителей на базе ГП.

POWER9 это не только серверный сегмент, но в потенциале и неплохие рабочие станции

POWER9 это не только серверный сегмент, но в потенциале и неплохие рабочие станции

У энтузиастов может возникнуть вопрос: а совместимы ли эти процессоры POWER9 с платой Talos II? Увы, ответа на этот вопрос мы пока дать не можем, но теоретически новые чипы IBM используют одинаковый форм-фактор и тип разъёма. Но вот кулеры 16-ядерным POWER9, не говоря уж о более мощных моделях с 20, 22 или 24 ядрами, явно понадобятся более солидные, если пользователь такой рабочей станции хочет сберечь свой слух.

Постоянный URL: http://servernews.ru/963247
06.12.2017 [23:45], Сергей Юртайкин

IBM представила первый сервер на процессоре POWER9

IBM представила свой первый собственный сервер на процессоре POWER9. Особенность решения под названием IBM Power Systems AC922 заключается в том, что новая аппаратная платформа разработана специально для работы с интенсивными вычислительными нагрузками технологий искусственного интеллекта (ИИ).

CPU IBM POWER9

CPU IBM POWER9

В IBM отмечают, что Power 9 позволяет ускорить тренировки фреймворков глубинного обучения обучения почти в четыре раза, благодаря чему клиенты смогут быстрее создавать более точные ИИ-приложения. Утверждается, что новый сервер разработан для получения значительных улучшений производительности всех популярных фреймворков ИИ, таких как Chainer, TensorFlow и Caffe, а также современных баз данных, использующих ускорители, например, Kinetica.

Сервер IBM Power System AC922

Сервер IBM Power System AC922

Сервер IBM Power Systems AC922 использует шину PCI-Express 4.0 и технологии NVIDIA NVLink 2.0 и CAPI 2.0/OpenCAPI, способные ускорить пропускную способность в 9,5 раза по сравнению с системами x86 на базе PCI-E 3.0. Это, в частности, позволяет задействовать ускорителям (GPU или FPGA) системную ОЗУ без значительных, по сравнению с прошлыми решениями, потерь производительности, что важно для обработки больших массивов данных. Кроме того, новые поколения карт расширения и ускорителей уже поддерживают эту шину.

IBM Power Systems AC922 создан в нескольких конфигурациях, оснащаемых двумя процессорами POWER9. Стандартные версии включают CPU c 16 (2,6 ГГц, турбо 3,09 ГГц) и 20 (2,0/2,87 ГГц) ядрами (4 потока на ядро), а позже появятся версии с 18- и 22 -ядерными процессорами. Всего в сервере есть 16 слотов для модулей ECC DDR4-памяти, что на текущий момент позволяет оснастить его 1 Тбайт RAM. Для хранения данных предусмотрено два слота для 2,5" SSD/HDD (RAID-контроллера нет).

AC922 может иметь на  борту от двух до четырёх ускорителей NVIDIA Tesla V100 форм-фактора SXM2 с памятью 16 Гбайт и шиной NVLink 2.0. В сумме они дают до 500 Тфлопс на расчётах половинной точности. Дополнительные ускорители можно подключить к слотам PCI-E 4.0. 

Сервер рассчитан на установку четырёх дополнительных низкопрофильных карт расширения: два слота PCI-E 4.0 x16, один PCI-E 4.0 x8 и один PCI-E 4.0 x4. Все слоты, кроме последнего, также умеют работать с CAPI. Также есть два порта USB 3.0. Поддерживается ОС Red Hat Enterprise Linux 7.4 for Power LE.

Процессоры IBM Power 9, которые нашли применение в IBM Power Systems AC922, легли в основу суперкомпьютеров Summit и Sierra Министерства энергетики США, а также используются компанией Google. Чипы и использующие их системы стали частью совместной работы участников организации OpenPower Foundation, в которую входят IBM, Google, Mellanox, NVIDIA и др.

Процессор IBM Power 9

Процессор IBM Power 9

«Мы создали уникальную в своём роде систему для работы с технологиями ИИ и когнитивными вычислениями, — говорит старший вице-президент подразделения IBM Cognitive Systems Боб Пиччиано (Bob Picciano). — Серверы на Power 9 являются не только основой самых высокопроизводительных компьютеров, они позволят заказчикам масштабировать невиданные ранее инсайты, что будет способствовать научным прорывам и революционным улучшениям бизнес-показателей».

Сервер имеет стандартное 2U-шасси и оснащается двумя (1+1) блоками питания мощностью 2,2 кВт каждый. Система охлаждения может быть гибридной. Начало продаж  IBM Power Systems AC922 намечено на 22 декабря 2017 года. В 2018 году будут доступны конфигурации с шестью ускорителями Tesla и СЖО.

Постоянный URL: http://servernews.ru/962463
22.11.2017 [23:35], Алексей Степин

Cavium празднует ещё одну победу ARM в серверном сегменте

Архитектура x86 с нами давно. Когда-то её уделом были лишь персональные компьютеры, но в последние годы подавляющее большинство серверных систем и прочих решений класса HPC строятся именно на базе процессоров Intel или AMD. Времена господства таких архитектур, как DEC Alpha или MIPS давно позади, хотя, к примеру, IBM POWER всё ещё сопротивляется активному натиску со стороны Intel Xeon и AMD Opteron/EPYC: в свежем рейтинге TOP500 всего 24 машины из 500 используют отличную от x86 архитектуру.

Но по ряду причин x86 даже с 64-битными расширениями не является оптимальной и особенно в том случае, когда речь заходит о соотношении производительности и энергопотребления. Последнее автоматически тянет за собой и повышенное тепловыделение, что в условиях увеличения плотности размещения узлов в ЦОД и суперкомпьютерах представляет собой серьёзную проблему. У x86 есть и ещё один конкурент — это архитектура ARM, которую долгое время никто всерьёз в качестве серверной не воспринимал.

Широко известный слайд, демонстрирующий эволюцию архитектур суперкомпьютеров

Широко известный слайд, демонстрирующий эволюцию архитектур суперкомпьютеров

Однако ARM это не просто рабочая лошадка в секторе планшетов и смартфонов. Всё зависит от реализации, и некоторые варианты процессоров на базе этой архитектуры обладают весьма серьёзными возможностями. К числу таких чипов относится Cavium ThunderX2. Этот новый чип на базе ARMv8-A был продемонстрирован разработчиками ещё на ISC 2017. Характеристики его выглядят вполне солидно: здесь и 54 ядра с частотой 3 ГГц, и поддержка двухсокетных конфигураций, и шестиканальный контроллер памяти, и 24 порта SATA (и, вероятно, SAS).

Блок-схема ThunderX2

Блок-схема ThunderX2

Нельзя забывать и про встроенную поддержку Ethernet 25G, наличие 32 Мбайт общего кеша L2, интегрированные аппаратные средства шифрования и контроллер PCI Express 3.0. При этом теплопакет, по данным Cavium, не превышает 95 ватт. К сожалению, у нас пока нет возможности проверить это утверждение. Но можно представить себе, какой величины достиг бы этот показатель в случае 54-ядерного Xeon, даже в варианте Skylake. Проникновение ARM в сегмент HPC, впрочем, быстрым назвать нельзя, хотя Cavium вполне заслуженно хвалится своими успехами на этом поприще.

Процессоры Cavium используют пусть и свой, но вполне привычный разъём типа LGA

Процессоры Cavium используют пусть и свой, но вполне привычный разъём типа LGA

Одна из национальных лабораторий Министерства энергетики США — Аргоннская национальная лаборатория — объявила, что планирует установку нового кластера производства Hewlett Packard Enterprise, а основой этого кластера станут именно процессоры Cavium ThunderX2. Надо полагать, что в такой организации, как Министерство энергетики, хорошо понимают всю важность экономичности суперкомпьютеров. Кластер под названием Comanche Wave будет состоять из 32 узлов. В числе прочего его задачей будет оценка применимости ARM в сфере супервычислений и разработка соответствующего программного обеспечения, включая ARM-версию компилятора LLVM.

Потенциальный конкурент Xeon и EPYC: взгляд вблизи

Потенциальный конкурент Xeon и EPYC: взгляд вблизи

Именно Аргоннская лаборатория активно поддерживает альтернативные процессорные архитектуры и славится своими разработками для платформ PowerPC и IBM Blue Gene/Q, так что выбор места установки нового кластера не вызывает удивления. Интересно отметить, что Cavium, по сути, смогла перехватить кусок пирога буквально под носом у Intel, которой не удалось заключить контракт на установку суперкомпьютера Aurora на базе процессоров Xeon Phi Knights Hill. Лишь в 2021 году «синие» повторят попытку с процессорами x86, которые будут доступны к тому моменту. Впрочем, не факт, что это будет именно x86.

Постоянный URL: http://servernews.ru/961897
14.11.2017 [13:00], Сергей Карасёв

Представлена юбилейная редакция мирового рейтинга суперкомпьютеров Top500

Обнародована юбилейная пятидесятая редакция рейтинга мощнейших вычислительных систем мира Top500. Забегая вперёд скажем, что лидерство сохранил китайский суперкомпьютер Sunway TaihuLight.

Суммарная производительность входящих в рейтинг вычислительных комплексов достигла 845 петафлопсов (квадриллионов операций с плавающей запятой в секунду). Для сравнения: шесть месяцев назад этот показатель равнялся 749 петафлопсам, а год назад — 672 петафлопсам.

Из 500 вошедших в рейтинг систем в 471 применяются процессоры Intel. Таким образом, доля этих суперкомпьютеров достигла 94,2 %. Ещё 14 комплексов полагаются на процессоры IBM Power.

Производительность наименее мощного суперкомпьютера в рейтинге составляет 548,7 терафлопса (триллиона операций с плавающей запятой в секунду). Полгода назад на последней строчке находилась система с быстродействием 432 терафлопса.

По общему количеству систем в рейтинге лидирует Китай, на счету которого 202 комплекса. Далее идут Соединённые Штаты со 143 системами. Япония с 35 суперкомпьютерами находится на третьем месте.

Лидирующую позицию, как уже отмечалось, продолжает удерживать китайский монстр Sunway TaihuLight, быстродействие которого составляет 93 петафлопса, а пиковая производительность теоретически может достигать 125 петафлопсов.

На второй строке располагается ещё одна система из КНР — Tianhe-2 (MilkyWay-2) с мощностью в 33,9 петафлопса. «Бронза» досталась швейцарской системе Piz Daint с 19,6 петафлопса.

Самый мощный российский суперкомпьютер — «Ломоносов-2» — располагается на 63 строке с быстродействием в 2,1 петафлопса. 

Постоянный URL: http://servernews.ru/961477
Система Orphus