Материалы по тегу: вычисления

31.12.2017 [12:07], Алексей Степин

NVIDIA Volta экономит электричество в суперкомпьютерах

Джек Донгарра (Jack Dongarra), заслуженный профессор университета Теннесси, известный исследователь, работающий в лаборатории Ок-Ридж (Oak Ridge National Laboratory, ORNL), один из отцов-создателей кластерной системы Summit, в докладе, сделанном на мероприятии SC17, подробно осветил тему экономичности суперкомпьютеров, и как в этом помогает новое поколение ускорителей NVIDIA Volta.

Сам по себе доклад также весьма интересен — хотя бы графиком роста производительности кластерных систем с 1994 года по настоящее время. Если в начале пути суперкомпьютеры могли похвастаться мощностями порядка 1,17 терафлопс, и это в лучшем случае, то сегодня мы вплотную приближаемся к отметке 1 экзафлопс, что на шесть порядков выше (1012 против 1018). Петафлопсный масштаб освоен нашей цивилизацией полностью: по состоянию на 2017 год в мире действует 181 система с таким порядком производительности.

Что касается Volta, то в тесте MAGMA 2.3 LU (факторизация, двойная точность), V100 демонстрирует десятикратное превосходство над классическими процессорами (Haswell E5-2650 v3, 2×10 ядер, 2,3 ГГц) при равном уровне энергопотребления. Не стоит и говорить, насколько это важно при масштабах энергопотребления и тепловыделения суперкомпьютеров. Помогают V100 и тензорные ядра: на задачах с математикой смешанной точности в режиме FP16 чип выдает 120 терафлопс, в то время, как без них этот показатель составляет лишь 30 терафлопс. В целом, всё звучит вполне логично: время обычных ЦП ушло, а на их место пришли специализированные решения с особой архитектурой и высокой степенью параллелизма.

Постоянный URL: http://servernews.ru/963580
26.12.2017 [13:07], Сергей Карасёв

Lenovo и Intel построят в Европе один из мощнейших суперкомпьютеров

Компании Lenovo и Intel развернут в Европе высокопроизводительный вычислительный комплекс, который сможет претендовать на одну из первых строк в рейтинге мощнейших суперкомпьютеров мира Top500.

Система SuperMUC-NG проектируется в интересах суперкомпьютерного центра имени Лейбница (LRZ) Баварской академии наук в Мюнхене, Германия. Проект реализуется с использованием более 6500 вычислительных узлов Lenovo Think System SD650 следующего поколения, процессоров Intel Xeon Platinum с технологией Intel Advanced Vector Extensions (Intel AVX 512) и архитектуры Intel Omni-Path.

Ожидается, что работы по строительству комплекса завершатся в конце 2018 года. Система обеспечит вычислительную мощность в 26,7 петафлопса (квадриллиона операций с плавающей запятой в секунду).

Для сравнения: лидирующую позицию в текущем рейтинге Тор500 занимает китайский суперкомпьютер Sunway TaihuLight, быстродействие которого составляет 93 петафлопса. На второй строке располагается система Tianhe-2 (MilkyWay-2) с мощностью в 33,9 петафлопса, а на третьей — комплекс Piz Daint с производительностью в 19,6 петафлопса.

Благодаря технической оптимизации Intel, а также использованию новейшей технологии водяного охлаждения Lenovo, которая отводит выделенную тепловую энергию и поддерживает оптимальную температуру в системе, суперкомпьютер SuperMUC-NG позволит сократить расходы на сопровождение. В сочетании с программным обеспечением Lenovo Energy Aware Run-Time (EAR), которое динамически контролирует мощность системной инфраструктуры во время работы приложений, комплексная технология водяного охлаждения Lenovo обеспечивает LRZ на 45 % большую экономию электроэнергии по сравнению с аналогичной системой воздушного охлаждения.

После ввода в строй суперкомпьютер SuperMUC-NG будет использоваться в исследованиях по целому ряду научных дисциплин — астрофизике, гидродинамике, биологии, медицине и другим. 

Постоянный URL: http://servernews.ru/963403
12.12.2017 [14:04], Сергей Карасёв

Microsoft выпустила пакет средств разработки для квантовых компьютеров

Корпорация Microsoft объявила о выпуске бесплатной предварительной версии пакета средств квантовой разработки Quantum Development Kit.

Новый инструментарий ориентирован на разработчиков, желающих научиться программировать на квантовых компьютерах, независимо от их уровня подготовки.

Квантовые компьютеры состоят из элементарных вычислительных элементов, квантовых битов — кубитов. Если классические биты могут находиться только в двух состояниях (ноль или единица), то кубиты могут находиться в суперпозиции двух состояний. Квантовые компьютеры смогут решать некоторые задачи, которые сейчас абсолютно недоступны даже для самых мощных классических суперкомпьютеров.

Пакет Quantum Development Kit включает язык программирования Q#, эмулятор квантовых вычислений и другие ресурсы для людей, желающих начать писать приложения для квантового компьютера. Q# — совершенно новый язык программирования, созданный специально для квантовых вычислений.

Инструментарий тесно интегрирован со средой разработки Microsoft Visual Studio, поэтому некоторые его аспекты будут знакомы тем, кто уже разрабатывает приложения на других языках программирования. Для работы необходим входящий в состав пакета локальный квантовый эмулятор, позволяющий эмулировать около 30 логических кубитов квантовой вычислительной мощности на типичном ноутбуке.

Пакет средств разработки позволит создавать приложения, которые можно уже сейчас запустить на эмуляторе квантового компьютера и которые смогут работать на топологическом квантовом компьютере, разрабатываемом Microsoft для общецелевых квантовых вычислений. 

Постоянный URL: http://servernews.ru/962782
07.12.2017 [19:25], Алексей Степин

Президенту PEZY Computing предъявлены обвинения в мошенничестве

Об уникальных японских процессорах PEZY-SC мы рассказываем читателям не первый год. Впервые о них мы поведали в 2016 году во время конференции ISC 2016, а на ISC 2017 компания-разработчик представила PEZY-SC2 — ещё более быструю версию предыдущей архитектуры. Процессор, кроме того, использовал уникальную технологию внутричиповых соединений TCI на базе индуктивных пар. Однако дела у компании идут далеко не гладко. Президент PEZY Computing Мотоаки Сайто (Motoaki Saito) и ещё один сотрудник компании Дайсукэ Сузуки (Daisuke Suzuki) были арестованы во вторник пятого декабря.

Согласно официальной версии, главная вина подозреваемых заключается в получении мошенническим путём государственных средств на сумму 431 млн иен (порядка 3,8 млн долларов США). Если верить предъявленным обвинениям, схема мошенничества довольно проста: компания, как это нередко бывает, получала субсидирования от государства, в частности, от организации NEDO (New Energy and Industrial Technology Development Organization), но в итоге себестоимость разработок PEZY была обманным путём завышена, и разницу в сумме руководители использовали в личных целях. Именно это и является составом преступления по мнению местных правоохранительных органов.

Сбудутся ли теперь амбициозные планы PEZY?

Сбудутся ли теперь амбициозные планы PEZY?

Сумма почти в 4 миллиона долларов США не выглядит маленькой, поскольку семилетний капитал самой PEZY оценивается примерно в 940 млн иен (около $8,4 млн), а планы у компании самые наполеоновские: уже в следующем году был запланирован выпуск 7-нм чипа PEZY-SC3 с 8192 ядрами, а на 2020 год был назначен настоящий монстр — PEZY SC4, использующий уже 5-нм техпроцесс и располагающий 16384 ядрами. В настоящее время PEZY-SC2 являются основой гибридного суперкомпьютера Gyoukou производительностью 19,4 петафлопс, который, согласно последним отчетам, занимает четвёртую строчку рейтинга Top 500. Используется этот уникальный процессор и в других японских кластерных системах. Как скажется судебный процесс над главой компании на её весьма амбициозных планах — пока неясно.

Постоянный URL: http://servernews.ru/962581
07.12.2017 [18:44], Алексей Степин

Новый кластер NVIDIA Saturn V: некоторые подробности

Крупнейшие разработчики и производители микропроцессоров не очень-то любят рассказывать о своих проектах суперкомпьютеров, и информацию о таких проектах буквально приходится выцеживать по крупицам. Оригинальный узловой сервер NVIDIA DGX-1, являющийся основой кластера Saturn V, был представлен ещё на конференции SC16. Вся система состояла из 124 серверов DGX-1P, в каждом из которых было установлено по два 20-ядерных процессора Broadwell-EP с частотой 2,2 ГГц и по 8 ускорителей на базе Pascal P100 в форм-факторе SXM2, позволявшим пользоваться интерфейсом NVLink 1.0. На сегодня, однако, в руках NVIDIA есть куда более подходящий ускоритель - Tesla V100, чьи тензорные ядра делают его отличным решением для задач машинного обучения.

С четырьмя узлами DGX-1P, каждый из которых, к слову, мог потреблять до 3200 ватт, система смогла достичь пиковой производительности 4,9 петафлопса на вычислениях двойной точности. Тест матричной математики Linpack Fortran показал 67,5 % эффективности (3,31 петафлопса), что обеспечило системе 28 место в списке Top 500 на ноябрь 2016 года. Стоимость Saturn V составила $13 миллионов. Если бы процессоры Xeon имели интерфейс NVLink, производительность была бы выше, но они такового не имеют, вот почему NVIDIA вкладывает усилия в создание нового узлового сервера на базе процессоров POWER9. Назовём такую модель DGP-1V: в этом названии зашифровано сочетание POWER9 и ускорителей Volta. Новая версия NVLink 2.0 и когерентность кешей ЦП и ГП должна существенно увеличить эффективность такого сервера.

От малого к большому: иерархия узлов Saturn V

От малого к большому: иерархия узлов Saturn V

Новый Saturn V в максимальной конфигурации будет насчитывать до 660 узлов, оснащённых ускорителями Tesla V100; впрочем, их количество на узел останется прежним — по восемь ускорителей на корпус. Всего в системе будет 5280 процессоров Volta, что даст ей 80 петафлопс пиковой производительности на одинарной точности и 40 петафлопс — на двойной. Но что самое важное, в задачах машинного обучения, где часто используется смесь FP16 и FP32, теоретическая эффективная производительность нового Saturn V может достичь 660 петафлопс. Пока NVIDIA протестировала лишь 33-узловую конфигурацию, показавшую 1,82 петафлопса и эффективность на уровне 58,8 %, но удельная производительность составила 15,1 Гфлопс/ватт против 9,46 Гфлопс/ватт у системы предыдущего поколения.

Среднее звено

Среднее звено

Дешёвой новая система не будет: стоимость одного узла в полном оснащении оценивается в $149 тысяч (против $129 тысяч у DGX-1P), и суперкомпьютер Saturn V в новом своём воплощении может обойтись в $100‒$110 миллионов, причём эта цена не включает программное обеспечение для машинного обучения и внешние файловые системы Lustre или GPFS. Но заявка у «зелёных» серьёзная: в районе следующего года NVIDIA надеется смонтировать полную 660-узловую версию Saturn V и достичь показателя 22,3 петафлопса в тестах Linpack, что выведет новый суперкомпьютер на третье место в списке Top 500. Особенно большие надежды возлагаются на задачи машинного обучения: DGX-1P мог обеспечивать в этих сценариях 170 терафлопс, а вот условный DGP-1V за счёт наличия тензорных ядер — уже 960 терафлопс или в 5,6 раз больше.

Высший уровень

Высший уровень

Что касается сетевой конфигурации, то основой межузловых соединений станет стандарт InfiniBand EDR со скоростью 100 Гбит/с на кабель. Доступ к основной сети и хранилищам данных обеспечит сеть Ethernet на скорости 10 Гбит/с (несколько странно, что не использован более новый стандарт 25G), а для целей управления и телеметрии хватит и обычного канала Gigabit Ethernet. На среднем уровне коммутацию IB будут выполнять устройства Mellanox Director с 216 портами, а на высшем — ещё более мощные коммутаторы той же серии с 324 портами. Узким местом система межузловых соединений, скорее всего, не станет —  у Mellanox наработан огромный опыт в этой области, и есть полный спектр решений, покрывающих все потребности NVIDIA в проектировании сетевой подсистемы нового Saturn V.

Постоянный URL: http://servernews.ru/962577
29.11.2017 [17:21], Сергей Карасёв

В России появился новый суперкомпьютер для исследований в области ИИ

Российское подразделение Siemens и Санкт-Петербургский политехнический университет Петра Великого (СПбПУ) объявили об открытии лаборатории «Промышленные системы искусственного интеллекта».

В церемонии приняли участие ректор СПбПУ Андрей Рудской и президент «Сименс» в России Дитрих Меллер. Лаборатория расположилась в научно-исследовательском корпусе университета, а её специалистам предстоит заняться работами в области электронного разума.

В проект лаборатории вложено более 20 млн рублей — эти средства предоставил концерн Siemens. Деньги, в частности, пошли на установку нового суперкомпьютера, который займётся выполнением расчётов, связанных с искусственным интеллектом (ИИ) и машинным обучением. Мощность системы составляет около 1 петафлопса — квадриллиона операций с плавающей запятой в секунду. Суперкомпьютер позволяет обеспечить решение задач глубокого машинного обучения, требующих оборудования петафлопсного уровня производительности в многопользовательском режиме.

Кроме того, выделенные на проект лаборатории средства пошли на комплекты для разработки встроенных систем искусственного интеллекта, серверное оборудование и системы хранения данных, оборудование для организации восьми рабочих мест (ноутбуки, мониторы) и др.

Новая лаборатория сосредоточится на решении актуальных задач для нужд промышленности с использованием больших данных. С помощью искусственного интеллекта будут вестись мониторинг и диагностика промышленных систем и аппаратов. Результаты исследовательских работ как в России, так и за рубежом будут применяться в высокотехнологичных областях. 

Постоянный URL: http://servernews.ru/962201
22.11.2017 [23:35], Алексей Степин

Cavium празднует ещё одну победу ARM в серверном сегменте

Архитектура x86 с нами давно. Когда-то её уделом были лишь персональные компьютеры, но в последние годы подавляющее большинство серверных систем и прочих решений класса HPC строятся именно на базе процессоров Intel или AMD. Времена господства таких архитектур, как DEC Alpha или MIPS давно позади, хотя, к примеру, IBM POWER всё ещё сопротивляется активному натиску со стороны Intel Xeon и AMD Opteron/EPYC: в свежем рейтинге TOP500 всего 24 машины из 500 используют отличную от x86 архитектуру.

Но по ряду причин x86 даже с 64-битными расширениями не является оптимальной и особенно в том случае, когда речь заходит о соотношении производительности и энергопотребления. Последнее автоматически тянет за собой и повышенное тепловыделение, что в условиях увеличения плотности размещения узлов в ЦОД и суперкомпьютерах представляет собой серьёзную проблему. У x86 есть и ещё один конкурент — это архитектура ARM, которую долгое время никто всерьёз в качестве серверной не воспринимал.

Широко известный слайд, демонстрирующий эволюцию архитектур суперкомпьютеров

Широко известный слайд, демонстрирующий эволюцию архитектур суперкомпьютеров

Однако ARM это не просто рабочая лошадка в секторе планшетов и смартфонов. Всё зависит от реализации, и некоторые варианты процессоров на базе этой архитектуры обладают весьма серьёзными возможностями. К числу таких чипов относится Cavium ThunderX2. Этот новый чип на базе ARMv8-A был продемонстрирован разработчиками ещё на ISC 2017. Характеристики его выглядят вполне солидно: здесь и 54 ядра с частотой 3 ГГц, и поддержка двухсокетных конфигураций, и шестиканальный контроллер памяти, и 24 порта SATA (и, вероятно, SAS).

Блок-схема ThunderX2

Блок-схема ThunderX2

Нельзя забывать и про встроенную поддержку Ethernet 25G, наличие 32 Мбайт общего кеша L2, интегрированные аппаратные средства шифрования и контроллер PCI Express 3.0. При этом теплопакет, по данным Cavium, не превышает 95 ватт. К сожалению, у нас пока нет возможности проверить это утверждение. Но можно представить себе, какой величины достиг бы этот показатель в случае 54-ядерного Xeon, даже в варианте Skylake. Проникновение ARM в сегмент HPC, впрочем, быстрым назвать нельзя, хотя Cavium вполне заслуженно хвалится своими успехами на этом поприще.

Процессоры Cavium используют пусть и свой, но вполне привычный разъём типа LGA

Процессоры Cavium используют пусть и свой, но вполне привычный разъём типа LGA

Одна из национальных лабораторий Министерства энергетики США — Аргоннская национальная лаборатория — объявила, что планирует установку нового кластера производства Hewlett Packard Enterprise, а основой этого кластера станут именно процессоры Cavium ThunderX2. Надо полагать, что в такой организации, как Министерство энергетики, хорошо понимают всю важность экономичности суперкомпьютеров. Кластер под названием Comanche Wave будет состоять из 32 узлов. В числе прочего его задачей будет оценка применимости ARM в сфере супервычислений и разработка соответствующего программного обеспечения, включая ARM-версию компилятора LLVM.

Потенциальный конкурент Xeon и EPYC: взгляд вблизи

Потенциальный конкурент Xeon и EPYC: взгляд вблизи

Именно Аргоннская лаборатория активно поддерживает альтернативные процессорные архитектуры и славится своими разработками для платформ PowerPC и IBM Blue Gene/Q, так что выбор места установки нового кластера не вызывает удивления. Интересно отметить, что Cavium, по сути, смогла перехватить кусок пирога буквально под носом у Intel, которой не удалось заключить контракт на установку суперкомпьютера Aurora на базе процессоров Xeon Phi Knights Hill. Лишь в 2021 году «синие» повторят попытку с процессорами x86, которые будут доступны к тому моменту. Впрочем, не факт, что это будет именно x86.

Постоянный URL: http://servernews.ru/961897
16.11.2017 [19:00], Алексей Степин

77 % новых кластерных систем и суперкомпьютеров используют InfiniBand

Как мы уже неоднократно отмечали, одной из важнейших частей любого суперкомпьютера или кластера является система межузловых соединений. Именно от неё зависит то, насколько эффективно будут распараллеливаться ресурсы, ведь медленная сеть легко может свести на нет все преимущества самых мощных процессоров и ускорителей. Сегодня Ethernet претендует на эту роль весьма активно благодаря развитию новых стандартов и достижению скоростей уровня 200 Гбит/с. Но другая технология, исторически раньше укоренившаяся в суперкомпьютерной отрасли, InfiniBand, похоже, не собирается сдавать позиции.

Mellanox Innova-2: новейшее достижение компании в области Ethernet

Mellanox Innova-2: новейшее достижение компании в области Ethernet

Говорим InfiniBand, подразумеваем Mellanox. Именно эта компания является самым активным разработчиком соответствующих устройств на рынке InfiniBand. Такое название, как ConnectX, знакомо любому, кто когда-либо интересовался тематикой высокоскоростных межсерверных соединений. Компания опубликовала последнюю статистику, согласно которой, 77 % всех суперкомпьютеров, вошедших в список TOP500 последними, в период с июня по ноябрь текущего года, используют именно InfiniBand. Таких систем в шесть раз больше, нежели применяющих сети собственной разработки и в 15 раз больше, нежели платформ, объединённых стандартом Ethernet.

А вот новейшие модели адаптеров InfiniBand используют уже новый чипсет ConnectX-6

А вот последние модели адаптеров InfiniBand используют уже новый чипсет ConnectX-6

Всего на долю InfiniBand приходится 60 % всех систем в списке, из этих 60 % две системы входят в пятёрку наиболее производительных суперкомпьютеров в мире. Как считают представители Mellanox, это закономерно, поскольку InfiniBand обладает рядом преимуществ перед Ethernet. Как минимум, данный протокол с самого начала разрабатывался, как предназначенный именно для использования в системах класса HPC, поэтому его создатели сконцентрировались на достижении не только высокой пропускной способности, но и минимизации задержек. Впрочем, Mellanox не отказывается от Ethernet. Напротив, на выставке-конференции SC17 она представила ряд интересных решений, включая новейшие «умные» ускорители на базе связки чипов ConnectX-5 и Xilinx Kintex UltraScale.

Постоянный URL: http://servernews.ru/961639
14.11.2017 [14:38], Сергей Карасёв

Рейтинг «зелёных» суперкомпьютеров возглавили три новые системы из Японии

Представлена ноябрьская редакция рейтинга Green500 — списка мощнейших вычислительных систем мира, обеспечивающих наиболее высокую энергетическую эффективность.

Сообщается, что места с первого по третье занимают новые японские системы — Shoubu system B, Suiren2 и Sakura. Энергетическая эффективность этих комплексов составляет соответственно 17,0, 16,8 и 16,7 гигафлопса (миллиарда операций с плавающей запятой в секунду) на ватт. Что касается производительности, то она достигает 842,0, 788,2 и 824,7 терафлопса (триллиона операций с плавающей запятой в секунду).

Любопытно, что лидер списка Green500 — упомянутая система Shoubu system B — в общем рейтинге суперкомпьютеров Top500 занимает лишь 259 место. В свою очередь комплекс Sunway TaihuLight, стоящий на вершине Top500, в списке Green500 оказался на 20 позиции с эффективностью около 6,1 гигафлопса на ватт.

Самым энергоэффективным российским суперкомпьютером назван «Политехник РСК Торнадо» (Polytechnic RSC Tornado), показавший результат примерно 2,1 гигафлопса на ватт. Производительность данной системы составляет 658,1 терафлопса.

Более подробно с рейтингом «зелёных» суперкомпьютеров можно ознакомиться здесь

Постоянный URL: http://servernews.ru/961480
14.11.2017 [13:00], Сергей Карасёв

Представлена юбилейная редакция мирового рейтинга суперкомпьютеров Top500

Обнародована юбилейная пятидесятая редакция рейтинга мощнейших вычислительных систем мира Top500. Забегая вперёд скажем, что лидерство сохранил китайский суперкомпьютер Sunway TaihuLight.

Суммарная производительность входящих в рейтинг вычислительных комплексов достигла 845 петафлопсов (квадриллионов операций с плавающей запятой в секунду). Для сравнения: шесть месяцев назад этот показатель равнялся 749 петафлопсам, а год назад — 672 петафлопсам.

Из 500 вошедших в рейтинг систем в 471 применяются процессоры Intel. Таким образом, доля этих суперкомпьютеров достигла 94,2 %. Ещё 14 комплексов полагаются на процессоры IBM Power.

Производительность наименее мощного суперкомпьютера в рейтинге составляет 548,7 терафлопса (триллиона операций с плавающей запятой в секунду). Полгода назад на последней строчке находилась система с быстродействием 432 терафлопса.

По общему количеству систем в рейтинге лидирует Китай, на счету которого 202 комплекса. Далее идут Соединённые Штаты со 143 системами. Япония с 35 суперкомпьютерами находится на третьем месте.

Лидирующую позицию, как уже отмечалось, продолжает удерживать китайский монстр Sunway TaihuLight, быстродействие которого составляет 93 петафлопса, а пиковая производительность теоретически может достигать 125 петафлопсов.

На второй строке располагается ещё одна система из КНР — Tianhe-2 (MilkyWay-2) с мощностью в 33,9 петафлопса. «Бронза» досталась швейцарской системе Piz Daint с 19,6 петафлопса.

Самый мощный российский суперкомпьютер — «Ломоносов-2» — располагается на 63 строке с быстродействием в 2,1 петафлопса. 

Постоянный URL: http://servernews.ru/961477
Система Orphus