Материалы по тегу: top500

14.11.2017 [18:00], Иван Грудцын

NVIDIA строит суперкомпьютер на 5280 ускорителях Tesla V100

Год назад компания NVIDIA представила суперкомпьютер DGX SaturnV для исследований в области искусственного интеллекта. Система включала 125 серверных узла DGX-1 (стоимостью $129 000 каждый) с весьма достойным соотношением производительности и энергопотребления, равным 9,46 Гфлопс/Вт. В престижном рейтинге TOP500 годичной давности сервер занял почётное 28 место, но за год опустился на восемь строчек, и в Санта-Кларе было принято решение построить подобный суперкомпьютер с бóльшим количеством узлов — 660 шт. При этом вместо DGX-1 на основе HPC-ускорителей Tesla P100 (Pascal) была сделана ставка на более мощные одноимённые узлы, оснащённые ускорителями Tesla V100 (Volta) — по восемь штук на узел, как и в DGX SaturnV первого поколения.


Согласно подсчётам NVIDIA, решение задач из области глубинного обучения занимает у восьми адаптеров Tesla V100 почти в два с половиной раза меньше времени, чем у DGX-1 с восемью Tesla P100, а «чистая» производительность в вычислениях половинной точности (они же FP16 или, по определению NVIDIA, «AI-вычисления») выше почти в шесть раз. Суммарная производительность 124 узлов DGX-1/P100 составляет всего 21,25 Пфлопс FP16, тогда как 660 узлов DGX-1/V100 — 660 Пфлопс.

DGX-1 на базе Tesla V100

NVIDIA DGX-1

«Пробный» сервер DGX SaturnV с несколькими десятками узлов DGX-1/V100 прописался на 149 месте в TOP500 и на почётном 4 месте в Green500.

Соотношение производительности и энергопотребления выросло с 9,46 Гфлопс/Вт до 15,11 Гфлопс/Вт, но для сотен узлов нового DGX SaturnV всё равно необходимы порядка 2 МВт мощности. Таким образом, количество блоков питания измеряется уже не сотнями, как у прошлогоднего SaturnV, а тысячами. На один серверный узел DGX-1 по-прежнему приходится два 20-ядерных процессора Intel Xeon E5-2698 v4 (Broadwell-EP) с частотой от 2,2 до 3,6 ГГц. Объём оперативной памяти LRDIMM DDR4-2133 составляет 512 Гбайт на узел, также применяются четыре 1,92-Тбайт SSD-накопителя.

Судя по отсутствию нового DGX SaturnV на третьей строчке в TOP500, где он мог бы оказаться с ~30 Пфлопс в Linpack, сборка суперкомпьютера займёт ещё какое-то время. Параллельно NVIDIA принимает заказы на AI-серверы с DGX-1/V100 в качестве «строительного блока». Один такой «кирпич» (узел) стоит $149 000 — на 20 тыс. долларов дороже, чем аналог на Tesla P100.

Постоянный URL: http://servernews.ru/961485
14.11.2017 [13:00], Сергей Карасёв

Представлена юбилейная редакция мирового рейтинга суперкомпьютеров Top500

Обнародована юбилейная пятидесятая редакция рейтинга мощнейших вычислительных систем мира Top500. Забегая вперёд скажем, что лидерство сохранил китайский суперкомпьютер Sunway TaihuLight.

Суммарная производительность входящих в рейтинг вычислительных комплексов достигла 845 петафлопсов (квадриллионов операций с плавающей запятой в секунду). Для сравнения: шесть месяцев назад этот показатель равнялся 749 петафлопсам, а год назад — 672 петафлопсам.

Из 500 вошедших в рейтинг систем в 471 применяются процессоры Intel. Таким образом, доля этих суперкомпьютеров достигла 94,2 %. Ещё 14 комплексов полагаются на процессоры IBM Power.

Производительность наименее мощного суперкомпьютера в рейтинге составляет 548,7 терафлопса (триллиона операций с плавающей запятой в секунду). Полгода назад на последней строчке находилась система с быстродействием 432 терафлопса.

По общему количеству систем в рейтинге лидирует Китай, на счету которого 202 комплекса. Далее идут Соединённые Штаты со 143 системами. Япония с 35 суперкомпьютерами находится на третьем месте.

Лидирующую позицию, как уже отмечалось, продолжает удерживать китайский монстр Sunway TaihuLight, быстродействие которого составляет 93 петафлопса, а пиковая производительность теоретически может достигать 125 петафлопсов.

На второй строке располагается ещё одна система из КНР — Tianhe-2 (MilkyWay-2) с мощностью в 33,9 петафлопса. «Бронза» досталась швейцарской системе Piz Daint с 19,6 петафлопса.

Самый мощный российский суперкомпьютер — «Ломоносов-2» — располагается на 63 строке с быстродействием в 2,1 петафлопса. 

Постоянный URL: http://servernews.ru/961477
26.09.2017 [06:53], Алексей Степин

Производительность суперкомпьютера Tianhe-2 будет доведена до 95 петафлопс

Согласно спискам Top500 по состоянию на июнь 2017 года первым в мире по вычислительной мощности по-прежнему остаётся китайский суперкомпьютер Sunway TaihuLight с пиковой производительностью свыше 93 петафлопс. Мы уже рассказывали читателям о его составляющих, в частности, довольно уникальных по архитектуре процессорах.

Но у чемпиона появился опаснейший соперник, правда, родом тоже из КНР. Это суперкомпьютер Tianhe-2, занимавший до недавнего времени вторую строку в рейтинге Top500 с показателем пиковой производительности почти 34 петафлопса. Затем он был разогнан до 55 петафлопс, а теперь пришло время дать бой лидеру.

Tianhe-2: до и после

Tianhe-2: до и после

В последнем варианте Tianhe-2 базировался на связках Intel Xeon и Xeon Phi, таких узлов у него было 16 тысяч. В качестве межблочной связи использовался стандарт 10 Гбит/с с задержкой 1,57 микросекунды, объём оперативной памяти составлял 1,4 петабайт, объём хранимых данных — 12,4 петабайт. Максимальная скорость работы с «дисковой» подсистемой могла достигать 512 Гбайт/с.

Свежая кровь: сопроцессор Matrix-2000

Свежая кровь: сопроцессор Matrix-2000

В настоящее время Tianhe-2 подвергается самой серьёзной модернизации за всю свою рабочую карьеру. Новая система будет называться Tianhe-2A, а место ускорителей Xeon Phi в ней займут сопроцессоры Matrix-2000 с уникальной архитектурой, разработанной китайскими специалистами. Чип этот являет собой разновидность DSP, оптимизированную, однако, с прицелом на вычисления общего характера. Декларируется поддержка OpenMP/OpenCL.

Общий план системы и межузловых соединений

Общий план системы и межузловых соединений

В результате подобного апгрейда количество узлов в системе увеличится до 17792, а пиковая производительность при этом почти достигнет 95 петафплос (94,97 петафлопс в проекте). Сетевая подсистема также подвергнется модернизации и скорость передачи данных в среде увеличится до 14 Гбит/с, а латентность упадет до 1 микросекунды. Объём оперативной памяти нарастят до 3,4 петабайт, «дисковой» — до 19 петабайт, а скорость доступа к последней достигнет 1 Тбайт/с.

Старый узел на базе Xeon Phi (слева) и новый на базе Matrix-2000. Процессоры припаиваются непосредственно к плате

Старый узел на базе Xeon Phi (слева) и новый на базе Matrix-2000. Процессоры припаиваются непосредственно к плате

Вырастет и энергоэффективность: если раньше удельная производительность составляла 1,9 гигафлопс на ватт, то после модернизации этот показатель превысит 5 гигафлопс на ватт. Впрочем, «смены власти», скорее всего, не произойдет: если в тестах High Performance Linpack TaihuLight может достичь показателя 125,4 петафлопса, то прогнозы по Tianhe-2 скромнее и находятся в районе 70‒80 петафлопс.

Постоянный URL: http://servernews.ru/959041
19.06.2017 [12:20], Сергей Карасёв

Лидерство в новом рейтинге суперкомпьютеров Top500 сохранил китайский комплекс

Сегодня, 19 июня, обнародована 49 редакция рейтинга мощнейших вычислительных систем мира Top500: ознакомиться с обновлённым списком можно на официальном сайте проекта.

Лидирующую позицию продолжает удерживать китайский суперкомпьютер Sunway TaihuLight, насчитывающий 10 649 600 вычислительных ядер. Его быстродействие составляет 93 петафлопса (квадриллиона операций с плавающей запятой в секунду), а пиковая производительность теоретически может достигать 125 петафлопсов.

На второй строке располагается ещё один «китаец» — комплекс Tianhe-2 (MilkyWay-2). Он обладает быстродействием в 33,86 петафлопса, тогда как пиковая производительность достигает 54,9 петафлопса.

На третье место вырвалась швейцарская система Piz Daint. Этот суперкомпьютер подвергся модернизации, в результате которой быстродействие достигло 19,59 петафлопса. Показатель пиковой производительности — 25,33 петафлопса.

Таким образом, в тройке лидеров теперь отсутствуют системы из Соединённых Штатов. Самый мощный американский комплекс Titan отныне довольствуется четвёртой позицией: его быстродействие — 17,59 петафлопса.

Самым быстрым российским суперкомпьютером остаётся «Ломоносов-2», установленный в Московском государственном университете (МГУ). Его производительность достигает 2,10 петафлопса, пиковая производительность — 2,96 петафлопса. Это соответствует 59 позиции в нынешнем рейтинге.

Суммарное быстродействие всех входящих в рейтинг систем теперь составляет 749 петафлопсов — это на треть больше прошлогоднего результата. На системы с чипами  Intel (Xeon и Xeon Phi) приходится 464 суперкомпьютера из 500. Ещё 21 комплекс полагается на процессоры IBM Power, шесть — на чипы AMD Opteron. 

Постоянный URL: http://servernews.ru/954158
15.11.2016 [12:44], Александр Будик

Рейтинг суперкомпьютеров TOP500: самые интересные факты

В ходе конференции SC16, проходящей в Солт-Лейк-Сити, представлена сорок восьмая редакция списка самых быстрых суперкомпьютеров мира TOP500. Интересно наблюдать за сражением двух лидеров отрасли — Китая и США. В этом году они идут практически на равных по количеству систем в списке и их совокупной мощности, но с точки зрения престижа Китай выигрывает, занимая первую и вторую строчки рейтинга.

Самый быстрый суперкомпьютер в мире Sunway TaihuLight

Самый быстрый суперкомпьютер в мире Sunway TaihuLight

По-прежнему недосягаемым лидером остаётся Sunway TaihuLight с производительностью 93 петафлопс. Эта монструозная система включает почти 11 миллионов вычислительных ядер, а её потребляемая мощность достигает 15,4 МВт. За ней следует Tianhe-2 с производительностью 34 петафлопс. По энергоэффективности она существенно уступает лидеру. При количестве ядер 3,1 млн и в три раза меньшей производительности Tianhe-2 потребляет 17,8 МВт электроэнергии. Третью позицию занял суперкомпьютер Titan из США с производительностью 17,6 петафлопс. Также системы США завоевали четвёртую и пятую строчки рейтинга — Sequoia и Cori. Шестое и седьмое места удерживает Япония со своими системами Oakforest-PACS и легендарным K Computer, который, напомним, был построен ещё в 2011 году и стал первым в истории компьютером, преодолевшим рубеж 10 петафлопс. Далее в рейтинге следуют шведская разработка Piz Daint и две системы из США — Mira и Trinity.

Другой суперкомпьютер из Китая Tianhe-2 в этом году занял вторую позицию

Другой суперкомпьютер из Китая Tianhe-2 в этом году занял вторую позицию

По количеству суперкомпьютеров с списке TOP500 вслед за Китаем и США следует Германия с показателем 31. Япония занимает четвёртую позицию с количеством систем 27. Далее следуют Франция (20), Великобритания (13). Китай и США теперь включают по 171 суперкомпьютеру, хотя ещё год назад США были явным лидером, имея в TOP500 200 систем против 108 у Китая.

Совокупная производительность всех систем в списке составила 672 петафлопс, что на 60 % выше по сравнению с прошлым годом. Вклад суперкомпьютеров США в этот результат составляет 33,9 %, Китая — 33,3 %. Интересно отметить, что в рейтинге уже насчитывается 117 систем, преодолевших рубеж в 1 петафлопс.

Что касается энергоэффективности, то лидером здесь является система DXG SATURNV, разработанная компанией NVIDIA. Её особенностью являются новые ускорители P100, которые обеспечили 3,3-петафлопсному кластеру энергоэффективность 9,46 гигафлопс на ватт. Второе место занимает уже упомянутая выше система Piz Daint с показателем 7,45 гигафлопс на ватт.

Из 86 систем, использующих сопроцессоры в виде видеочипов, 60 оснащены NVIDIA GPU, 21 — Intel Xeon Phi, 1 — AMD FirePro, 1 — PEZY-технологией, 3 — одновременно используют NVIDIA GPU и Xeon Phi. Процессоры Intel используются в 92,4 % суперкомпьютеров. Количество систем на базе IBM Power составило 22. Доля AMD продолжает снижаться — теперь на её процессорах построено всего 7 систем из списка TOP500. Что касается коммуникационных технологий, то наиболее активно используются InfiniBand (187 систем), Gigabit Ethernet (206 систем), 10G Ethernet (178 систем), Intel Omni-Path (28 систем).  

Постоянный URL: http://servernews.ru/942710
21.06.2016 [10:05], Сергей Юртайкин

Лишённый американских чипов китайский суперкомпьютер признан самым мощным в мире

Впервые в истории рейтинг самых мощных в мире суперкомпьютеров Top500 возглавила китайская система, не использующая американские полупроводниковые технологии, передаёт The Wall Street Journal.

Речь идёт о машине Sunway TaihuLight, расположенной в Национальном центре суперкомпьютеров в городе Уси (провинция Цзянсу, КНР). Она использует процессоры, созданные в государственном Шанхайском центре разработки высокопроизводительных микросхем (Shanghai High Performance IC Design Center).

insidehpc.com

insidehpc.com

Производительность суперкомпьютера измеряется 93 петафлопсами, что сразу втрое больше по сравнению с прежним лидером рейтинга — системой Tianhe-2, которая также находится в Китае и которая использует процессоры Intel.

Sunway TaihuLight содержит около 41 тыс. чипов с 260 вычислительными ядрами каждый, что соответствует примерно 10,65 млн ядер. Для сравнения, у самого быстрого американского супер-ПК насчитывается в общей сложности 560 тыс. ядер.

Sunway TaihuLight применяется для расчётов при производстве, составлении прогнозов погоды и для анализа больших объёмов данных.

wsj.com

wsj.com

Среди российских суперкомпьютеров выше всех в Top500 находится «Ломоносов-2», который занял 41-е место в рейтинге, имея производительность 2,1 петафлопса. Годом ранее машина находилась на 31-й позиции.  

Постоянный URL: http://servernews.ru/934940
15.07.2015 [11:11], Александр Будик

Суперкомпьютер из Саудовской Аравии вошёл в десятку TOP500

Уже пятый раз подряд суперкомпьютер Tianhe-2, разработанный Национальным университетом оборонных технологий Китая, удерживает первую строчку в рейтинге самых мощных систем TOP500. Согласно 45-ой редакции списка самых производительных суперкомпьютеров мира, Tianhe-2 лидирует с показателем 33,86 петафлопс в бенчмарке Linpack.

BGR

BGR

Вторую позицию заняла система Titan на базе Cray XK7, установленная в Национальной лаборатории Оук-Ридж. Она отличилась производительностью 17,59 петафплос. В первой десятке TOP500 появился новичок — суперкомпьютер Shaheen II, установленный в Университете науки и технологий Кинга Абдуллы в Саудовской Аравии. Эта система с производительностью 5,536 петафлопс заняла седьмое место. Это самая высокая позиция в рейтинге среди всех суперкомпьютеров Ближнего Востока за 22-летнюю историю TOP500.

BGR

BGR

США остаются ведущей страной по супервычислениям в количественном плане. Здесь установлено 233 системы, вошедшие в рейтинг TOP500. Количество европейских систем выросло со 130 до 141, а Азия сдала позиции — со 120 до 108. Интересно, что Китай, несмотря на успешный проект Tianhe-2, также показал спад. В TOP500 вошли 37 суперкомпьютеров Китая, тогда как в предыдущей редакции списка их насчитывалось 61. А вот Япония увеличила свой результат с 32 до 39 суперкомпьютеров.

И ещё несколько интересных статистических данных. Совокупная производительность всех пятисот систем рейтинга составила 363 петафлопс, что выше показателя 309 петафлопс предыдущего списка. Теперь в списке насчитывается 68 систем с производительностью выше 1 петафлопс. По количеству систем в TOP500 лидирует компания HP с показателем 178 суперкомпьютеров, а вторую строчку занимает IBM — 111. В предыдущей редакции списка HP имела 179 позиций, а IBM — 153.

Постоянный URL: http://servernews.ru/917121
20.11.2014 [15:04], Андрей Крупин

Суммарная производительность систем РСК в рейтинге суперкомпьютеров TOP500 превысила 2 Пфлопс

Количество вычислительных решений производства российской группы компаний РСК удвоилось в рейтинге TOP500 самых мощных суперкомпьютеров мира. В новую 44-ю редакцию этого списка вошли четыре системы РСК, при этом компания лидирует с долей 44% среди всех российских суперкомпьютеров в TOP500. Суммарная пиковая производительность систем РСК в этом мировом рейтинге превысила 2 Пфлопс. Всего в текущей редакции списка представлено 9 суперкомпьютеров отечественного производства.

Говоря о представленных в TOP500 решениях, компания РСК прежде всего выделяет созданную для Санкт-Петербургского государственного политехнического университета (СПбПУ) кластерную систему «Политехник РСК Торнадо», которая вошла в первую сотню списка и заняла 81-е место с производительностью 658 Тфлопс в тесте Linpack. Пиковая производительность вычислительного кластера СПбПУ на базе архитектуры «РСК Торнадо» с прямым жидкостным охлаждением составила 829 Тфлопс. «Политехник РСК Торнадо» состоит из 712 двухпроцессорных узлов, включающих 1424 серверных процессора Intel Xeon E5-2697 v3 (14 ядер в каждом с тактовой частотой 2,6 МГц), серверные платы Intel S2600KP и S2600WT, твердотельные накопители Intel SSD DC S3500 и SSD DC P3700 на основе архитектуры NVM Express.

На 133-й позиции списка находится разработанный специалистами РСК суперкомпьютер МВС-10П с пиковой производительностью 523 Тфлопс, развернутый в Межведомственном суперкомпьютерном центре Российской академии наук. 190-е место в TOP500 занимает вычислительный кластер «РСК Торнадо ЮУрГУ» с пиковой производительностью 473 Тфлопс, эксплуатируемый с 2009 года в Южно-Уральском государственном университете в Челябинске.

Четвертой машиной РСК в мировом рейтинге суперкомпьютеров является суперкомпьютер «Политехник RSC PetaStream», продемонстрировавший производительность 170,5 Тфлопс в бенчмарке Linpack и фигурирующий на 390-й позиции в текущей редакции списка TOP500. Эта вычислительная система также спроектирована для суперкомпьютерного центра СПбПУ. Она построена на базе 60-ядерных Intel Xeon Phi 5120D и процессоров семейства Intel Xeon E5-2600 v2, а также серверных плат Intel и твердотельных накопителей Intel SSD DC S3700.

Дополнительные сведения о суперкомпьютерных комплексах РСК представлены на сайте rscgroup.ru.

Материалы по теме:

Источник:

Постоянный URL: http://servernews.ru/905501
18.11.2014 [12:47], Александр Будик

Китайский суперкомпьютер вновь удержал первенство в TOP500

Опубликована сорок четвёртая редакция рейтинга самых быстрых суперкомпьютеров в мире TOP500, который обновляется два раза в год. Вот уже четвертый раз подряд Tianhe-2, разработанный Национальным университетом оборонных технологий Китая, занял почётное первое место в списке TOP500. В бенчмарке LINPACK система показала производительность 33,86 петафлопс (квадриллионов вычислений в секунду).

news.cn

news.cn

Интересно, что в первой десятке самых быстрых систем изменения незначительные. Единственным новичком здесь стал суперкомпьютер Cray CS-Storm, установленный в одной из правительственных организаций США (её место не уточняется). Эта система характеризуется производительностью 3,57 петафлопс, что обеспечило ей десятое место в списке.

top500.org

top500.org

США остаются передовой страной в терминах общего количества суперкомпьютеров, входящих в TOP500, но тенденция негативная. Если в ноябре 2013 года их число составляло 265, в июне 2014 года сократилось до 233, то в новой редакции этот показатель уменьшился ещё до 231 системы. А вот европейцы прогрессируют. По сравнению с июнем количество европейских суперкомпьютеров в списке TOP500 увеличилось со 116 до 130. Азия показала спад со 132 до 120. Китай сократил присутствие в рейтинге с 76 до 61 позиции, а Япония увеличила с 30 до 32.

Интересно отметить некоторую статистическую информацию. Совокупная мощность всех систем выросла с 274 петафлопс в июне до 309 петафлопс. Если шесть месяцев назад количество систем, преодолевших петафлопсный барьер, составляло 37, то теперь их число увеличилось до 50. Ощутимо увеличивается число систем, использующих архитектуру с сопроцессорами и ускорителями. 50 машин из 75 оснащены чипами NVIDIA, 25 включают Xeon Phi и только 3 системы используют Radeon.

Постоянный URL: http://servernews.ru/905327
19.11.2013 [12:45], Александр Будик

Новый список TOP500: количество «петафлопсных» систем увеличено в 6 раз

В сорок второй редакции списка самых быстрых суперкомпьютеров TOP500 система Китайского Национального университета оборонных технологий Tianhe-2 удержала первенство. Производительность мощнейшей машины составляет 33,86 петафлопс (квадриллионов операций с плавающей запятой в секунду), согласно бенчмарку Linpack.

Вторую позицию удержал суперкомпьютер Titan Cray XK7, установленный в Национальной лаборатории Оук-Ридж. Его достижение — 17,59 петафлопс. Эта система является одной из наиболее энергоэффективных в списке TOP500, потребляя 8,21 МВт (производительность в расчете на 1 Вт потребляемой мощности составляет 2,143 гигафлопс/Вт). Замыкает тройку лидеров IBM Sequoia с показателем 17,17 петафлопс.

Далее в списке самых мощных систем следуют Fujitsu K (10,51 петафлопс), Mira BlueGene/Q (8,59 петафлопс). Из новичков стоит отметить Cray XC20, установленный в Швейцарском Национальном Центре Супервычислений, с производительностью 6,27 петафлопс. Эта система вписана в шестую строчку рейтинга.

В числе прочих интересных вычислительных комплексов, попавших в TOP500, следует отметить швейцарский суперкомпьютер с GPU-ускорением Piz Daint. Он достиг отметки в 6,2 петафлопс в бенчмарке Linpack и стал одним из самых быстрых суперкомпьютеров в Европе. С точки зрения энергоэффективности Piz Daint является первой системой петафлопсного уровня, которая преодолела барьер в 3 гигафлопса на ватт (3,11 гигафлопс/Вт). Это почти на 50% эффективнее, чем у следующей в рейтинге петафлопсной системы, демонстрирующей результат 2,17 гигафлопс/Вт.

В целом, в списке TOP500 насчитывается 31 система с производительностью более одного петафлопс. Интересно, что в июне текущего года таких систем было всего пять. Суперкомпьютеры первой и седьмой строчки рейтинга используют процессоры Intel Xeon Phi. Системы, занимающие вторую и шестую позиции, используют NVIDIA GPU для ускорения вычислений. Самыми популярными в отрасли остаются процессоры Intel (82,4%). 94% участников TOP500 спроектированы на базе чипов с числом ядер шесть и более.

Напомним, предыдущая редакция рейтинга TOP500 была опубликована в июне текущего года.

Постоянный URL: http://servernews.ru/779788
Система Orphus