Материалы по тегу: вычисления

16.11.2017 [19:00], Алексей Степин

77 % новых кластерных систем и суперкомпьютеров используют InfiniBand

Как мы уже неоднократно отмечали, одной из важнейших частей любого суперкомпьютера или кластера является система межузловых соединений. Именно от неё зависит то, насколько эффективно будут распараллеливаться ресурсы, ведь медленная сеть легко может свести на нет все преимущества самых мощных процессоров и ускорителей. Сегодня Ethernet претендует на эту роль весьма активно благодаря развитию новых стандартов и достижению скоростей уровня 200 Гбит/с. Но другая технология, исторически раньше укоренившаяся в суперкомпьютерной отрасли, InfiniBand, похоже, не собирается сдавать позиции.

Mellanox Innova-2: новейшее достижение компании в области Ethernet

Mellanox Innova-2: новейшее достижение компании в области Ethernet

Говорим InfiniBand, подразумеваем Mellanox. Именно эта компания является самым активным разработчиком соответствующих устройств на рынке InfiniBand. Такое название, как ConnectX, знакомо любому, кто когда-либо интересовался тематикой высокоскоростных межсерверных соединений. Компания опубликовала последнюю статистику, согласно которой, 77 % всех суперкомпьютеров, вошедших в список TOP500 последними, в период с июня по ноябрь текущего года, используют именно InfiniBand. Таких систем в шесть раз больше, нежели применяющих сети собственной разработки и в 15 раз больше, нежели платформ, объединённых стандартом Ethernet.

А вот новейшие модели адаптеров InfiniBand используют уже новый чипсет ConnectX-6

А вот последние модели адаптеров InfiniBand используют уже новый чипсет ConnectX-6

Всего на долю InfiniBand приходится 60 % всех систем в списке, из этих 60 % две системы входят в пятёрку наиболее производительных суперкомпьютеров в мире. Как считают представители Mellanox, это закономерно, поскольку InfiniBand обладает рядом преимуществ перед Ethernet. Как минимум, данный протокол с самого начала разрабатывался, как предназначенный именно для использования в системах класса HPC, поэтому его создатели сконцентрировались на достижении не только высокой пропускной способности, но и минимизации задержек. Впрочем, Mellanox не отказывается от Ethernet. Напротив, на выставке-конференции SC17 она представила ряд интересных решений, включая новейшие «умные» ускорители на базе связки чипов ConnectX-5 и Xilinx Kintex UltraScale.

Постоянный URL: http://servernews.ru/961639
14.11.2017 [14:38], Сергей Карасёв

Рейтинг «зелёных» суперкомпьютеров возглавили три новые системы из Японии

Представлена ноябрьская редакция рейтинга Green500 — списка мощнейших вычислительных систем мира, обеспечивающих наиболее высокую энергетическую эффективность.

Сообщается, что места с первого по третье занимают новые японские системы — Shoubu system B, Suiren2 и Sakura. Энергетическая эффективность этих комплексов составляет соответственно 17,0, 16,8 и 16,7 гигафлопса (миллиарда операций с плавающей запятой в секунду) на ватт. Что касается производительности, то она достигает 842,0, 788,2 и 824,7 терафлопса (триллиона операций с плавающей запятой в секунду).

Любопытно, что лидер списка Green500 — упомянутая система Shoubu system B — в общем рейтинге суперкомпьютеров Top500 занимает лишь 259 место. В свою очередь комплекс Sunway TaihuLight, стоящий на вершине Top500, в списке Green500 оказался на 20 позиции с эффективностью около 6,1 гигафлопса на ватт.

Самым энергоэффективным российским суперкомпьютером назван «Политехник РСК Торнадо» (Polytechnic RSC Tornado), показавший результат примерно 2,1 гигафлопса на ватт. Производительность данной системы составляет 658,1 терафлопса.

Более подробно с рейтингом «зелёных» суперкомпьютеров можно ознакомиться здесь

Постоянный URL: http://servernews.ru/961480
14.11.2017 [13:00], Сергей Карасёв

Представлена юбилейная редакция мирового рейтинга суперкомпьютеров Top500

Обнародована юбилейная пятидесятая редакция рейтинга мощнейших вычислительных систем мира Top500. Забегая вперёд скажем, что лидерство сохранил китайский суперкомпьютер Sunway TaihuLight.

Суммарная производительность входящих в рейтинг вычислительных комплексов достигла 845 петафлопсов (квадриллионов операций с плавающей запятой в секунду). Для сравнения: шесть месяцев назад этот показатель равнялся 749 петафлопсам, а год назад — 672 петафлопсам.

Из 500 вошедших в рейтинг систем в 471 применяются процессоры Intel. Таким образом, доля этих суперкомпьютеров достигла 94,2 %. Ещё 14 комплексов полагаются на процессоры IBM Power.

Производительность наименее мощного суперкомпьютера в рейтинге составляет 548,7 терафлопса (триллиона операций с плавающей запятой в секунду). Полгода назад на последней строчке находилась система с быстродействием 432 терафлопса.

По общему количеству систем в рейтинге лидирует Китай, на счету которого 202 комплекса. Далее идут Соединённые Штаты со 143 системами. Япония с 35 суперкомпьютерами находится на третьем месте.

Лидирующую позицию, как уже отмечалось, продолжает удерживать китайский монстр Sunway TaihuLight, быстродействие которого составляет 93 петафлопса, а пиковая производительность теоретически может достигать 125 петафлопсов.

На второй строке располагается ещё одна система из КНР — Tianhe-2 (MilkyWay-2) с мощностью в 33,9 петафлопса. «Бронза» досталась швейцарской системе Piz Daint с 19,6 петафлопса.

Самый мощный российский суперкомпьютер — «Ломоносов-2» — располагается на 63 строке с быстродействием в 2,1 петафлопса. 

Постоянный URL: http://servernews.ru/961477
11.11.2017 [14:27], Геннадий Детинич

IBM сообщила о разработке 50-кубитного квантового компьютера

Компания IBM продолжает двигаться во главе процесса по практической реализации квантовых вычислительных систем. Согласно официальному заявлению компании, в её недрах собран первый в мире прототип 50-кубитного квантового компьютера (процессора). Заявление IBM о первенстве можно оспорить. Летом этого года, например, в Российском квантовом центре представлен 51-кубитный квантовый компьютер, работа всех кубитов которого полностью когерентна (согласована), что важно для целостности полученных в ходе вычисления данных. Но поскольку терминология для квантовых вычислений только-только становится общепринятой на уровне индустриального стандарта, говорить о каждой системе можно только с позиций индивидуальной уникальности. До сравнения платформ дело ещё не дошло.

IBM

IBM

Возвращаясь к квантовым платформам IBM, отметим, что коммерческий запуск 50-кубитной системы пока остаётся под вопросом, хотя испытания прототипа показали соответствие полученных характеристик значениям, добытым на действующих коммерческих квантовых компьютерах IBM Q. Иными словами, прототип работает также хорошо, как коммерческие системы IBM Q. Последние представлены 5-кубитным и 16-кубитным компьютерами, удалённый доступ к которым компания открыла в мае 2016 года. Через облачные сервисы IBM и соответствующее программное обеспечение (QISKit) с открытым кодом воспользоваться квантовым компьютером IBM Q могут все желающие. По словам IBM, за это время сервисом воспользовались свыше 60 000 пользователей со всего мира. На системе IBM Q поставлено свыше 1,7 млн экспериментов и выпущено 35 научных работ. Доступ к системе оформили 1500 университетов, 300 школ и 300 частных исследовательских лабораторий.

До конца 2017 года компания введёт в эксплуатацию и сделает доступной 17-кубитную систему и в течение 2018 года доведёт мощность доступной пользователям квантовой вычислительной системы до 20 кубитов. Когерентное время для всех 20 кубитов составит 90 мкс, чего достаточно для надёжного определения квантовых значений. Добавление в систему поддержки каждого нового кубита (квантового бита) в геометрической прогрессии увеличивает производительность квантовых компьютеров (за счёт принципа суперпозиции, когда значение вычисления одновременно принимает состояние 0 и 1), чего нельзя добиться в случае классических вычислений. Считается, что производительность 50-кубитного компьютера уже не по зубам современным классическим суперкомпьютерам. Во всяком случае, с учётом разумного потребления энергии и стоимости работ.

Следует понимать, что квантовые вычисления пока нацелены на решение специфических задач, таких как молекулярная химия, биология и криптография. Это поиск новых лекарств, расшифровка генома и создание новых материалов, хотя криптография обещает оказаться главенствующей в этом списке. Квантовые вычисления обещают в один день сделать ничем современные методы шифрования. Это ставит под удар национальную безопасность всех без исключения государств и представляется веской причиной создавать квантовые вычислительные системы и изобретать новые методы шифрования. Но это уже другая история.

Постоянный URL: http://servernews.ru/961389
28.10.2017 [21:30], Алексей Степин

Amazon предлагает виртуальные системы EC2 с ускорителями Tesla V100

Компания Amazon — это не только владелец крупнейшей в мире торговой площадки, на которой можно приобрести практически всё, но и весьма серьёзный поставщик облачных услуг. К этим услугам недавно добавилась новая: компания первая в мире предложила потенциальным клиентам виртуальные системы EC2, в состав которых входят вычислительные ускорители NVIDIA Tesla V100. Нацелены такие услуги на тех, кто занимается машинным обучением, рассчитывает поведение жидкостей и газов, работает с сейсмическими данными и вообще всех тех, кому нужны серьёзные вычислительные мощности.

Возможные конфигурации новых платформ Amazon EC2

Возможные конфигурации новых платформ Amazon EC2

В настоящий момент доступны конфигурации с одним, четырьмя и восемью ускорителями Tesla V100. На каждый графический процессор приходится по восемь ядер Xeon, хотя и не уточняется какой архитектуры. Соответственно, в максимальном варианте (p3.16xlarge) в распоряжении пользователя имеется 64 виртуальных ЦП, три ускорителя V100 с общим объёмом памяти 128 Гбайт, шина NVLink (300 Гбайт/с), 488 Гбайт оперативной памяти и сетевая подсистема, работающая на скорости 25 Гбит/с. У менее мощных конфигураций эти параметры могут варьироваться в меньшую сторону. Цены довольно существенны: использование самой мощной конфигурации может стоить почти $25 в час в США и почти вдвое дороже в Японии, но всё же в ряде случаев это будет дешевле, нежели сборка собственной системы с сопоставимым уровнем производительности и поддержание её в рабочем состоянии.

NVIDIA Tesla V100: NVLink (слева) и PCI Express

NVIDIA Tesla V100: NVLink (слева) и PCI Express

Зарубежные обозреватели предполагают, что особенно востребованными новые конфигурации виртуальных машин Amazon будут у тех, кто занимается проблемами машинного обучения. Неудивительно: в составе ядра V100 имеются специальные блоки тензорных вычислений, и производительность на подобного рода задачах составляет внушительные 125 терафлопс. Но и в обычных вычислениях показатели достаточно солидны: 7,8 терафлопс в режиме FP64 и вдвое больше в режиме FP32. По всей видимости, в ближайшее время представят свои аналоги виртуальных систем с ускорителями Microsoft и Google: первая может сделать упор на широкое применение ПЛИС, а у Google есть тензорный процессор собственной разработки. Тем не менее, пальма первенства по праву принадлежит Amazon.

Постоянный URL: http://servernews.ru/960668
28.10.2017 [20:49], Алексей Степин

NEC представила новую платформу SX-Aurora TSUBASA с векторными ускорителями

Векторные процессоры NEC Aurora были представлены ещё на ISC 2017. Уже тогда была продемонстрирована возможность использования таких чипов в качестве сопроцессоров на платах расширения с разъёмом PCI Express. Назывались такие платы Vector Engine. От образцов к серийному производству путь оказался недолог: уже 26 октября компания объявила о доступности новых систем SX-Aurora TSUBASA. Это название с японского можно перевести как «крылатая». Как и предполагает концепция NEC SX, основную работу выполняют векторные процессоры, но в этой системе они используются исключительно в виде плат расширения.

Процессор с архитектурой x86 выполняет только вспомогательные задачи, в терминологии компании-разработчика он называется Vector Host. На его плечи ложатся управление подсистемой ввода-вывода, обработка вызовов ОС и прочие вспомогательные вычисления, в том числе скалярные. Основная вычислительная мощь SX-Aurora TSUBASA кроется именно в ускорителях Vector Engine. Каждый чип Vector Engine имеет 8 ядер и развивает производительность порядка 2,45 терафлопс, что в пять раз больше векторных систем NEC SX-ACE, относящихся к предыдущему поколению. Поскольку шина PCI Express может стать узким местом, на борту каждого процессора имеется некоторый объём быстрой многослойной памяти HBM2, которая играет роль своеобразного кеша. Шесть сборок гарантируют ПСП на уровне 1,2 Тбайт/с. Сами платы могут иметь как пассивное, зависящее от хост-системы охлаждение, так и активное с собственным вентилятором на борту. Теплопакет по имеющимся данным составляет около 300 ватт — вполне на уровне современных видеокарт.

Серверы серии TSUBASA могут содержать в своём составе от 1 до 8 карт Vector Engine вплоть до 64 ускорителей на стойку. Эта стойка, изображённая на первом снимке, уже сама по себе считается суперкомпьютером. В сравнении с самым мощным ускорителем NVIDIA (7,8 терафлопс) векторный процессор NEС развивает всего 31 % его мощности, зато по показателю ПСП заметно опережает своего соперника (1,2 Тбайт/с против 900 Гбайт/с). Кроме того, в ряде задач специализированная архитектура NEC показывает себя более эффективной. Поскольку архитектура NEC не имеет аналогов, компания поставляет своим клиентам не только аппаратные комплексы, но и соответствующие программные решения: компиляторы, библиотеки MPI и прочее системное ПО. Используется даже уникальная файловая система NEC Scalable Technology File System и диспетчер задач NEC Network Queuing System V. Гарантируется бинарная совместимость с машинами NEC SX предыдущего поколения.

Постоянный URL: http://servernews.ru/960659
17.10.2017 [18:12], Алексей Степин

Intel отправила экспериментальный квантовый процессор европейскому партнёру

Не столь давно корпорация Intel совершила очередной шаг в деле освоения квантовых вычислений. Она выслала рабочий образец экспериментального 17-кубитного процессора европейскому партнёру QuTech. Эта исследовательская команда работает в старейшем и крупнейшем техническом университете Нидерландов, расположенном в городе Делфт. Сотрудничество с Делтфским техническим университетом длится уже 10 лет и вложено в него $50 миллионов. Первый квантовый процессор Intel должен помочь учёным в достижении новых вех в области квантовых вычислений.

Джим Кларк (Jim Clarke), глава отдела квантовых вычислений Intel держит в руках образец чипа

Джим Кларк (Jim Clarke), глава отдела квантовых вычислений Intel держит в руках образец чипа

17 кубитов по меркам квантовых процессоров это довольно много. Хотя D-Wave и хвасталась созданием 2048-кубитного чипа ещё в 2014 году, о связности всех кубитов речи не шло. А в настоящее время считается, что для превосходства квантовых вычислений над обычными в ряде задач соответствующие процессоры должны достичь связанности в районе 50 кубитов. То есть, по сути, Intel осталось повысить связность своего квантового процессора всего в три раза. Для сравнения, ранние образцы квантовых процессоров оперировали куда меньшим количеством кубитов  — от трёх до семи, что не позволяло выполнять на них сколько-нибудь серьёзные задачи, хотя сама возможность квантовых вычислений и была успешно доказана.

Так выглядел якобы 2048-кубитный процессор D-Wave

Так выглядел якобы 2048-кубитный процессор D-Wave

Квантовые вычисления любят тишину и холод  для нормальной работы кубитов требуется температура порядка 20 милликельвин. Это очень недалеко от абсолютного нуля. Новый чип имеет оптимизированную архитектуру, в нём существенно снижено взаимное влияние кубитов друг на друга в радиодиапазоне. В сравнении с решениями других исследователей, интерфейс чипа Intel позволяет использовать в 10‒100 раз больше сигналов. Скорее всего, «квантовое превосходство» будет достигнуто уже через пару лет, но по-настоящему мощные квантовые вычислительные системы пока являются делом отдалённого будущего, поскольку в них потребуется обеспечение связности тысяч или даже миллионов кубитов.

Постоянный URL: http://servernews.ru/960129
05.10.2017 [14:14], Андрей Крупин

РСК упрочила позиции в новой редакции рейтинга TOP 50 самых мощных суперкомпьютеров СНГ

Группа компаний РСК, занимающаяся разработкой решений для сегмента высокопроизводительных вычислений и центров обработки данных, на 22% увеличила долю своих суперкомпьютеров в новой редакции рейтинга TOP 50 самых мощных вычислительных систем в России и СНГ.

В обновлённый список TOP 50 вошли одиннадцать суперкомпьютерных систем РСК, четыре из которых развёрнуты в Москве (в Межведомственном суперкомпьютерном центре Российской академии наук), два в Санкт-Петербурге (в Санкт-Петербургском политехническом университете Петра Великого), два в Челябинске (в Южно-Уральском государственном университете), один в Долгопрудном (в Московском физико-техническом институте), один в Волгограде (в Волгоградском государственном техническом университете) и один в Новосибирске (в Сибирском суперкомпьютерном центре сибирского отделения РАН).

Лидером рейтинга TOP 50 уже шесть редакций подряд остаётся установленный в МГУ имени М.В. Ломоносова суперкомпьютер «Ломоносов-2» производства компании «Т-Платформы», чья пиковая производительность составляет 2962,3 терафлопс. На второй строчке рейтинга, как и ранее, с пиковой производительностью в 1700,21 терафлопс фигурирует суперкомпьютер «Ломоносов», также установленный в МГУ и разработанный специалистами компании «Т-Платформы». Замыкает тройку фаворитов развёрнутая в Санкт-Петербургском политехническом университете система «Политехник РСК Торнадо» производства группы компаний РСК с пиковой производительностью в 1015,1 терафлопс.

В обновлённом рейтинге 49 суперкомпьютеров построены на процессорах Intel, одна система построена на процессорах IBM POWER8. Число гибридных комплексов, использующих для вычислений графические процессоры, увеличилось с 17 до 19, а количество систем с ускорителями Intel Xeon Phi на борту выросло с 8 до 9. Количество вычислительных систем на базе InfiniBand увеличилось с 32 до 33, при этом число суперкомпьютеров, использующих для взаимодействия узлов лишь коммуникационную сеть Gigabit Ethernet, сократилось с 13 до 9. Количество систем в списке на основе технологии Intel Omni-Path выросло с трёх до пяти.

Приводятся составителями рейтинга и другие количественные показатели. В частности, сообщается, что количество систем, задействованных в науке и образовании, осталось равным 18; количество систем, ориентированных на конкретные прикладные исследования, выросло с 12 до 16; число систем, используемых в промышленности, уменьшилось с 7 до 5; число систем в финансовой области осталось равным трём. По количеству представленных в списке систем лидером осталась Hewlett Packard Enterprise (13 разработанных суперкомпьютеров), далее следует РСК с 11 вычислительным комплексами и IBM с «Т-Платформы» (у каждой по 7 систем в рейтинге).

С полной версией рейтинга TOP 50 самых мощных суперкомпьютеров в России и СНГ можно ознакомиться по адресу top50.supercomputers.ru.

Материалы по теме:

Источники:

Постоянный URL: http://servernews.ru/959531
30.09.2017 [00:15], Алексей Степин

Терафлопс в космосе: на МКС тестируется компьютер HPE Spaceborne

Бытует мнение, что в космической отрасли используется всё самое лучшее, включая компьютерные компоненты. Это не совсем так: вы не встретите в космических аппаратах 18-ядерных Xeon и ускорителей Tesla. Во-первых, энергетические резервы за пределами Земли строго ограничены, и даже на МКС никто не будет тратить несколько киловатт на питание «космического суперкомпьютера». Во-вторых, практически вся электроника, работающая за пределами атмосферы, выпускается в специальном радиационно-стойком исполнении. Чаще всего за счёт техпроцессов «кремний на диэлектрике» (SOI) и «сапфировая подложка» (SOS), используется также биполярная логика вместо менее стойкой к внешним излучениям CMOS.

Мини-кластер в космическом исполнении. Охлаждение жидкостное

Мини-кластер в космическом исполнении. Охлаждение жидкостное

Мощными в космосе считаются такие решения, как BAE Systems серии RAD, особенно новая RAD5500 (от 1 до 4 ядер, 45-нм SOI, PowerPC, 64 бита). Четырёхъядерный вариант RAD5545 развивает производительность более 3,7 гигафлопс при потреблении около 20 ватт. Иными словами, вычислительные мощности в космосе тоже растут, но совсем иными темпами, нежели на Земле. Тому подтверждением служит недавно вступивший в строй на борту Международной космической станции компьютер HPE Spaceborne. Если на Земле мощность суперкомпьютеров измеряется десятками и сотнями петафлопс, то Spaceborne куда скромнее — судя по проведённым тестам, его вычислительная мощность достигает 1 терафлопса. Достигнута она путём сочетания современных процессоров Intel с ускорителями NVIDIA Tesla P100 (NVLink-версия).

Конфигурация каждого из узлов Spaceborne

Конфигурация каждого из узлов Spaceborne

Для космических систем это большое достижение, и не стоит иронизировать над этим показателем производительности. Интересно, что сама по себе система Spaceborne, доставленная на борт станции миссией SpaceX CRS-12, является своего рода экспериментом на тему «как чувствуют себя в космосе обычные компьютерные комплектующие». Это связка из двух серверов HPE Apollo 40 на базе Intel Xeon, объединённая сетью со скоростью 56 Гбит/с. 14 сентября на систему было подано питание (48 и 110 вольт), а недавно проведены первые тесты High Performance LINPACK.

Системы охлаждения и электропитания Spaceborne

Системы охлаждения и электропитания Spaceborne

Пока Spaceborne не будет использоваться для анализа научных данных или управления какими-либо системами станции. Его миссия — продемонстрировать то, насколько живучи обычные серверы в космосе. Результаты постоянных тестов будут сравниваться с аналогичной системой, оставшейся на Земле. Тем не менее, достижение первого терафлопса в космосе является своеобразным мировым рекордом. Это маленький шаг для супервычислений, но большой для всей космической индустрии, поскольку за Spaceborne явно последуют его более совершенные и мощные потомки.

Постоянный URL: http://servernews.ru/959278
29.09.2017 [23:40], Алексей Степин

Supermicro представила новые системы на базе NVIDIA Tesla V100

Одним из самых мощных вычислительных ускорителей на сегодня является NVIDIA Tesla V100, основанный на новейшей микроархитектуре Volta — она настолько нова, что на её базе пока не выпущено игровых решений. Разумеется, компания Supermicro, известнейший производитель серверных компонентов и готовых систем, не прошла мимо и объявила о поддержке обоих вариантов Tesla, как с шиной NVLink (V100 SXM2), так и в виде плат с интерфейсом PCIe (V100 PCI-E).

Система SuperServer 4028GR-TXRT поддерживает установку до восьми ускорителей Tesla с разъёмом NVLink. Эта новинка предназначена для исследований в области машинного интеллекта, глубинного машинного обучения, но пригодится она и в любом месте, где требуется серьёзный объём вычислений — в науке, медицине и инженерных отраслях. Конструктивно это стандартный корпус высотой 4U, так что проблем с интеграцией в существующую инфраструктуру нет. Есть и вариант с PCIe-ускорителями V100 — 4028GR-TRT2, но эта система вмещает уже целых 10 ускорителей. За счёт использования коммутаторов PCI Express ускорители могут общаться друг с другом напрямую.

Tesla V100 SXM2 (слева) и V100 PCI Express

Tesla V100 SXM2 (слева) и V100 PCI Express (снимок AnandTech.com)

Есть и более компактные решения: так, SuperServer 1028GQ-TRT при высоте корпуса всего 1U поддерживает установку четырёх ускорителей V100. Это идеальное решение для рендеринга, медицинской визуализации и мультимедийных приложений, включая потоковые игровые сервисы. Создание приложений, оптимизированных для работы в системах с множественными ускорителями Tesla, не так-то просто, поэтому Supermicro предлагает и рабочие станции для разработчиков такого ПО. Модель 7049GP-TRT выполнена в привычном башенном корпусе и поддерживает одновременную работу до четырёх ускорителей Tesla V100 в варианте PCI Express.

Постоянный URL: http://servernews.ru/959277