Материалы по тегу: isc

21.06.2017 [17:36], Иван Грудцын

Фото и подробные характеристики ускорителя AMD Radeon Instinct MI25

Параллельно с официальным анонсом процессоров EPYC компания AMD поведала подробности об ускорителях для систем глубинного обучения Radeon Instinct. Особый интерес представляет модель MI25, основанная на графическом процессоре Vega. Впервые об адаптере калифорнийский разработчик заговорил в декабре прошлого года, сообщив лишь отдельные его параметры. Утверждалось, что производительность Radeon Instinct MI25 составляет 12,5 Тфлопс в вычислениях одинарной точности (FP32) и 25 Тфлопс в вычислениях половинной точности (FP16), а энергопотребление — в пределах 300 Вт.

Впоследствии спецификация MI25 была изменена и уточнена. Оценка «чистой» производительности была немного уменьшена — до 12,3 Тфлопс FP32 и 24,6 Тфлопс FP16. Кроме того, паспортное энергопотребление утверждено на уровне 300 Вт, а не «до 300 Вт». Как и предполагалось, Radeon Instinct MI25 получил 64 мультипроцессорных кластера по 64 потоковых процессора в каждом (всего 4096 шт.) и 16 Гбайт буферной памяти HBM2 с поддержкой алгоритма контроля ошибок. Пропускная способность подсистемы VRAM равна 484 Гбайт/с, что соответствует частоте около 470 (1880) МГц при 2048-битной шине памяти. Частота ядра составляет приблизительно 1500 МГц, тогда как тот же чип у Radeon Vega Frontier Edition тактуется на 1600 МГц.

Ускоритель MI25 оснащён интерфейсом подключения PCI Express 3.0 x16, занимает два слота расширения в высоту и 267 мм в длину. Охлаждение у карты пассивное, поскольку предполагается, что её радиатор будут продувать высокооборотистые серверные вентиляторы. Согласно AMD, ускоритель может работать в среде 64-разрядных ОС семейства Linux с приложениями, написанными на ISO C++, OpenCL, CUDA и Python. Срок гарантии на Radeon Instinct MI25 составляет три года.

По оценке AMD, соотношение производительности и энергопотребления у MI25 значительно лучше, чем у старших моделей NVIDIA Tesla семейства Pascal.

На выставке-конференции ISC 2017 во Франкфурте нашему корреспонденту удалось запечатлеть Radeon Instinct MI25 крупным планом. Как видно на фото, для стабильной работы карта требует подключения 6- и 8-контактного кабелей PCI-E Power. Её чёрный кожух имеет рельефную поверхность. Видеовыходы не предусмотрены — ими располагает родственный MI25 ускоритель Radeon Vega Frontier Edition.

Постоянный URL: http://servernews.ru/954311
21.06.2017 [15:50], Сергей Карасёв

В рейтинге «зелёных» суперкомпьютеров лидируют системы с ускорителями NVIDIA Tesla

Опубликован свежий рейтинг Green500 — список мощнейших вычислительных систем мира, составленный с точки зрения энергетической эффективности.

На вершине Green500 располагается суперкомпьютер TSUBAME3.0, принадлежащий Токийскому технологическому институту (Япония). Этот комплекс обладает производительностью около 2 петафлопсов. Энергетическая эффективность при этом составляет 14,11 гигафлопса на ватт. В общем рейтинге Top500 эта система находится на 61 позиции.

С другой стороны, самый мощный в мире суперкомпьютер Sunway TaihuLight — лидер списка Top500 — в рейтинге Green500 располагается на 17 строке. Этот комплекс обладает быстродействием в 93 петафлопса, в то время как энергетическая эффективность равна 6,05 гигафлопса на ватт.

Из других участников рейтинга стоит выделить обновлённую швейцарскую систему Piz Daint. Этот суперкомпьютер с быстродействием 19,59 петафлопса и энергетической эффективностью 10,39 гигафлопса на ватт находится на третьем месте в рейтинге Top500 и на шестой позиции в списке Green500.

Любопытно, что все лидеры «зелёного» рейтинга Green500 оборудованы ускорителями NVIDIA Tesla. При этом в их составе используются процессоры Intel Xeon.

Самый мощный российский суперкомпьютер «Ломоносов-2» с производительностью 2,10 петафлопса обладает энергетической эффективностью 1,95 гигафлопса на ватт. Это 135 строка в списке Green500. В рейтинге Top500 система находится на 59 позиции. 

Постоянный URL: http://servernews.ru/954305
21.06.2017 [10:00], Сергей Карасёв

Опубликована седьмая редакция рейтинга суперкомпьютеров HPCG

Представлена седьмая редакция нового мирового рейтинга HPCG, созданного для более точной оценки реальной производительности самых мощных в мире суперкомпьютеров.

О бенчмарке HPCG мы уже подробно рассказывали. Коротко напомним предысторию его появления. Созданный в 1993 году мировой рейтинг производительности самых мощных суперкомпьютеров Top500 был основан на разработанном в то же время тесте LINPACK (High Performance LINPACK, HPL). Однако в последние годы этот рейтинг и тест HPL стали подвергаться всё большей критике. Эксперты говорят, что тест LINPACK не соответствует профилю реальной загрузки вычислительных систем.

В 2013 году составителями рейтинга Top500 был предложен новый тест для ранжирования суперкомпьютеров — High Performance Conjugate Gradient (HPCG), который, как предполагается, позволяет точнее оценить производительность вычислительных систем на более широком спектре реальных приложений. Первый список HPCG был представлен в июне 2014 года — он содержал 15 позиций. С тех пор рейтинг публикуется дважды в год. Нынешняя редакция включает уже 111 позиций.

Первую строку в списке занимает система K computer — японский суперкомпьютер производства компании Fujitsu, запущенный в 2011 году в Институте физико-химических исследований в городе Кобе. В рейтинге Top500 этот комплекс находится на восьмом месте.

На второй строке списка HPCG располагается китайская система Tianhe-2 (MilkyWay-2) — такой же результат она демонстрирует в рейтинге Top500. «Бронза» по версии HPCG досталась нынешнему лидеру Top500 — суперкомпьютеру Sunway TaihuLight. С полным списком HPCG можно ознакомиться здесь

Постоянный URL: http://servernews.ru/954279
21.06.2017 [09:30], Иван Грудцын

NVIDIA анонсировала PCI-E версию ускорителя Tesla V100

В мае NVIDIA положила начало эры 12-нм графических решений Volta, представив HPC-ускоритель Tesla V100 с интерфейсом NVLink 2.0 (300 Гбайт/с). Новый оптимизированный для NVIDIA техпроцесс TSMC, новые структурные блоки Tensor для матричных вычислений, огромный кристалл с 21 млрд транзисторов — разработчик постарался, чтобы V100 запомнили надолго.

Повод для очередного упоминания об ускорителе Tesla V100 у нас достаточно веский — официальный дебют его версии с интерфейсом подключения PCI Express 3.0 x16. Судя по набору характеристик, новинка немногим уступает основному адаптеру. По сути, кроме использования разъёма PCI-E 3.0 и немного меньшей boost-частоты ядра (около 1370 МГц), других ограничений не предусмотрено, и V100 готов усилить рабочие станции и серверы заказчиков уже в ближайшем будущем.

С положительной стороны PCI-E модификация Tesla V100 отличается от «старшей сестры» меньшим энергопотреблением — 250 Вт против 300 Вт. Это позволяет использовать как жидкостные, так и воздушные системы охлаждения с невысоким уровнем шума. Графическое ядро ускорителя — GV100 — включает в себя 5120 потоковых процессоров и 640 блоков матричных вычислений (Tensor). Микросхемы памяти HBM2 объёмом 16 Гбайт (4 × 4 Гбайт) работают на частоте 900 МГц, пропускная способность подсистемы памяти увеличена на 25 % по сравнению с Tesla P100 (Pascal) — с 720 до 900 Гбайт/с. Производительность Tesla V100 достигает 7 Тфлопс в вычислениях двойной точности, 14 Тфлопс — одинарной и 28 Тфлопс — половинной. Для матричных вычислений цифра ещё выше — 112 Тфлопс.

Тем временем нашему корреспонденту на выставке-конференции ISC 2017 в Германии удалось запечатлеть на фото обновлённый сервер DGX-1 и рабочую станцию DGX Station. Обе системы оборудованы картами V100 и предназначены для ресурсоёмких вычислений, связанных с решением задач в области искусственного интеллекта.

Сервер NVIDIA DGX-1 оснащён восемью ускорителями Tesla V100, двумя 20-ядерными процессорами Intel Xeon E5-2698 v4, 512 Гбайт оперативной памяти, четырьмя 1,92-Тбайт SSD в RAID 0, проводным сетевым интерфейсом 10-Гбит Ethernet (2 порта) и 3,2-кВт блоком питания. Рекомендованная цена системы для рынка США составляет $149 000.

У рабочей станции DGX Station всего вполовину меньше (кроме накопителей — их по-прежнему четыре). Цена, соответственно, не шестизначная, а пятизначная — $69 000. Процессор Xeon E5-2698 v4 и квартет карт Tesla V100 охлаждаются СЖО. Уровень шума на фоне DGX-1 невысок.

Постоянный URL: http://servernews.ru/954273
19.06.2017 [12:20], Сергей Карасёв

Лидерство в новом рейтинге суперкомпьютеров Top500 сохранил китайский комплекс

Сегодня, 19 июня, обнародована 49 редакция рейтинга мощнейших вычислительных систем мира Top500: ознакомиться с обновлённым списком можно на официальном сайте проекта.

Лидирующую позицию продолжает удерживать китайский суперкомпьютер Sunway TaihuLight, насчитывающий 10 649 600 вычислительных ядер. Его быстродействие составляет 93 петафлопса (квадриллиона операций с плавающей запятой в секунду), а пиковая производительность теоретически может достигать 125 петафлопсов.

На второй строке располагается ещё один «китаец» — комплекс Tianhe-2 (MilkyWay-2). Он обладает быстродействием в 33,86 петафлопса, тогда как пиковая производительность достигает 54,9 петафлопса.

На третье место вырвалась швейцарская система Piz Daint. Этот суперкомпьютер подвергся модернизации, в результате которой быстродействие достигло 19,59 петафлопса. Показатель пиковой производительности — 25,33 петафлопса.

Таким образом, в тройке лидеров теперь отсутствуют системы из Соединённых Штатов. Самый мощный американский комплекс Titan отныне довольствуется четвёртой позицией: его быстродействие — 17,59 петафлопса.

Самым быстрым российским суперкомпьютером остаётся «Ломоносов-2», установленный в Московском государственном университете (МГУ). Его производительность достигает 2,10 петафлопса, пиковая производительность — 2,96 петафлопса. Это соответствует 59 позиции в нынешнем рейтинге.

Суммарное быстродействие всех входящих в рейтинг систем теперь составляет 749 петафлопсов — это на треть больше прошлогоднего результата. На системы с чипами  Intel (Xeon и Xeon Phi) приходится 464 суперкомпьютера из 500. Ещё 21 комплекс полагается на процессоры IBM Power, шесть — на чипы AMD Opteron. 

Постоянный URL: http://servernews.ru/954158
07.10.2016 [11:58], Алексей Степин

Adapteva представила 1024-ядерный процессор для рынка специализированных вычислений

Ещё в 2010 году исследователи Intel заявили, что создание 1000-ядерного процессора вскоре сможет стать реальной возможностью. Сегодня, в 2016 году, мы знаем, что их предсказания полностью осуществились: уже выпущен тестовый образец 1000-ядерного чипа KiloCore, а недавно компания Adapteva отрапортовала о выпуске 1024-ядерного процессора под названием Epiphany V. Создатели считают, что их детище способно опередить в ряде задач последние модели серверов и игровых систем, базирующиеся на традиционных технологиях.

Сам процессор Epiphany V, однако, ни в коей мере не предназначен для игр. С его параллелизмом он нацелен на использование в таких областях, как машинное зрение и машинное обучение, а также отлично подходит для использования в системах полностью автоматического вождения. Как сказал Андреас Олофсон (Andreas Olofsson), основатель Adapteva, на базе Epiphany V энтузиаст вполне сможет построить ПК, работающий под управлением Linux, но чип всё-таки предназначается не для этого. Он также отметил, что данный чип обладает лучшими показателями производительности на ватт и квадратный миллиметр, нежели любой современный x86-совместимый процессор. Архитектура Adapteva подразумевает использование когерентности кешей; некий объём разделяемой памяти (64 Мбайт SRAM) доступен всем ядрам.

В основе Epiphany V лежит 64-битная архитектура RISC, производство его уже начато, и массовое тестирование в крупномасштабных системах начнётся в течение ближайших нескольких месяцев. Новый 1024-ядерный процессор выпускается с использованием 16-нм технологических норм FinFET, разработанных и используемых компанией TSMC. Аналогичный техпроцесс применяется в производстве NVIDIA Pascal. Площадь ядра новинки составляет 117 мм2, на этом пространстве размещается 4,56 миллиарда транзисторов. К сожалению, в открытой продаже Epiphany V приобрести будет нельзя, но Apdapteva планирует активно работать с партнёрами в области коммерческого внедрения нового чипа. О внутренней архитектуре Epiphany V пока известно немного, скажем лишь, что он поддерживает такие стандарты программирования, как OpenCL, что должно облегчить его внедрение в коммерческих приложениях.

Постоянный URL: http://servernews.ru/940577
26.06.2016 [18:04], Сергей Юртайкин

ISC 2016: фоторепортаж со стенда Huawei

Компания Huawei воспользовалась конференцией ISC 2016, чтобы продемонстрировать ряд своих IT-продуктов для дата-центров. Среди них — серверы и твердотельные накопители.

Сервер FusionServer X6800 высокой плотности, ориентированный на работу с облачными вычислениями и большими данными, включает широкий спектр узлов с различными спецификациями для гибкой работы сервисных приложений, ресурсов вычисления, хранения и I/O.

Также Huawei привезла во Франкфурт высокопроизводительный накопитель ES3000, оснащённый интерфейсом PCIe 3.0. В зависимости от версии устройство может вмещать до 3,2 Тбайт данных и обладать производительностью считывания данных до 800 тыс. IOPS и пропускной способностью до 3,2 Гбайт/с.

Кроме того, был показан блейд-сервер FusionServer E9000, базирующийcя на процессорах Intel Xeon E5-2600 v4 (их может быть до 64-х). Новинка поддерживает установку до 96 твердотельных накопителей NVMe и сетевую технологию IB EDR 100 Гбит/с.

Наконец, Huawei показала флагманский стоечный сервер нового поколения FusionServer RH8100. Он может включать до 8 процессоров серии Intel Xeon E7-8800, 60 функций RAS, до 12 Тбайт оперативной памяти DDR3 и 16 накопителей PCIe. Продукт подходит для критически важных услуг, извлечения и анализа данных.

 

Постоянный URL: http://servernews.ru/935181
26.06.2016 [16:16], Дмитрий Мякин

ISC 2016: ассортимент серверов HPE Apollo

После разделения корпорации HP на два бизнеса выпуск серверов и суперкомпьютеров сосредоточился в руках Hewlett Packard Enterprise (HPE). Корреспонденты 3DNews посетили экспозицию этой компании на выставке ISC 2016 во Франкфурте, чтобы поближе познакомиться с предлагаемыми ею решениями для рынка высокопроизводительных вычислений (HPC).

Суперкомпьютер HPE Apollo 8000, впервые представленный широкой публике ещё в 2014 году, позиционируется производителем как первая в мире HPC-система с применением исключительно водяной системы охлаждения. Она смонтирована на стойках, каждая из которых вмещает до 144 двухпроцессорных серверов (до 72 двухпроцессорных серверов с ускорителями NVIDIA Tesla либо Intel Xeon Phi), благодаря чему данное HPC-решение обладает высокой масштабируемостью.

GPU-сервер высокой плотности HPE Apollo 6500 высотой 2U построен на базе процессора Intel Xeon E5-2600 v4 и рассчитан на установку в него до восьми графических ускорителей уровня NVIDIA Tesla K80. Его поставки начнутся во второй половине текущего года.

Серверы серии HPE Apollo 2000 относятся к решениям повышенной плотности и могут устанавливаться в стандартное 2U-шасси в количестве до четырёх штук. Модули построены на базе двух процессоров Xeon E5-2600 и способны иметь «на борту» до 512 Гбайт оперативной памяти.

Семейство платформ HPE Apollo 4000 ориентировано, прежде всего, на создание систем хранения и обработки больших массивов данных. На ISC 2016 оно было представлено четырьмя моделями — Apollo 4200, Apollo 4510, Apollo 4520 и Apollo 4530, имеющих одинаковые вычислительные ресурсы, но различающихся масштабами поддерживаемых хранилищ.

Постоянный URL: http://servernews.ru/935175
26.06.2016 [11:12], Дмитрий Мякин

ISC 2016: фоторепортаж со стенда компании SuperMicro

Компания SuperMicro — постоянный участник международной конференции International Supercomputing Conference. В 2016 году она не изменила своей традиции и вновь посетила данное мероприятие, проходившее во Франкфурте. Корреспонденты 3DNews побывали на стенде компании и ознакомились с наиболее интересными новинками.

Четырёхузловой сервер для высокопроизводительных вычислений (high-performance computing, HPC) SuperServer SYS-5028TK-HTR высотой 2U построен на базе процессоров Intel Xeon Phi x200 последнего поколения с архитектурой Knights Landing и поддерживает интерфейс Intel Omni-Path. Каждый из узлов может содержать до 384 Гбайт оперативной памяти DDR4-2400.

SuperMicro SYS-1028GQ-TXRT — сервер форм-фактора 1U, рассчитанный на установку до 4 графических ускорителей, включая решения последнего поколения NVIDIA Tesla P100 на архитектуре Pascal. В системе реализована технология NVLink, благодаря которой скорость обмена данными между GPU и CPU возрастает до 80 Гбайт/с, а также имеется два процессорных слота LGA2011, совместимых с чипами Intel Xeon E5-2600 v3/v4.

SuperMicro SSG-2028R-DN2R40L — система хранения формата 2U может вмещать до 48 2,5” накопителей, то есть вдвое больше, чем обычно содержат решения данного типоразмера, что является следствием применения конструкции Riser Bay. SSG-2028R-DN2R40L поддерживает NVMe SSD и SAS 3.0 HDD, оснащён тремя слотами PCI-E 3.0 и двумя процессорными слотами LGA2011, в которые можно устанавливать CPU Intel Xeon E5-2600 v3/v4.

Сервер SYS-7088B-TR4FT, как и SYS-5028TK-HTR, относится к семейству вычислительных систем SuperServer, но выполнен в корпусе высотой 7U и поддерживает до восьми процессоров Intel Xeon E7-8800 v3/v4 (до 24 ядер в каждом CPU) и до 24 Тбайт ОЗУ ECC DDR4 в 192 слотах.

Постоянный URL: http://servernews.ru/935165
25.06.2016 [12:23], Дмитрий Мякин

ISC 2016: фоторепортаж со стенда ASRock Rack

Экспозицию бренда ASRock Rack на выставке ISC 2016 условно можно разделить на две части: первая — это готовые серверные решения, вторая — материнские платы для них.

Сервер ASRock Rack 2U4N-F/X200 состоит из четырёх узлов, размещаемых в стандартном шасси высотой 2U. Каждый узел содержит по четыре процессора Intel Xeon Phi X200 и оборудован шестью слотами DDR4, двумя PCI-Express 3.0 x8 и таким же количеством портов Ethernet 10 Гбит/с. Утверждается, что производительность каждого модуля в составе 2U4N-F/X200 превышает 3 Тфлопс.

Четыре узла с двумя процессорами Intel Xeon E5 каждый и в общей сложности 24 слота для 2,5” накопителей — таковы характеристики двухюнитовой системы 2U4N-R, которую ранее уже показывали на Computex 2016.

OCP3-6S тоже не новичок на выставочных стендах ASRock Rack — его компания уже демонстрировала на нескольких подобных мероприятиях, и вот теперь он добрался до Франкфурта.

ASRock Rack 3U16N по праву считается обладателем наивысшей вычислительной плотности среди серверных решений компании — в шасси форм-фактора 3U установлены 16 узлов D1541D4Y на базе восьмиядерных процессоров Intel Xeon D. Каждый такой серверный модуль выполнен в виде платы PCI-Express 3.0 x16, на которой, кроме процессора, размещены также два слота SO-DIMM (DDR4), разъемы M.2, U.2 и SATA, порты USB 3.0 и Ethernet 10 Гбит/с.

Материнская плата ASRock Rack C236 WSI4 удостоилась внимания ещё на прошедшем в начале месяца Computex Taipei 2016. Главная её особенность — распаянный на ней процессор Xeon E3 v5 в сочетании с компактным типоразмером mini-ITX самой платы. В отличие от C236 WSI4, плата D1541D4U-2T2O8R поставляется с впаянным на неё чипом Xeon D и выполнена в форм-факторе microATX.

Постоянный URL: http://servernews.ru/935193
Система Orphus