Материалы по тегу: nvidia tesla

26.06.2018 [16:26], Сергей Карасёв

ISC 2018: новая платформа ASRock Rack поддерживает десять ускорителей NVIDIA Tesla V100

Компания ASRock Rack на конференции ISC High Performance 2018 продемонстрировала ряд новейших решений для облачных систем, центров обработки данных и платформ высокопроизводительных вычислений.

В частности, показана серверная платформа 3U10G-F/C621. Эта система, выполненная в форм-факторе 3U, допускает установку десяти ускорителей NVIDIA Tesla V100 с 32 Гбайт памяти.

Платформа наделена 16 слотами для модулей оперативной памяти DDR4, шестью посадочными местами для 2,5-дюймовых SATA-накопителей с возможностью «горячей» замены и двумя сетевыми портами 10G Ethernet.

Кроме того, продемонстрирован сервер 2U4G-EPYCD8, поддерживающий установку одного процессора AMD семейства EPYC 7000. Для модулей оперативной памяти предусмотрены восемь слотов.

Сервер 2U4G-EPYCD8 соответствует формату 2U. Он может быть оснащён четырьмя графическими ускорителями, четырьмя 2,5-дюймовыми SATA-накопителями и двумя твердотельными модулями М.2.

Наконец, представлена серверная платформа 3U8G+/C621, допускающая установку восьми карт NVIDIA Tesla V100. Эта система может быть оборудована 16 модулями оперативной памяти DDR4. 

Постоянный URL: http://servernews.ru/971769
06.12.2017 [23:45], Сергей Юртайкин

IBM представила первый сервер на процессоре POWER9

IBM представила свой первый собственный сервер на процессоре POWER9. Особенность решения под названием IBM Power Systems AC922 заключается в том, что новая аппаратная платформа разработана специально для работы с интенсивными вычислительными нагрузками технологий искусственного интеллекта (ИИ).

CPU IBM POWER9

CPU IBM POWER9

В IBM отмечают, что Power 9 позволяет ускорить тренировки фреймворков глубинного обучения обучения почти в четыре раза, благодаря чему клиенты смогут быстрее создавать более точные ИИ-приложения. Утверждается, что новый сервер разработан для получения значительных улучшений производительности всех популярных фреймворков ИИ, таких как Chainer, TensorFlow и Caffe, а также современных баз данных, использующих ускорители, например, Kinetica.

Сервер IBM Power System AC922

Сервер IBM Power System AC922

Сервер IBM Power Systems AC922 использует шину PCI-Express 4.0 и технологии NVIDIA NVLink 2.0 и CAPI 2.0/OpenCAPI, способные ускорить пропускную способность в 9,5 раза по сравнению с системами x86 на базе PCI-E 3.0. Это, в частности, позволяет задействовать ускорителям (GPU или FPGA) системную ОЗУ без значительных, по сравнению с прошлыми решениями, потерь производительности, что важно для обработки больших массивов данных. Кроме того, новые поколения карт расширения и ускорителей уже поддерживают эту шину.

IBM Power Systems AC922 создан в нескольких конфигурациях, оснащаемых двумя процессорами POWER9. Стандартные версии включают CPU c 16 (2,6 ГГц, турбо 3,09 ГГц) и 20 (2,0/2,87 ГГц) ядрами (4 потока на ядро), а позже появятся версии с 18- и 22 -ядерными процессорами. Всего в сервере есть 16 слотов для модулей ECC DDR4-памяти, что на текущий момент позволяет оснастить его 1 Тбайт RAM. Для хранения данных предусмотрено два слота для 2,5" SSD/HDD (RAID-контроллера нет).

AC922 может иметь на  борту от двух до четырёх ускорителей NVIDIA Tesla V100 форм-фактора SXM2 с памятью 16 Гбайт и шиной NVLink 2.0. В сумме они дают до 500 Тфлопс на расчётах половинной точности. Дополнительные ускорители можно подключить к слотам PCI-E 4.0. 

Сервер рассчитан на установку четырёх дополнительных низкопрофильных карт расширения: два слота PCI-E 4.0 x16, один PCI-E 4.0 x8 и один PCI-E 4.0 x4. Все слоты, кроме последнего, также умеют работать с CAPI. Также есть два порта USB 3.0. Поддерживается ОС Red Hat Enterprise Linux 7.4 for Power LE.

Процессоры IBM Power 9, которые нашли применение в IBM Power Systems AC922, легли в основу суперкомпьютеров Summit и Sierra Министерства энергетики США, а также используются компанией Google. Чипы и использующие их системы стали частью совместной работы участников организации OpenPower Foundation, в которую входят IBM, Google, Mellanox, NVIDIA и др.

Процессор IBM Power 9

Процессор IBM Power 9

«Мы создали уникальную в своём роде систему для работы с технологиями ИИ и когнитивными вычислениями, — говорит старший вице-президент подразделения IBM Cognitive Systems Боб Пиччиано (Bob Picciano). — Серверы на Power 9 являются не только основой самых высокопроизводительных компьютеров, они позволят заказчикам масштабировать невиданные ранее инсайты, что будет способствовать научным прорывам и революционным улучшениям бизнес-показателей».

Сервер имеет стандартное 2U-шасси и оснащается двумя (1+1) блоками питания мощностью 2,2 кВт каждый. Система охлаждения может быть гибридной. Начало продаж  IBM Power Systems AC922 намечено на 22 декабря 2017 года. В 2018 году будут доступны конфигурации с шестью ускорителями Tesla и СЖО.

Постоянный URL: http://servernews.ru/962463
13.09.2016 [15:03], Иван Грудцын

NVIDIA представила ускорители Tesla P40 и Tesla P4

В ассортименте специализированных ускорителей компании NVIDIA появились модели Tesla P40 и Tesla P4, предназначенные для решения задач из области так называемого глубокого обучения (англ. deep learning). С помощью данных устройств самообучающиеся системы могут не только очень быстро делать логические выводы, но и анализировать десятки потоков видео одновременно. Новые адаптеры пришли на смену ускорителям поколения Maxwell — Tesla M40 и Tesla M4.

Tesla P40 использует полную версию графического процессора GP102, который, в свою очередь, является упрощённым вариантом HPC-чипа GP100. Карта оперирует 3840 потоковыми процессорами Pascal, 240 текстурными блоками (TMU), 96 блоками рендеринга (ROP), 384-разрядной шиной памяти и 24 Гбайт локальной памяти стандарта GDDR5. Применение относительно медленных микросхем буферной RAM, работающих на частоте 1800 (7200) МГц, сочетается у Tesla P40 с невысоким номиналом GPU — от 1303 МГц (базовая частота) до 1531 МГц (boost-режим). Пропускная способность подсистемы памяти равна 346 Гбайт/с.

NVIDIA Tesla P40

Энергопотребление модели P40 при полной загрузке GPU составляет в среднем 250 Вт, как и у NVIDIA TITAN X. Система охлаждения выполнена в виде крупного двухслотового радиатора, который должен продуваться вентиляторами серверных стоек. Габариты Tesla P40 равны 267(Д) × 112(Ш) × ~40(В) мм. В соответствии со спецификацией, ускоритель характеризуется производительностью в 12 TFLOPS при операциях с числами одинарной точности и 47 TOPS при целочисленных (INT8) операциях. Кроме того, поддерживается одновременный анализ 35 потоков видео формата H.264.

Возможности Tesla P4 скромнее ввиду использования ядра Pascal GP104. Чип содержит 2560 потоковых процессоров, 160 текстурных блоков, 64 блока растровых операций, шину памяти разрядностью 256 бит и 8 Гбайт GDDR5. Частота GPU довольно мала как для собрата GeForce GTX 1080 — от 810 до 1063 МГц. Микросхемы RAM работают на номинальных 1500 (6000) МГц, обеспечивая общую пропускную способность в 192 Гбайт/с. В зависимости от задач, Tesla P4 может иметь лимит мощности в 50 или 75 Вт. Дополнительное питание карте не требуется.

NVIDIA Tesla P4

Модель P4 выполнена в виде низкопрофильного адаптера с пассивной СО. Устройство демонстрирует производительность в 5,5 TFLOPS (числа одинарной точности) и 22 TOPS (целые числа). Как и P40, её «младшая сестра» может анализировать 35 видеопотоков в режиме реального времени.

Ускоритель Tesla P40 будет задействоваться в составе серверов от авторизованных партнёров NVIDIA начиная с октября, а Tesla P4 дебютирует в ноябре.

Постоянный URL: http://servernews.ru/939332
20.06.2016 [23:59], Сергей Юртайкин

ISC 2016: быстрый ускоритель для дата-центров NVIDIA Tesla P100

Компания NVIDIA анонсировала графический ускоритель Tesla P100, предназначенный для серверов с интерфейсом PCIe. Новинка, как утверждают разработчики, способна ускорять работу высокопроизводительных вычислений (HPC) более чем в 30 раз.

NVIDIA Tesla P100 для PCIe характеризуется производительностью 4,7 Тфлопс для вычислений двойной точности, 9,3 Тфлопс для вычислений одинарной точности и 18,7 Тфлопс для вычислений половинной точности с технологией NVIDIA GPU Boost.

Ускоритель, построенный на новой архитектуре Pascal и предназначенный для масштабируемых дата-центров, объединяет процессор и данные в одном блоке, что обеспечивает высокую эффективность вычислений. Структура памяти CoWoS (чип-на-пластине-на-подложке) с HBM2 с 4096-битной шиной позволила втрое увеличить полосу пропускания памяти по сравнению с архитектурой NVIDIA Maxwell.

Отмечается, что NVIDIA Tesla P100 для PCIe позволяет создавать «суперузлы», пропускная способность которых превышает пропускную способность 32 узлов на базе CPU, и сокращает капитальные и операционные расходы до 70 %. Показатель TDP достигает 250 Вт.

Продажи NVIDIA Tesla P100 для PCIe-систем стартуют в четвёртом квартале 2016 года. Ускоритель также будет поставляться в составе суперкомпьютера NVIDIA DGX-1 (см. фото выше). Стоимость высокопроизводительной карты пока не называется.  

Постоянный URL: http://servernews.ru/934943
17.03.2016 [14:09], Алексей Степин

Новый сервер GIGABYTE вмещает до восьми ускорителей GPGPU

Компания GIGABYTE объявила о доступности нового сервера G25N-G51 в форм-факторе 2U, предназначенного для рынка супервычислений (HPC). Чем же выделяется с виду ничем не примечательная модель в обычном стоечном корпусе? А интересна она специальной конфигурацией модулей расширения PCI Express, позволяющей устанавливать до восьми ускорителей на базе графических процессоров AMD/NVIDIA или плат Intel Xeon Phi. На снимке хорошо видны эти боковые тоннели со сквозной вентиляцией, рассчитанные на то, что у карт, которые туда устанавливаются, собственных вентиляторов не будет.

Установка восьми ускорителей NVIDIA Tesla K80 позволяет нарастить вычислительную мощность до 16 графических процессоров. Если в обычном частотном режиме эти карты обеспечивают производительность 1,87 терафлопса в FP64, то итоговый результат внушает — почти 30 терафлопс чистой вычислительной мощи. Система сертифицирована и для работы с серией AMD FirePro. В случае с восемью FirePro S9170 итоговая мощность может достигать свыше 20 терафлопс при вычислениях двойной точности. Конфигурация с Xeon Phi по цифрам выглядит не столь впечатляюще, но в некоторых случаях она может оказаться предпочительной. По всей видимости, допустима и смешанная конфигурация.

Между прочим, поддержка таких конфигураций означает способность системы справиться почти с 2,5 киловаттами тепла, ведь каждая из карт Tesla K80 имеет теплопакет 300 ватт, да и решения других компаний в этом NVIDIA почти не уступают. Обычных процессорных разъёмов LGA 2011-3 у GIGABYTE G25N-G51 два, заявлена поддержка всего семейства Xeon E5-2600 v3. Система также имеет 24 слота RDIMM/LRDIMM ECC и два интерфейса 10 GbE SFP+, обслуживаемые чипами Intel 82599ES. Дисковая подсистема представлена двумя 2,5″ отсеками для накопителей NVMe и шестью отсеками для традиционных 2,5″ SSD или жёстких дисков. Питается система от дублируемого блока питания мощностью 2 киловатта.

Постоянный URL: http://servernews.ru/930049
20.08.2012 [07:32], Георгий Орлов

Суперкомпьютеры Cray получат графику NVIDIA Tesla

Представители компании Cray сообщили, что в линейке суперкомпьютеров следующего поколения Cascade будут присутствовать версии, включающие графические процессоры (GPU) NVIDIA Tesla, объединенные на базе архитектуры NVIDIA Kepler.

Как подчеркнул Пег Уильямс (Peg Williams), старший вице-президент компании по системам HPC, это еще одно свидетельство приверженности Cray модели "гибких суперкомпьютерных систем" (Adaptive Supercomputing), которая подразумевает интеграцию целого ряда передовых процессорных технологий и технологий ускорения вычислений в рамках единой масштабируемой архитектуры. При этом выбор самого подходящего для конкретных задач варианта остается за клиентом. В июне представители Cray сообщили, что в линейку Cascade войдут и версии с новыми сопроцессорами Intel Xeon Phi.

Широкое появление на рынке систем Cascade ожидается в 2013 году. Новые суперкомпьютеры будут работать под управлением модифицированной ОС Cray Linux Environment (CLE) и поддерживать усовершенствованную среду разработки программного обеспечения для систем HPC. В число аппаратных компонентов систем Cascade войдут коммутационные чипсеты нового поколения Aries и процессоры Intel Xeon.

Ряд суперкомпьютерных центров в США, Австралии, Финляндии, Японии и Германии уже подписали контракты на приобретение суперкомпьютеров Cascade, ориентированных на работу в суперкомпьютерных инфраструктурах систем хранения данных Cray Sonexion следующего поколения.

Материалы по теме:

Источник:

Постоянный URL: http://servernews.ru/596392
09.07.2010 [06:20], Александр Бакаткин

Суперкомпьютеры с графическими процессорами эффективнее обычных

Суперкомпьютеры, архитектура которых предполагает использование графических процессоров наряду с традиционными центральными процессорами, оказываются куда эффективнее вычислительных систем лишь на базе ЦП. В очередном списке энергоэффективных суперкомпьютеров Green500, составляемой той же группой, что и список Top500, первые места занимают именно системы, оснащенные и центральными, и графическими процессорами.

Восемь систем из верхней части списка Green500 занимают компьютеры, оснащенные дополнительными ускорителями для повышения эффективности вычислений. Согласно профессору Политехнического Университета Вирджинии, Ву Фенгу  (Wu Feng), применение графических процессоров в три раза повышает коэффициент полезного действия суперкомпьютеров, по сравнению с традиционными вычислительными системами.

Предыдущее издание списка Green500 включало в себя лишь единственную модель суперкомпьютера, оснащенного графическими процессорами. В качестве дополнительных ускорителей применялись видеочипы компании AMD, работающие совместно с центральными процессорами того же производителя. Сегодня ситуация меняется в другую сторону – в списке Green500 уже восемь «гибридных» систем, причем все новички используют графические процессоры, разработанные компанией NVIDIA, а в качестве ЦП применяются интегральные микросхемы компании Intel. Кстати, система на платформе AMD за это время опустилась на одиннадцатое место в списке Green500.

Список Green500 составлялся по следующему принципу. Измерялась выдаваемая суперкомпьютером производительность, которая затем делилась на потребленную системой мощность. Аппараты, дополнительно оснащенные графическими процессорами, в среднем показывали производительность в 554 МФЛОПС на Ватт потребляемой мощности. В то же время традиционные вычислительные системы смогли показать производительность в районе 181 МФЛОПС на Ватт потребляемой мощности.

Возглавляют список «гибридных» вычислительных систем суперкомпьютеры из Китая – Dawning Nebulae, расположившийся на четвертом месте, и Mole-8.5, занявший высокую восьмую позицию. Обе системы сочетают в себе вычислительную мощность шестиядерных процессоров Intel Xeon X5650 и процессоров NVIDIA Tesla C2050. Показанная производительность систем составляет 492,64 МФЛОПС и 431,88 МФЛОПС на Ватт потребляемой мощности.

Лидерами списка Green500 стали суперкомпьютеры компании IBM. И хотя здесь нет графических процессоров в чистом виде, базируются они на процессорах PowerXCell 8i с программируемым ускорителем, призванным повысить производительность систем в целом ряде приложений. То есть, все равно присутствуют дополнительные вычислительные блоки, более эффективно справляющиеся со специальными задачами, тогда как вычисления общего назначения возложены на центральный процессор.

Постоянный URL: http://servernews.ru/593569
Система Orphus