Материалы по тегу: 16 нм

13.09.2016 [15:03], Иван Грудцын

NVIDIA представила ускорители Tesla P40 и Tesla P4

В ассортименте специализированных ускорителей компании NVIDIA появились модели Tesla P40 и Tesla P4, предназначенные для решения задач из области так называемого глубокого обучения (англ. deep learning). С помощью данных устройств самообучающиеся системы могут не только очень быстро делать логические выводы, но и анализировать десятки потоков видео одновременно. Новые адаптеры пришли на смену ускорителям поколения Maxwell — Tesla M40 и Tesla M4.

Tesla P40 использует полную версию графического процессора GP102, который, в свою очередь, является упрощённым вариантом HPC-чипа GP100. Карта оперирует 3840 потоковыми процессорами Pascal, 240 текстурными блоками (TMU), 96 блоками рендеринга (ROP), 384-разрядной шиной памяти и 24 Гбайт локальной памяти стандарта GDDR5. Применение относительно медленных микросхем буферной RAM, работающих на частоте 1800 (7200) МГц, сочетается у Tesla P40 с невысоким номиналом GPU — от 1303 МГц (базовая частота) до 1531 МГц (boost-режим). Пропускная способность подсистемы памяти равна 346 Гбайт/с.

NVIDIA Tesla P40

Энергопотребление модели P40 при полной загрузке GPU составляет в среднем 250 Вт, как и у NVIDIA TITAN X. Система охлаждения выполнена в виде крупного двухслотового радиатора, который должен продуваться вентиляторами серверных стоек. Габариты Tesla P40 равны 267(Д) × 112(Ш) × ~40(В) мм. В соответствии со спецификацией, ускоритель характеризуется производительностью в 12 TFLOPS при операциях с числами одинарной точности и 47 TOPS при целочисленных (INT8) операциях. Кроме того, поддерживается одновременный анализ 35 потоков видео формата H.264.

Возможности Tesla P4 скромнее ввиду использования ядра Pascal GP104. Чип содержит 2560 потоковых процессоров, 160 текстурных блоков, 64 блока растровых операций, шину памяти разрядностью 256 бит и 8 Гбайт GDDR5. Частота GPU довольно мала как для собрата GeForce GTX 1080 — от 810 до 1063 МГц. Микросхемы RAM работают на номинальных 1500 (6000) МГц, обеспечивая общую пропускную способность в 192 Гбайт/с. В зависимости от задач, Tesla P4 может иметь лимит мощности в 50 или 75 Вт. Дополнительное питание карте не требуется.

NVIDIA Tesla P4

Модель P4 выполнена в виде низкопрофильного адаптера с пассивной СО. Устройство демонстрирует производительность в 5,5 TFLOPS (числа одинарной точности) и 22 TOPS (целые числа). Как и P40, её «младшая сестра» может анализировать 35 видеопотоков в режиме реального времени.

Ускоритель Tesla P40 будет задействоваться в составе серверов от авторизованных партнёров NVIDIA начиная с октября, а Tesla P4 дебютирует в ноябре.

Постоянный URL: http://servernews.ru/939332
25.08.2016 [00:13], Иван Грудцын

Интерфейс NVLink 2.0 соединит GPU Volta и процессоры IBM Power9

В этом году NVIDIA порадовала любителей нерядовых новинок в сегменте дискретной графики картами на 16-нм чипах GP100 и GP102. Различия между старшим GPU для HPC-систем (GP100) и его производным — адаптером для широкого круга задач (GP102) оказались весьма существенными. В частности, проприетарный интерфейс NVLink, отличающий серверный графический процессор от собрата, способен обеспечивать пропускную способность в 40 Гбайт/с на один порт. Для сравнения, аналогичное значение для разъёма PCI Express 3.0 x16 составляет 16 ГТ/с (15,75 Гбайт/с), а для будущего PCI Express 4.0 x16 — 32 ГТ/с (31,5 Гбайт/с). При этом одним соединением NVLink дело не ограничивается. Так, у ускорителя Tesla P100 на чипе Pascal GP100 четыре порта NVLink, и, соответственно, пиковая пропускная способность достигает 160 Гбайт/с (4 × 40 Гбайт/с).

NVLink открывает возможность взаимодействия GPU двух систем

NVLink открывает возможность взаимодействия GPU двух систем

Среди тех, кто по достоинству оценил труд инженеров NVIDIA, оказалась корпорация IBM. Её 22-нм процессоры POWER8 прекрасно «дружат» с NVLink 1.0 и Tesla P100. В частности, был спроектирован 2P-сервер типоразмера 2U на основе процессоров POWER8 (POWER8+) и двух-четырёх адаптеров Tesla P100 с вышеупомянутым интерфейсом. На 2017 год запланировано создание ещё более мощной системы. В её состав войдут два CPU POWER9 и от четырёх до шести ускорителей NVIDIA Volta, содержащих порты NVLink 2.0. Форм-фактор останется прежним — 2U.

NVLink 2.0

По сообщению ресурса Fudzilla, вторая версия NVLink принесёт увеличение пропускной способности интерфейса с 20 до 25 Гбит/с на контакт, с 40 до 50 Гбайт/с на один порт и со 160 до 200 Гбайт/с на один GPU. Преимущество NVLink над PCI Express 4-го поколения будет весьма впечатляющим — 6,35 раза (четыре порта NVLink против 16-скоростного PCI-E 4.0).

NVLink 2.0

Внедрение NVLink 2.0 тесно связано с ожидающимся дебютом графических процессоров Volta в следующем году. Последние, по предварительным данным, будут выпускаться по нынешнему, но при этом «повзрослевшему» 16-нм техпроцессу, а в качестве буферной памяти будут использоваться микросхемы HBM2 (до внедрения HBM3 пока ещё далеко).

HBM2 — это надолго

HBM2 — это надолго

Что касается процессоров IBM POWER9, то они будут выпускаться по 14-нм технологической норме начиная со следующего года. Количество ядер составит 12 или 24. В данных CPU предусмотрены кеш третьего и четвёртого уровней, контроллер памяти DDR4, линии PCI Express 4.0, а также скоростной интерфейс для синхронизации работы двух процессоров на одной плате.

IBM POWER9

IBM POWER9

Постоянный URL: http://servernews.ru/938344
Система Orphus