Материалы по тегу: opencl

17.09.2017 [20:00], Иван Грудцын

Сервер NVIDIA DGX-1 возглавил рейтинг производительности Geekbench

Онлайн-база Geekbench Browser время от времени пополняется результатами, в которых фигурируют опытные образцы комплектующих — процессоров, материнских плат, графических адаптеров и т. д. И вот недавно в ней обнаружились записи, в которых фигурировал обновлённый сервер NVIDIA DGX-1 для задач глубинного обучения. Найти результаты системы на базе восьми HPC-ускорителей Tesla V100 было совсем несложно, ведь расположились они на первом и втором местах в табели о рангах Geekbench 4.

В ходе тестирования использовались разные API — OpenCL и CUDA. Прогон бенчмарка Geekbench 4 с проприетарным API NVIDIA оказался значительно более успешным, чем с альтернативным интерфейсом программирования приложений. Разница между результатами составила 54,4 % — 743 537 очков против 481 504. Лучшие результаты на ускорителях Tesla P100 сегодня выглядят совсем уж скромно на фоне успехов представителей семейства NVIDIA Volta. Лучший из них едва превысил отметку в 320 тыс. очков.

Тестирование проводилось в Linux-среде (Ubuntu 16.04.2 LTS), а конфигурация сервера DGX-1, скорее всего, соответствовала базовой. По умолчанию в 3U-корпусе установлены восемь ускорителей Tesla V100 16GB HBM2 в форм-факторе SXM2 (интерфейс NVLink 2.0 с ПСП 300 Гбайт/с), дуэт 20-ядерных процессоров Intel Xeon E5-2698 v4, 512 Гбайт оперативной памяти LRDIMM DDR4-2133, четыре 1,92-Тбайт SSD-накопителя в массиве RAID 0, такое же количество блоков питания номиналом 1600 Вт каждый и множество элементов системы охлаждения.

Сравнение характеристик PCI-E и SXM2-версий Tesla V100

Сравнение характеристик PCI-E и SXM2-версий Tesla V100

Вычислительные возможности сервера NVIDIA DGX-1 образца 2017 года (ранее система базировалась на Tesla P100) наглядно иллюстрирует сравнение его результатов с показателями двух- и четырёхпроцессорных серверов, «заряженных» CPU Intel Xeon Platinum серии 8100. Шестикратное преимущество DGX-1 — веский аргумент в пользу решения NVIDIA. Напомним, что в матричных (Tensor) вычислениях производительность SXM2-версии Tesla V100 составляет 120 Тфлопс, а PCI-E версии — 112 Тфлопс. Последняя используется в рабочих станциях DGX Station «всего лишь» с четырьмя HPC-ускорителями NVIDIA и одним процессором Intel Xeon E5-2698 v4.

Поставки серверов DGX-1 на базе решений NVIDIA Volta начались более полутора месяцев назад. За одну систему заказчикам предлагается заплатить $149 000 — на 20 тыс. долларов больше, чем за аналогичный сервер на ускорителях Tesla P100.

Постоянный URL: http://servernews.ru/958629
07.10.2016 [11:58], Алексей Степин

Adapteva представила 1024-ядерный процессор для рынка специализированных вычислений

Ещё в 2010 году исследователи Intel заявили, что создание 1000-ядерного процессора вскоре сможет стать реальной возможностью. Сегодня, в 2016 году, мы знаем, что их предсказания полностью осуществились: уже выпущен тестовый образец 1000-ядерного чипа KiloCore, а недавно компания Adapteva отрапортовала о выпуске 1024-ядерного процессора под названием Epiphany V. Создатели считают, что их детище способно опередить в ряде задач последние модели серверов и игровых систем, базирующиеся на традиционных технологиях.

Сам процессор Epiphany V, однако, ни в коей мере не предназначен для игр. С его параллелизмом он нацелен на использование в таких областях, как машинное зрение и машинное обучение, а также отлично подходит для использования в системах полностью автоматического вождения. Как сказал Андреас Олофсон (Andreas Olofsson), основатель Adapteva, на базе Epiphany V энтузиаст вполне сможет построить ПК, работающий под управлением Linux, но чип всё-таки предназначается не для этого. Он также отметил, что данный чип обладает лучшими показателями производительности на ватт и квадратный миллиметр, нежели любой современный x86-совместимый процессор. Архитектура Adapteva подразумевает использование когерентности кешей; некий объём разделяемой памяти (64 Мбайт SRAM) доступен всем ядрам.

В основе Epiphany V лежит 64-битная архитектура RISC, производство его уже начато, и массовое тестирование в крупномасштабных системах начнётся в течение ближайших нескольких месяцев. Новый 1024-ядерный процессор выпускается с использованием 16-нм технологических норм FinFET, разработанных и используемых компанией TSMC. Аналогичный техпроцесс применяется в производстве NVIDIA Pascal. Площадь ядра новинки составляет 117 мм2, на этом пространстве размещается 4,56 миллиарда транзисторов. К сожалению, в открытой продаже Epiphany V приобрести будет нельзя, но Apdapteva планирует активно работать с партнёрами в области коммерческого внедрения нового чипа. О внутренней архитектуре Epiphany V пока известно немного, скажем лишь, что он поддерживает такие стандарты программирования, как OpenCL, что должно облегчить его внедрение в коммерческих приложениях.

Постоянный URL: http://servernews.ru/940577
Система Orphus