Материалы по тегу: geekbench

17.09.2017 [20:00], Иван Грудцын

Сервер NVIDIA DGX-1 возглавил рейтинг производительности Geekbench

Онлайн-база Geekbench Browser время от времени пополняется результатами, в которых фигурируют опытные образцы комплектующих — процессоров, материнских плат, графических адаптеров и т. д. И вот недавно в ней обнаружились записи, в которых фигурировал обновлённый сервер NVIDIA DGX-1 для задач глубинного обучения. Найти результаты системы на базе восьми HPC-ускорителей Tesla V100 было совсем несложно, ведь расположились они на первом и втором местах в табели о рангах Geekbench 4.

В ходе тестирования использовались разные API — OpenCL и CUDA. Прогон бенчмарка Geekbench 4 с проприетарным API NVIDIA оказался значительно более успешным, чем с альтернативным интерфейсом программирования приложений. Разница между результатами составила 54,4 % — 743 537 очков против 481 504. Лучшие результаты на ускорителях Tesla P100 сегодня выглядят совсем уж скромно на фоне успехов представителей семейства NVIDIA Volta. Лучший из них едва превысил отметку в 320 тыс. очков.

Тестирование проводилось в Linux-среде (Ubuntu 16.04.2 LTS), а конфигурация сервера DGX-1, скорее всего, соответствовала базовой. По умолчанию в 3U-корпусе установлены восемь ускорителей Tesla V100 16GB HBM2 в форм-факторе SXM2 (интерфейс NVLink 2.0 с ПСП 300 Гбайт/с), дуэт 20-ядерных процессоров Intel Xeon E5-2698 v4, 512 Гбайт оперативной памяти LRDIMM DDR4-2133, четыре 1,92-Тбайт SSD-накопителя в массиве RAID 0, такое же количество блоков питания номиналом 1600 Вт каждый и множество элементов системы охлаждения.

Сравнение характеристик PCI-E и SXM2-версий Tesla V100

Сравнение характеристик PCI-E и SXM2-версий Tesla V100

Вычислительные возможности сервера NVIDIA DGX-1 образца 2017 года (ранее система базировалась на Tesla P100) наглядно иллюстрирует сравнение его результатов с показателями двух- и четырёхпроцессорных серверов, «заряженных» CPU Intel Xeon Platinum серии 8100. Шестикратное преимущество DGX-1 — веский аргумент в пользу решения NVIDIA. Напомним, что в матричных (Tensor) вычислениях производительность SXM2-версии Tesla V100 составляет 120 Тфлопс, а PCI-E версии — 112 Тфлопс. Последняя используется в рабочих станциях DGX Station «всего лишь» с четырьмя HPC-ускорителями NVIDIA и одним процессором Intel Xeon E5-2698 v4.

Поставки серверов DGX-1 на базе решений NVIDIA Volta начались более полутора месяцев назад. За одну систему заказчикам предлагается заплатить $149 000 — на 20 тыс. долларов больше, чем за аналогичный сервер на ускорителях Tesla P100.

Постоянный URL: http://servernews.ru/958629
06.09.2016 [15:00], Алексей Степин

Первые результаты тестирования серверной платформы AMD Naples

Как известно, не столь давно компания Advanced Micro Devices демонстрировала не только опытные образцы процессоров для настольных систем под кодовым названием Summit Ridge, в основе которых лежит новая микроархитектура Zen, но и целую двухпроцессорную серверную платформу, где была установлена пара 32-ядерных процессоров Naples с той же архитектурой. На днях в зарубежных источниках появились первые данные о её производительности. Речь идёт о базе данных Geekbench и тестовом наборе четвёртой версии.

Образец системной платы AMD с двумя 32-ядерными чипами Naples

Образец системной платы AMD с двумя 32-ядерными чипами Naples

В ней фигурирует некая система AMD Corporation Diesel 2S1451A4VIHE4_29/14_N, отмеченная также как AMD Eng Sample, когда речь идёт о процессорах. Сомнений нет, это та самая платформа, тем более, что дальше сообщается о наличии двух процессоров с 32 ядрами у каждого. Тактовые частоты, правда, не столь впечатляют, как в первых сообщениях о демонстрации данной платформы: в обычном режиме процессоры работают на частоте всего лишь 1,44 ГГц, и только в турборежиме это значение достигает 2,9 ГГц. По всей видимости, последнее значение актуально не при полной загрузке и не для всех ядер. Оценка одноядерной производительности не слишком высока, но результаты многоядерного теста существенно лучше.

И их не самые впечатляющие результаты

И их не самые впечатляющие результаты

Надо сказать, что в сравнении с другими результатами Geekbench v4 результаты новой платформы AMD не выглядят впечатляющими. Так, система на базе двух далеко не самых новых процессоров Intel Xeon E5-2630 v3 (8 ядер/16 тредов на процессор) и платы ASUS Z10PE-D8WS показала в аналогичном наборе тестов 3178 и 20813 очков соответственно, а ведь частота процессоров тоже была не слишком высокой и составляла всего 2,4 ГГц. А ближе всего к результатам Naples оказалась система на базе процессора Intel Core i5-6600K, работающего на частоте 3,5 ГГц, но в однопоточном тесте она набрала 5505 очков. На этом фоне 1141 очко, продемонстрированное Naples, удивляет — это слишком мало для новой архитектуры даже с учетом частоты 1,4 ГГц.

Эти данные приведены для сравнения

Эти данные приведены для сравнения

Выводы делать, впрочем, рано. Не только частота тестовой платформы AMD была слишком низкой, но и сам набор тестов Geekbench v4 мог не учитывать специфики новой архитектуры Zen. Об этом свидетельствует строка, рапортующая об отсутствии кеша L3, тогда как мы знаем, что в Zen на каждые четыре ядра  приходится 8 Мбайт разделяемого кеша третьего уровня (128 Мбайт на всю платформу с двумя 32-ядерными процессорами). Либо кеш L3 в тестируемых образцах был отключён аппаратно из-за каких-то недоработок, что и могло вызвать падение производительности. На доработку самих процессоров у AMD есть немало времени, ведь подтверждено, что серверные Zen начнут массово поставляться на рынок лишь начиная со второго квартала следующего года и лишь после начала поставок процессоров Summit Ridge для настольных систем. Соответственно, есть время и у разработчиков программного обеспечения; впрочем, мы надеемся, что у последних будет немного работы, ведь архитектура Zen должна демонстрировать свои лучшие качества в среде уже имеющегося парка программного обеспечения, и именно этого добивается AMD.

Постоянный URL: http://servernews.ru/938970
Система Orphus