Материалы по тегу: geekbench

13.11.2019 [10:57], Андрей Созинов

AMD EPYC 7H12 не смог обогнать EPYC 7742 в тестах Geekbench 4

Самый производительный процессор семейства EPYC Rome — AMD EPYC 7H12 — был протестирован в Geekbench 4. Точнее, была протестирована суперкомпьютерная платформа Cray Shasta, включающая в себя пару данных процессоров, и результаты тестирования оказались не самыми впечатляющими.

Для начала напомним, что процессор EPYC 7H12 обладает 64 ядрами Zen 2, которые способны работать на 128 вычислительных потоков. Базовая частота процессора составляет 2,6 ГГц, тогда как максимальная Turbo-частота достигает 3,3 ГГц. Уровень TDP составляет 280 Вт.

То есть, по сравнению идущим в иерархии следом 64-ядерным EPYC 7742, базовая частота здесь выше на 350 МГц, максимальная Turbo-частота ниже на 100 МГц, а уровень TDP выше на 55 Вт.

Как упоминалось выше, система Cray Shasta построена на двух EPYC 7H12, что даёт 128 ядер и 256 потоков. Производительность одного ядра оценена бенчмарком Geekbench 4 в 4512 баллов, тогда как все ядра заслужили оценку в 181 580 баллов. На первый взгляд выглядит весьма впечатляюще.

Однако данные результаты оказались немного ниже результатов тестирования систем с двумя EPYC 7742. Максимально похожие системы той же Cray с парой EPYC 7742 способны обеспечить более 4600 и 182 000 баллов в одно- и многоядерных тестах соответственно. Также в базе Geekbehch 4 можно найти результаты тестов других систем с парой EPYC 7742, которые набирали более 4800 баллов в одноядерном тесте и более 190 000 баллов в многоядерном.

Заметим, что на оценку в Geekbench, равно как и в других бенчмарках, влияет множество факторов помимо «голой» вычислительной мощности, в том числе версия бенчмарка, операционная система, объём и скорость памяти, эффективность системы охлаждения и так далее. Возможно, как раз эффективности системы охлаждения и не хватило паре EPYC 7H12, чтобы стать безоговорочным лидером.

Постоянный URL: http://servernews.ru/997539
01.09.2019 [20:48], Андрей Созинов

Новый день — новый рекорд: 2 × AMD EPYC 7742 лидируют в Geekbench 4

Ресурс ServeTheHome продолжает экспериментировать с парой флагманских 64-ядерных серверных процессоров AMD EPYC 7742.

Вслед за мировым рекордом в бенчмарке Cinebench по многочисленным просьбам STH решили испытать новинки в довольно популярном бенчмарке Geekbench.

Для начала была предпринята попытка установить рекорд с использованием операционной системы Windows Server 2019 и последней версии бенчмарка Geekbench 4.4.2 Pro. Однако результаты оказались совсем не впечатляющие. Связано это с тем, что версия Geekbench для Windows некорректно работает с системами с большим числом ядер.

Поэтому было принято решение перейти на Linux (Ubuntu 19.04), и там подобных трудностей не возникло. Тестирование пары EPYC 7742 проводилось несколько раз, и в большинстве случаев результат находился в пределах от 183 до 188 тыс баллов, а один раз он и вовсе перевалил за 193 000 баллов. И все эти результаты оказались рекордными для Geekbench.

Согласно базе данных Geekbench, предыдущий рекорд в чуть более чем 155 000 баллов, принадлежал системе Dell PowerEdge R840 с четырьмя 28-ядерными процессорами Intel Xeon Platinum 8180M прошлого поколения. Получается, что преимущество системы AMD достигает 20 %. При этом в ней используется лишь два чипа, а не четыре. И ещё интересно, что новинки AMD обходят конкурентов не только по многопоточной производительности, но и немного опережают по производительности одного ядра.

Также специалисты ServeTheHome отмечают, что данный рекорд был поставлен на эталонной системе от AMD и с выходом более продвинутых серверов различных производителей он может быть побит. Скорее всего, паре EPYC 7742 удастся покорить отметку в 200 тыс баллов в Geekbench.

Постоянный URL: http://servernews.ru/993372
17.09.2017 [20:00], Иван Грудцын

Сервер NVIDIA DGX-1 возглавил рейтинг производительности Geekbench

Онлайн-база Geekbench Browser время от времени пополняется результатами, в которых фигурируют опытные образцы комплектующих — процессоров, материнских плат, графических адаптеров и т. д. И вот недавно в ней обнаружились записи, в которых фигурировал обновлённый сервер NVIDIA DGX-1 для задач глубинного обучения. Найти результаты системы на базе восьми HPC-ускорителей Tesla V100 было совсем несложно, ведь расположились они на первом и втором местах в табели о рангах Geekbench 4.

В ходе тестирования использовались разные API — OpenCL и CUDA. Прогон бенчмарка Geekbench 4 с проприетарным API NVIDIA оказался значительно более успешным, чем с альтернативным интерфейсом программирования приложений. Разница между результатами составила 54,4 % — 743 537 очков против 481 504. Лучшие результаты на ускорителях Tesla P100 сегодня выглядят совсем уж скромно на фоне успехов представителей семейства NVIDIA Volta. Лучший из них едва превысил отметку в 320 тыс. очков.

Тестирование проводилось в Linux-среде (Ubuntu 16.04.2 LTS), а конфигурация сервера DGX-1, скорее всего, соответствовала базовой. По умолчанию в 3U-корпусе установлены восемь ускорителей Tesla V100 16GB HBM2 в форм-факторе SXM2 (интерфейс NVLink 2.0 с ПСП 300 Гбайт/с), дуэт 20-ядерных процессоров Intel Xeon E5-2698 v4, 512 Гбайт оперативной памяти LRDIMM DDR4-2133, четыре 1,92-Тбайт SSD-накопителя в массиве RAID 0, такое же количество блоков питания номиналом 1600 Вт каждый и множество элементов системы охлаждения.

Сравнение характеристик PCI-E и SXM2-версий Tesla V100

Сравнение характеристик PCI-E и SXM2-версий Tesla V100

Вычислительные возможности сервера NVIDIA DGX-1 образца 2017 года (ранее система базировалась на Tesla P100) наглядно иллюстрирует сравнение его результатов с показателями двух- и четырёхпроцессорных серверов, «заряженных» CPU Intel Xeon Platinum серии 8100. Шестикратное преимущество DGX-1 — веский аргумент в пользу решения NVIDIA. Напомним, что в матричных (Tensor) вычислениях производительность SXM2-версии Tesla V100 составляет 120 Тфлопс, а PCI-E версии — 112 Тфлопс. Последняя используется в рабочих станциях DGX Station «всего лишь» с четырьмя HPC-ускорителями NVIDIA и одним процессором Intel Xeon E5-2698 v4.

Поставки серверов DGX-1 на базе решений NVIDIA Volta начались более полутора месяцев назад. За одну систему заказчикам предлагается заплатить $149 000 — на 20 тыс. долларов больше, чем за аналогичный сервер на ускорителях Tesla P100.

Постоянный URL: http://servernews.ru/958629
06.09.2016 [15:00], Алексей Степин

Первые результаты тестирования серверной платформы AMD Naples

Как известно, не столь давно компания Advanced Micro Devices демонстрировала не только опытные образцы процессоров для настольных систем под кодовым названием Summit Ridge, в основе которых лежит новая микроархитектура Zen, но и целую двухпроцессорную серверную платформу, где была установлена пара 32-ядерных процессоров Naples с той же архитектурой. На днях в зарубежных источниках появились первые данные о её производительности. Речь идёт о базе данных Geekbench и тестовом наборе четвёртой версии.

Образец системной платы AMD с двумя 32-ядерными чипами Naples

Образец системной платы AMD с двумя 32-ядерными чипами Naples

В ней фигурирует некая система AMD Corporation Diesel 2S1451A4VIHE4_29/14_N, отмеченная также как AMD Eng Sample, когда речь идёт о процессорах. Сомнений нет, это та самая платформа, тем более, что дальше сообщается о наличии двух процессоров с 32 ядрами у каждого. Тактовые частоты, правда, не столь впечатляют, как в первых сообщениях о демонстрации данной платформы: в обычном режиме процессоры работают на частоте всего лишь 1,44 ГГц, и только в турборежиме это значение достигает 2,9 ГГц. По всей видимости, последнее значение актуально не при полной загрузке и не для всех ядер. Оценка одноядерной производительности не слишком высока, но результаты многоядерного теста существенно лучше.

И их не самые впечатляющие результаты

И их не самые впечатляющие результаты

Надо сказать, что в сравнении с другими результатами Geekbench v4 результаты новой платформы AMD не выглядят впечатляющими. Так, система на базе двух далеко не самых новых процессоров Intel Xeon E5-2630 v3 (8 ядер/16 тредов на процессор) и платы ASUS Z10PE-D8WS показала в аналогичном наборе тестов 3178 и 20813 очков соответственно, а ведь частота процессоров тоже была не слишком высокой и составляла всего 2,4 ГГц. А ближе всего к результатам Naples оказалась система на базе процессора Intel Core i5-6600K, работающего на частоте 3,5 ГГц, но в однопоточном тесте она набрала 5505 очков. На этом фоне 1141 очко, продемонстрированное Naples, удивляет — это слишком мало для новой архитектуры даже с учетом частоты 1,4 ГГц.

Эти данные приведены для сравнения

Эти данные приведены для сравнения

Выводы делать, впрочем, рано. Не только частота тестовой платформы AMD была слишком низкой, но и сам набор тестов Geekbench v4 мог не учитывать специфики новой архитектуры Zen. Об этом свидетельствует строка, рапортующая об отсутствии кеша L3, тогда как мы знаем, что в Zen на каждые четыре ядра  приходится 8 Мбайт разделяемого кеша третьего уровня (128 Мбайт на всю платформу с двумя 32-ядерными процессорами). Либо кеш L3 в тестируемых образцах был отключён аппаратно из-за каких-то недоработок, что и могло вызвать падение производительности. На доработку самих процессоров у AMD есть немало времени, ведь подтверждено, что серверные Zen начнут массово поставляться на рынок лишь начиная со второго квартала следующего года и лишь после начала поставок процессоров Summit Ridge для настольных систем. Соответственно, есть время и у разработчиков программного обеспечения; впрочем, мы надеемся, что у последних будет немного работы, ведь архитектура Zen должна демонстрировать свои лучшие качества в среде уже имеющегося парка программного обеспечения, и именно этого добивается AMD.

Постоянный URL: http://servernews.ru/938970
Система Orphus