Serve The Home: Intel-бенчмарки Xeon Platinum 9282 vs. EPYC 7742 в GROMACS некорректны [Обновлено]

 

Каждый производитель аппаратного обеспечения, будь то графические ускорители или процессоры, стремится представить свои решения в наиболее выгодном свете. Но иногда применяемые для этого методы трудно назвать корректными.

Издание Serve The Home (STH) считает, что опубликованные вчера результаты сравнительного тестирования процессоров Intel Xeon Platinum 9282 и AMD EPYC 7742 в реальных задачах не являются в полной мере объективными. И это мнение имеет под собой достаточно веские основания.

Intel утверждает, что система с двумя Xeon Platinum 9282 быстрее аналогичной платформы на базе AMD EPYC 7742 более чем на 30%. Однако, по мнению STH, результаты, показанные в одном из тестов, а конкретно в пакете GROMACS, нельзя назвать полностью корректными.

Во-первых, в тестировании был использован GROMACS версии 2019.3, который корректно работает со вторым поколением Xeon Scalable, но не умеет определять архитектуру AMD Rome (Zen 2) и правильно пользоваться её возможностями. Такая поддержка появилась только в GROMACS 2019.4, который вышел в начале октября. 

Во-вторых, значимые отличия были обнаружены в конфигурации тестовых систем. На обоих платформы был включен SMT, но для AMD суммарное количество потоков GROMACS составило 128, по количеству процессорных ядер, а вот в системе с Xeon  их было уже 224. Впрочем, по словам STH, у GROMACS действительно есть проблемы при работе на системах со слишком большим числом потоков, и даже с двумя 7742 это может быть непросто. 

В-третьих, разными были настройки суб-кластеризации NUMA и турбо-частот. Последние были включены для EPYC и отключены у Xeon, хотят тут оценить реальную степень влияния на результат трудно. Переключение с/на AVX-512 в ходе работы может влиять на турбо-частоты и общую производительность. Что касатеся NUMA, то, по данным STH, для EPYC суммарно получилось 8 доменов, а для Xeon — 4. Разбивка на домены обычно позволяет ускорить общение памяти с ядрами, так что выбор такого разделения неоднозначен. 

В итоге Intel удалось добиться победы, но превосходство составило всего 20%. STH приводит и другие различия в условиях тестирования, но, кажется, ключевым было именно использование не самой актуальной версии ПО. Как обычно, от программной оптимизации и тонкой настройки платформ производительность зависит куда сильнее, нежели от простого количества ядер. Не исключено, что сами тесты были сделаны давным-давно, но сумели погрязнуть в бесконечных корпоративных согласованиях.

Справедливости ради отметим, что и AMD не брезгует подобной тактикой выставления своих продуктов в выгодном свете. На Computex 2019 она показала сравнение будущих чипов Rome с актуальными Xeon в бенчмарке NAMD, не предоставив полного описания условий тестирования. Тут же выяснилось, что компания использовала для CPU Intel неоптимизированную версию ПО. 

UPD 07.11: Intel оперативно отреагировала и опубликовала обновлённые результаты и дала комментарии. Выяснилось, что, во-первых, в исходных тестах GROMACS 2019.3 вручную был собран с поддержкой AVX2 для EPYC. Тем не менее, Intel провела повторный тест с версией 2019.4, в которой эти инструкции задействуются автоматически. Во-вторых, в описании исходного теста закралась опечатка: EPYC использовали два потока бенчмарка на ядро. Правда, всё это существенных изменений в результатах не дало — разница между 2019.3 и 2019.4 составила 1,08%.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

Источник:

Постоянный URL: https://servernews.ru/997093
Поделиться:  

Комментарии

Система Orphus