AMD EPYC превосходит Xeon-SP в тестах, Intel отвечает грязным маркетингом

 

Это холодное лето оказалось жаркой порой для рынка серверных решений: на нём впервые за последние несколько лет зарождается реальная конкуренция. Благодаря архитектуре Zen и процессорам EPYC на этот рынок готова вернуться компания AMD. Причём, судя по всему, у компании есть все шансы поколебать гегемонию Intel даже несмотря на то, что микропроцессорный гигант обновил свои серверные платформы и представил новое семейство процессоров Xeon-SP, внедрив в них новую архитектуру Skylake-SP. И это, кажется, действительно заставляет Intel беспокоиться. По крайней мере, на борьбу с EPYC компания решила бросить всю мощь своей маркетинговой машины, которая в качестве первого результата своей работы выдала достаточно спорную презентацию, рассказывающую о преимуществах Xeon-SP над EPYC. В этой презентации процессоры AMD EPYC пренебрежительно описываются как склейка («glued-together») десктопных ядер, в то время как Xeon-SP называются процессорами со специальной серверной архитектурой.

Совершенно очевидно, что такие выпады в адрес AMD могут повлечь за собой ожесточённую перепалку между компаниями, но правда заключается в том, что EPYC действительно собираются из нескольких полупроводниковых кристаллов Zeppelin, однако конечное устройство, в котором используется несколько шин Infinity Fabric, гораздо сложнее и технически совершеннее, нежели простая склейка. Более того, применённый AMD подход неплохо работает и даёт AMD определённые преимущества, в частности, позволяет снизить себестоимость EPYC.

В числе претензий к продукту конкурента маркетинг Intel выдвигает и тезис о том, что для EPYC пока нет должной экосистемы и даже утверждает, что «для новых серверных процессоров AMD потребуется оптимизация программного обеспечения, как и для Ryzen». Однако этот аргумент тоже кажется притянутым за уши: сравнение серверных процессоров с отсылкой к производительности десктопных продуктов в играх может показаться имеющим какой-то смысл разве только для людей, далёких от IT-отрасли.

На самом же деле даже после анонса Xeon-SP процессоры AMD EPYC продолжают казаться вполне конкурентоспособной новинкой. Например, один процессор EPYC может иметь до 32 ядер с поддержкой SMT, в то время как старшие представители в линейке Xeon-SP обладают лишь 28 ядрами с Hyper-Threading. При этом в процессорах Xeon-SP появилась поддержка AVX-512, которой нет в вариантах AMD, к тому же они обладают новой структурой кеш-памяти, предполагающей расширение L2-кеша до 1 Мбайт на ядро. Однако в пользу EPYC говорит цена. Старший 32-ядерный процессор EPYC 7601 стоит $4200, в то время как старший 28-ядерный Xeon Platinum 8180 оценён Intel в $10 тыс.

Первое сравнение EPYC и Xeon-SP в реальных тестах провёл сайт Anadtech. Специалисты сайта сравнили производительность двух систем: двухпроцессорного сервера на базе Epyc 7601 (32 ядра, 2,2-3,2 ГГц, 180 Вт TDP, $4200) и сервера на базе двух процессоров Xeon 8176 (28 ядер, 2,1-3,8 ГГц, 165 Вт TDP, $8719).

В первую очередь системы продемонстрировали совершенно различную работу с кешем и памятью, обусловленную их принципиально различным строением. Каждое ядро Skylake-SP располагает 1 Мбайт L2-кешем с латентностью 13 тактов (в Broadwell-EP кеш второго уровня имел размер 256 Кбайт и латентность 11 тактов). Общий на процессор L3-кеш формируется из расчёта 1,375 Мбайт на ядро, обладает неинклюзивным (виктимным) принципом работы и имеет среднюю латентность 77 тактов (против 44 тактов ранее).

В процессорах EPYC L2-кеш меньше — всего 512 Кбайт на ядро, но зато его латентность — 12 тактов. Что же касается L3-кеша, то он не общий, как у Intel, а рассредоточен по четырёхъядерным комплексам CCX, которых в каждом кристалле Zeppelin размещено по две штуки. Сам кеш тоже имеет эксклюзивный (виктимный) принцип работы, однако его латентность сильно зависит от того, где расположены запрашиваемые данные — в одном CCX с генерирующим запрос ядром, в соседнем на кристалле, или вообще в другом кристалле. В лучшем случае латентность составляет 35 циклов, в худшем — может быть выше на порядок. Иными словами, несмотря на то, что AMD говорит о L3-кеше как о едином массиве ёмкостью 64 Мбайт, правильно говорить, что он в EPYC имеет формулу 8 x 8 Мбайт.

Подобным образом обстоит дело и с памятью: каждый кристалл в EPYC имеет собственный двухканальный контроллер, поэтому скорость работы с памятью может сильно различаться в зависимости от того, где в системе находятся данные. Это накладывает результаты на результаты теста Stream, в котором измеряется пропускная способность памяти.

Пропускная способность по данным Stream

Пропускная способность по данным Stream

В зависимости от того, какие процессорные ядра выполняют этот тест, пропускная способность Epyc 7601 может быть более чем в два раза лучше, чем у Xeon-SP, но может быть и вдвое хуже. При этом любопытно, что Skylake-SP стал с точки зрения пропускной способности памяти хуже Broadwell-EP. Негативный вклад вносит новая ячеистая структура соединения ядер, пришедшая на смену кольцевым шинам.

Зато Xeon-SP почти всегда выигрывает у EPYC с точки зрения латентности.

Сравнительные тесты производительности в исследовании Anandtech были проведены в SPEC2006 в однопоточном и многопоточном режиме, при работе с базами данных и обслуживании транзакций, в Java, в расчётах Big Data, и при работе с вещественными числами.

SPECInt 2006

SPECInt 2006 в многопоточном режиме

ыыы

Java

MySQL Percona Server 5.7.0

MySQL Percona Server 5.7.0

Big Data

Big Data

Производительность FPU

Производительность FPU

Проиводительность FPU

Проиводительность FPU

Неожиданно производительность FPU у процессора AMD оказалась значительно лучше, чем у Xeon-SP. Тому может быть несколько причин, но скорее всего определяющее влияние оказывает то, как турбо-режим работает при исполнении AVX-инструкций. В частности, процессоры Intel используют заметно более низкие частоты при работе с AVX-командами. Например, Xeon 8176 при нагрузке на все 28 ядер способен работать на частоте 2,8 ГГц, однако при активации AVX 2.0 его максимальная частота в тех же условиях ограничивается величиной 2,4 ГГц. Если же говорить об исполнении AVX-512, то в этом случае предельная частота составит лишь 1,9 ГГц при нагрузке на все ядра.

Intel указывает, что её процессоры используют 256-битные и 512-битные исполнительные устройства, в то время как у AMD обработка AVX-инструкций происходит на 128-битных устройствах. Но вполне возможно, что в конечном итоге реализация AMD оптимальнее, поскольку частотам EPYC работа с векторными инструкциями не наносит никакого урона. Да, при этом у EPYC нет поддержки AVX-512, но и приложений, опирающихся на такие инструкции, пока тоже практически нет.

В конечном итоге система на AMD EPYC проигрывает системе на Xeon-SP при работе с базами данных, но превосходит её в тестах Java и является чрезвычайно конкурентоспособной в тестах Big Data, особенно если принять во внимание ситуацию с ценами.

Что касается энергопотребления, то оно сильно зависит от нагрузки. Xeon Platinum 8176 очень прожорлив в режиме холостого хода, но зато демонстрирует неплохую эффективность при работе с MySQL. Зато при рендеринге в POV-RAY система на EPYC оказывается не только значительно экономичнее, но и к тому же заметно быстрее, чем сервер с процессорами Xeon-SP.

Таким образом, реальность такова, что AMD EPYC нельзя назвать ни худшим, ни лучшим выбором для любого сервера. Однако если учитывать его конкурентную среднюю производительность, низкие цены, а также подавляющее превосходство в отдельных сферах, серверный процессор AMD вне всяких сомнений сможет стать причиной головной боли для Intel. И в первую очередь EPYC привлечёт внимание тех предприятий, которые захотят оптимизировать цену своих дата-центров. Но в то же время Intel всё ещё может предложить более высокую абсолютную производительность благодаря тому, что у компании есть масштабируемая платформа, поддерживающая многопроцессорные конфигурации.

И да, для того, чтобы донести преимущество своих значительно более дорогостоящих серверных решений до конечных пользователей, Intel действительно придётся задействовать маркетинговый отдел. Но тот топорный маркетинг, к которому компания прибегла сейчас, вызывает серьёзные вопросы.

Источники:

Постоянный URL: http://servernews.ru/955417
Поделиться:  

Комментарии