Материалы по тегу: naples

13.07.2017 [13:20], Илья Гавриченков

AMD EPYC превосходит Xeon-SP в тестах, Intel отвечает грязным маркетингом

Это холодное лето оказалось жаркой порой для рынка серверных решений: на нём впервые за последние несколько лет зарождается реальная конкуренция. Благодаря архитектуре Zen и процессорам EPYC на этот рынок готова вернуться компания AMD. Причём, судя по всему, у компании есть все шансы поколебать гегемонию Intel даже несмотря на то, что микропроцессорный гигант обновил свои серверные платформы и представил новое семейство процессоров Xeon-SP, внедрив в них новую архитектуру Skylake-SP. И это, кажется, действительно заставляет Intel беспокоиться. По крайней мере, на борьбу с EPYC компания решила бросить всю мощь своей маркетинговой машины, которая в качестве первого результата своей работы выдала достаточно спорную презентацию, рассказывающую о преимуществах Xeon-SP над EPYC. В этой презентации процессоры AMD EPYC пренебрежительно описываются как склейка («glued-together») десктопных ядер, в то время как Xeon-SP называются процессорами со специальной серверной архитектурой.

Совершенно очевидно, что такие выпады в адрес AMD могут повлечь за собой ожесточённую перепалку между компаниями, но правда заключается в том, что EPYC действительно собираются из нескольких полупроводниковых кристаллов Zeppelin, однако конечное устройство, в котором используется несколько шин Infinity Fabric, гораздо сложнее и технически совершеннее, нежели простая склейка. Более того, применённый AMD подход неплохо работает и даёт AMD определённые преимущества, в частности, позволяет снизить себестоимость EPYC.

В числе претензий к продукту конкурента маркетинг Intel выдвигает и тезис о том, что для EPYC пока нет должной экосистемы и даже утверждает, что «для новых серверных процессоров AMD потребуется оптимизация программного обеспечения, как и для Ryzen». Однако этот аргумент тоже кажется притянутым за уши: сравнение серверных процессоров с отсылкой к производительности десктопных продуктов в играх может показаться имеющим какой-то смысл разве только для людей, далёких от IT-отрасли.

На самом же деле даже после анонса Xeon-SP процессоры AMD EPYC продолжают казаться вполне конкурентоспособной новинкой. Например, один процессор EPYC может иметь до 32 ядер с поддержкой SMT, в то время как старшие представители в линейке Xeon-SP обладают лишь 28 ядрами с Hyper-Threading. При этом в процессорах Xeon-SP появилась поддержка AVX-512, которой нет в вариантах AMD, к тому же они обладают новой структурой кеш-памяти, предполагающей расширение L2-кеша до 1 Мбайт на ядро. Однако в пользу EPYC говорит цена. Старший 32-ядерный процессор EPYC 7601 стоит $4200, в то время как старший 28-ядерный Xeon Platinum 8180 оценён Intel в $10 тыс.

Первое сравнение EPYC и Xeon-SP в реальных тестах провёл сайт Anadtech. Специалисты сайта сравнили производительность двух систем: двухпроцессорного сервера на базе Epyc 7601 (32 ядра, 2,2-3,2 ГГц, 180 Вт TDP, $4200) и сервера на базе двух процессоров Xeon 8176 (28 ядер, 2,1-3,8 ГГц, 165 Вт TDP, $8719).

В первую очередь системы продемонстрировали совершенно различную работу с кешем и памятью, обусловленную их принципиально различным строением. Каждое ядро Skylake-SP располагает 1 Мбайт L2-кешем с латентностью 13 тактов (в Broadwell-EP кеш второго уровня имел размер 256 Кбайт и латентность 11 тактов). Общий на процессор L3-кеш формируется из расчёта 1,375 Мбайт на ядро, обладает неинклюзивным (виктимным) принципом работы и имеет среднюю латентность 77 тактов (против 44 тактов ранее).

В процессорах EPYC L2-кеш меньше — всего 512 Кбайт на ядро, но зато его латентность — 12 тактов. Что же касается L3-кеша, то он не общий, как у Intel, а рассредоточен по четырёхъядерным комплексам CCX, которых в каждом кристалле Zeppelin размещено по две штуки. Сам кеш тоже имеет эксклюзивный (виктимный) принцип работы, однако его латентность сильно зависит от того, где расположены запрашиваемые данные — в одном CCX с генерирующим запрос ядром, в соседнем на кристалле, или вообще в другом кристалле. В лучшем случае латентность составляет 35 циклов, в худшем — может быть выше на порядок. Иными словами, несмотря на то, что AMD говорит о L3-кеше как о едином массиве ёмкостью 64 Мбайт, правильно говорить, что он в EPYC имеет формулу 8 x 8 Мбайт.

Подобным образом обстоит дело и с памятью: каждый кристалл в EPYC имеет собственный двухканальный контроллер, поэтому скорость работы с памятью может сильно различаться в зависимости от того, где в системе находятся данные. Это накладывает результаты на результаты теста Stream, в котором измеряется пропускная способность памяти.

Пропускная способность по данным Stream

Пропускная способность по данным Stream

В зависимости от того, какие процессорные ядра выполняют этот тест, пропускная способность Epyc 7601 может быть более чем в два раза лучше, чем у Xeon-SP, но может быть и вдвое хуже. При этом любопытно, что Skylake-SP стал с точки зрения пропускной способности памяти хуже Broadwell-EP. Негативный вклад вносит новая ячеистая структура соединения ядер, пришедшая на смену кольцевым шинам.

Зато Xeon-SP почти всегда выигрывает у EPYC с точки зрения латентности.

Сравнительные тесты производительности в исследовании Anandtech были проведены в SPEC2006 в однопоточном и многопоточном режиме, при работе с базами данных и обслуживании транзакций, в Java, в расчётах Big Data, и при работе с вещественными числами.

SPECInt 2006

SPECInt 2006 в многопоточном режиме

ыыы

Java

MySQL Percona Server 5.7.0

MySQL Percona Server 5.7.0

Big Data

Big Data

Производительность FPU

Производительность FPU

Проиводительность FPU

Проиводительность FPU

Неожиданно производительность FPU у процессора AMD оказалась значительно лучше, чем у Xeon-SP. Тому может быть несколько причин, но скорее всего определяющее влияние оказывает то, как турбо-режим работает при исполнении AVX-инструкций. В частности, процессоры Intel используют заметно более низкие частоты при работе с AVX-командами. Например, Xeon 8176 при нагрузке на все 28 ядер способен работать на частоте 2,8 ГГц, однако при активации AVX 2.0 его максимальная частота в тех же условиях ограничивается величиной 2,4 ГГц. Если же говорить об исполнении AVX-512, то в этом случае предельная частота составит лишь 1,9 ГГц при нагрузке на все ядра.

Intel указывает, что её процессоры используют 256-битные и 512-битные исполнительные устройства, в то время как у AMD обработка AVX-инструкций происходит на 128-битных устройствах. Но вполне возможно, что в конечном итоге реализация AMD оптимальнее, поскольку частотам EPYC работа с векторными инструкциями не наносит никакого урона. Да, при этом у EPYC нет поддержки AVX-512, но и приложений, опирающихся на такие инструкции, пока тоже практически нет.

В конечном итоге система на AMD EPYC проигрывает системе на Xeon-SP при работе с базами данных, но превосходит её в тестах Java и является чрезвычайно конкурентоспособной в тестах Big Data, особенно если принять во внимание ситуацию с ценами.

Что касается энергопотребления, то оно сильно зависит от нагрузки. Xeon Platinum 8176 очень прожорлив в режиме холостого хода, но зато демонстрирует неплохую эффективность при работе с MySQL. Зато при рендеринге в POV-RAY система на EPYC оказывается не только значительно экономичнее, но и к тому же заметно быстрее, чем сервер с процессорами Xeon-SP.

Таким образом, реальность такова, что AMD EPYC нельзя назвать ни худшим, ни лучшим выбором для любого сервера. Однако если учитывать его конкурентную среднюю производительность, низкие цены, а также подавляющее превосходство в отдельных сферах, серверный процессор AMD вне всяких сомнений сможет стать причиной головной боли для Intel. И в первую очередь EPYC привлечёт внимание тех предприятий, которые захотят оптимизировать цену своих дата-центров. Но в то же время Intel всё ещё может предложить более высокую абсолютную производительность благодаря тому, что у компании есть масштабируемая платформа, поддерживающая многопроцессорные конфигурации.

И да, для того, чтобы донести преимущество своих значительно более дорогостоящих серверных решений до конечных пользователей, Intel действительно придётся задействовать маркетинговый отдел. Но тот топорный маркетинг, к которому компания прибегла сейчас, вызывает серьёзные вопросы.

Постоянный URL: http://servernews.ru/955417
17.05.2017 [15:13], Иван Грудцын

AMD анонсировала серверные процессоры EPYC

Вчерашняя серия презентаций AMD 2017 Financial Analyst Day надолго запомнится тем, кто ждал анонсов 16- и 32-ядерных процессоров Advanced Micro Devices с архитектурой Zen. О планах чипмейкера по выпуску HEDT CPU Threadripper мы писали в одном из недавних материалов, поэтому сосредоточимся на EPYC — серверных процессорах, ранее известных как Naples и содержащих до 32 вычислительных (x86-64) ядер Zen в одном кристалле.

Процессор EPYC в руке главы AMD Лизы Су (Lisa Su)

Процессор EPYC в руке главы AMD Лизы Су (Lisa Su)

Имя EPYC сменило, по крайней мере на время, более привычное Opteron. Претенциозное название, являющееся ничем иным, как стилизованным словом epic («эпичный», «эпический») из английского языка, производителями серверных CPU используется не впервые. В 90-х годах прошлого века похожим образом — EPIC — назывался совместный проект компаний HP и Intel, вылившийся в итоге в выпуск нескольких поколений процессоров Itanium.

Как подчёркивает AMD, EPYC — лишь первый этап внедрения решений Zen на серверный рынок. Позже компания выпустит процессоры Rome («Рим») на базе 7-нм микроархитектуры Zen 2 и модели Milan («Милан»), которые будут использовать обновлённую 7-нм технологическую норму и ядра Zen 3.

EPYC — это надолго

Zen на серверном рынке — это надолго

Всё то, что мы ранее озвучивали относительно чипов Naples, актуально и для EPYC. Главный технический директор AMD Марк Пейпермастер (Mark Papermaster) отметил, что EPYC будут доступны для заказа в виде 16- и 32-ядерных процессоров для 1P-платформ, а также 24- и 32-ядерных CPU для 2P-платформ. Максимальный объём кеш-памяти третьего уровня в 64 Мбайт, восьмиканальный контроллер оперативной памяти DDR4-2400 с поддержкой до 4 Тбайт RAM и 128 линий PCI Express 3.0 — весьма внушительный арсенал, который, надеемся, способен обострить конкуренцию на рынке x86-64 серверов.

AMD EPYC
AMD EPYC
AMD EPYC
AMD EPYC

AMD не только поработала над интеграцией в состав EPYC большого количества вычислительных ядер, но и над тем, чтобы разместить процессоры на референсных платах минимального размера. Ниже изображена компактная (330 × 305 мм) матплата с одним гнездом для CPU, 16 слотами для оперативной памяти и семью разъёмами PCI Express 3.0 x8/x16.

Модельный ряд процессоров AMD EPYC и серверы на их основе будут представлены в течение июня. Поставок, стало быть, стоит ожидать уже во втором квартале.

Постоянный URL: http://servernews.ru/952343
12.05.2017 [12:30], Иван Грудцын

Планы AMD по выпуску серверных и встраиваемых процессоров Zen

Прежде мы неоднократно писали о намерении AMD вывести на рынок процессоры с микроархитектурой Zen и кодовыми именами птиц для корпоративного сегмента рынка. Эти планы остаются в силе, более того, ресурсу VideoCardz удалось раздобыть расширенную информацию о готовящихся серверных и встраиваемых CPU и APU компании из Саннивейла.

Среди «пернатых» присутствует чип, обозначенный как Naples («Неаполь»). Он возглавит семейство первых 14-нм серверных процессоров AMD до конца второго квартала. Младшим по отношению к нему будет CPU Snowy Owl («Белая сова»). Далее, через год, ожидается переход на 7-нм норму. Его ознаменует собой релиз 48-ядерного/96-поточного процессора Starship.

Все временные промежутки на роадмапах в данном материале относятся к опытным образцам (ES)

Все временные промежутки на роадмапах в данном материале относятся к опытным образцам (ES)

Подробностей о 32-ядерном CPU Opteron с кодовым именем Naples в последние месяцы хватало, но на этот раз сведения получены из официального источника и подкреплены структурной схемой кристалла. Naples состоит из четырёх 8-ядерных модулей Zeppelin, имеет 64 Мбайт разделяемого кеша третьего уровня, встроенный 8-канальный контроллер памяти DDR4-2667 ECC (до 2 Тбайт RAM на процессор), 128 линий PCI Express 3.0 и блок системной логики, включающий интерфейсы 10-Гбит Ethernet и AMD Secure Processor для ускорения аппаратного шифрования. Тепловой пакет CPU составляет от 120 до 180 Вт.

Урезанные версии Naples ограничатся 16 ядрами

Урезанные версии Naples ограничатся 16 ядрами

16-ядерный Opteron Snowy Owl в конструктиве SP4 (BGA) фактически является «половиной» Naples. Не уменьшены только максимальный объём оперативной памяти на один CPU (2 Тбайт), количество слотов DIMM на канал (2 шт.) и максимальное количество поддерживаемых SATA- и NVMe-накопителей (32 шт.). Уровень TDP лежит в диапазоне 35–100 Вт.

Структурная схема «половины» и «четверти» Naples

Структурная схема «половины» и «четверти» Naples

Семейство 14-нм APU AMD для встраиваемых систем возглавят чипы R-Series Great Horned Owl («Виргинский филин»). Младшими по отношению к ним являются APU G-Series Banded Kestrel («Мадагаскарская полосатая пустельга»). Обе серии процессоров выполнены в формате SoC и имеют небольшое тепловыделение.

Модели Great Horned Owl содержат в себе четыре вычислительных (x86-64) ядра Zen, 8 Мбайт разделяемого кеша третьего уровня, двухканальный контроллер памяти DDR4-3200 ECC, графическое ядро Radeon «GFX9» с 704 шейдерными блоками GCN, а также AMD Secure Processor и «южный мост». Последний, среди прочего, позволяет реализовать на материнской плате четыре разъёма USB 3.1 (10 Гбит/с). Новое поколение APU R-Series появится в конструктивном исполнении AM4 (PGA, 45–65 Вт) и FP5 (BGA, 12–45 Вт). Поставки начнутся в четвёртом квартале текущего года.

Процессоры G-Series Banded Kestrel имеют только два ядра Zen, 4 Мбайт кеш-памяти третьего уровня, один канал DDR4-3200 ECC, интегрированный GPU в составе 192 шейдеров GCN, блок аппаратного шифрования и набор системной логики. APU Zen начального уровня выполнены в конструктиве FP5 (BGA) и характеризуются тепловыделением 4–15 Вт.

Постоянный URL: http://servernews.ru/952082
08.03.2017 [16:00], Алексей Степин

AMD официально анонсировала планы относительно серверных чипов Naples

Положение Advanced Micro Devices на серверном рынке и рынке суперкомпьютеров не всегда было таким скромным, как сейчас: в своё время удачная архитектура процессоров Opteron, упрощающая построение многопроцессорных систем, позволила компании откусить заметный кусок этого очень вкусного во всех отношениях пирога. К сожалению, со временем компания начала терять позиции, что, впрочем, происходило и в секторе потребительских решений; процессы шли почти одновременно. Да, в 2012 году в арсенале AMD уже появились 16-ядерные Opteron 6300, и, хотя они базировались на не самой эффективной архитектуре Piledriver и использовали 32-нм техпроцесс, это было больше, чем могла дать Intel в сегменте четырёхпроцессорных решений. Но «золотой век» AMD в серверном сегменте был позади: архитектура FX не могла состязаться на равных с новейшими архитектурами Intel и при этом не отличалась скромностью в энергопотреблении и тепловыделении.

Системная плата с двумя 32-ядерными Naples

Системная плата с двумя 32-ядерными Naples

Ничего удивительного, что, работая над новой микроархитектурой, которую мы все сейчас знаем под именем Zen, AMD не могла не мечтать о возвращении в сектор серверов и суперкомпьютеров. Именно поэтому Zen изначально создавалась модульной и легко масштабируемой архитектурой. Ещё задолго до анонса процессоров Ryzen компания смогла продемонстрировать рабочий образец чипа Naples (кодовое имя новых серверных процессоров AMD) в составе двухпроцессорной системы с 64 ядрами, способной исполнять 128 потоков. Тесты оказались откровенно разочаровывающими, но речь шла о раннем прототипе, производительность и потенциал которого компания могла скрыть вполне намеренно — разработчики процессоров поступают так довольно часто. Но технически платформа Naples показала себя отлично: в отличие от Ryzen, каждый процессор Naples может предоставить в распоряжение системы до 64 линий PCI Express 3.0 и до четырёх интерфейсов NVMe (16 линий PCIe суммарно). Нет проблем и с сетевой частью: Naples поддерживает InfiniBand EDR (25 Гбит/с на линк, 290 Гбит/с максимально), что позволяет без труда строить системы с большим количеством вычислительных узлов.

Варианты конфигурации рендер-серверов на базе Naples

Варианты конфигурации рендер-серверов на базе Naples

7 марта AMD сделала первый официальный шаг к возвращению на серверный рынок, опубликовав анонс процессоров Naples. Да, как и в случае с Ryzen, это бумажный анонс; к сожалению, ждать придётся дольше, нежели пришлось энтузиастам AMD — первые поставки чипов Naples на рынок ожидаются лишь во втором квартале текущего 2017 года. Массовая доступность ожидается во втором полугодии, причём, объёмы поставок Naples будут постоянно наращиваться через ОЕМ-каналы и партнёров AMD. Как считает компания-разработчик, Naples имеет ряд преимуществ перед Xeon, опережая аналогичные по классу решения конкурента на 45 % по количеству процессорных ядер, на 60 % по мощностям ввода-вывода (I/O, видимо, имеется в виду количество линий PCIe), а также на 122 % по пропускной способности подсистемы памяти (у Naples восьмиканальный контроллер памяти). Базовый дизайн новой платформы уже готов, мы демонстрировали его читателям на ранних фото. Он предполагает установку двух 32-ядерных процессоров, до 32 модулей DDR4 DIMM в 16 каналах общим объёмом 4 Тбайт. Надобность в специализированном чипсете отсутствует, поскольку степень интеграции Naples очень высока, и общее количество линий PCI Express 3.0 достигает 128 даже в скромном двухпроцессорном варианте. Между собой чипы общаются посредством высокоскоростной шины AMD Infinity Fabric.

Экосистема Naples будет полагаться на разъём SP3 типа LGA — в отличие от Ryzen, в серверном сегменте AMD от системы LGA решила не отказываться. В целом, шаг со стороны AMD вполне логичный и ожидаемый, поскольку специализированные процессоры, такие, как SPARC, занимают узкую нишу, а положение монополиста позволяет Intel играть ценами на серверные Xeon так, как компания того пожелает. Стоимость некоторых экземпляров вплотную приближается к $9000 (Xeon E7-8894 v4, 24С/48T, 2,4 ГГц, 60 Мбайт L3), и речь только о процессоре, а у AMD вскоре появится массовый чип с большим количеством ядер и исполняемых тредов. Логично, что реакция на анонс AMD со стороны производителей серверов и разработчиков систем класса HPC оказалась сугубо положительной. Но есть проблемы и у Naples, по крайней мере, в первой инкарнации: во-первых, мы всё ещё не знаем уровня производительности и частотного потенциала новой платформы AMD, а во-вторых, Naples будет уступать решениям Intel там, где требуются активные вычисления, использующие AVX. Серверные процессоры Intel Xeon с архитектурой Skylake получат полную поддержку AVX-512, а первому поколению Naples придётся объединять 128-битные блоки AVX для исполнения инструкций AVX-256, что получается у архитектуры Zen не слишком быстро. Но, во-первых, на серверном рынке наконец-то появится выбор более чем из одного варианта, а во-вторых, AMD планирует развивать и совершенствовать архитектуру Zen в течение ближайших нескольких лет. Нет никаких сомнений в том, что разработчики знают о слабостях новой процессорной микроархитектуры и в будущих итерациях постараются от них избавиться.

Постоянный URL: http://servernews.ru/948765
13.01.2017 [11:14], Алексей Степин

AMD Naples в деталях: 32 ядра, 64 потока и 128 линий PCI Express

Среди решений на базе новой архитектуры AMD Zen чипы для настольных систем Ryzen представляют наибольший интерес для рядового энтузиаста, но есть в них одна разочаровывающая тех, кто рассчитывал на появление достойного конкурента платформе Intel HEDT, черта: наличие всего 16 «родных» линий PCI Express. Остаётся возлагать надежды на производителей системных плат; возможно, ASUS в рамках серии WS выпустит плату на базе X370 с коммутатором PCI Express и дополнительными слотами PCIe 3.0 x8/x16. А вот серверная версия Zen под кодовым названием Naples, которая должна появиться на рынке уже в первом полугодии, подобного недостатка лишена и отлично подходит для применения в окружении, требующем подключения значительного количества плат расширения.

Naples изнутри: процессорные разъёмы LGA, системная логика заботливо прикрыта кожухом

Naples изнутри: процессорные разъёмы LGA, системная логика заботливо прикрыта кожухом

Последние слайды AMD выставляют Naples в качестве решения, особенно хорошо подходящего для использования в рендер-серверах и узлах суперкомпьютеров, строящихся на базе современных графических процессоров. Платформа в максимальной конфигурации сможет предложить до 128 «родных» линий PCI Express 3.0. На приведённых примерах для компактных серверов в корпусах формата 1U и 2U указана поддержка от четырёх до шести графических плат или же плат ускорителей, благо отличаются они только отсутствием разъёмов для подключения мониторов. Нет проблем и с подсистемой накопителей, а также сетевой подсистемой: предусматривается прямое подключение 3‒4 накопителей с поддержкой NVMe и одного-двух адаптеров InfiniBand EDR (25 Гбит/с на линк, 290 Гбит/с максимально).

Основные варианты новых вычислительных платформ, предлагаемых AMD

Основные варианты новых вычислительных платформ, предлагаемых AMD

Версия 1U названа оптимизированной с учётом максимальной вычислительной производительности, а вариант 2U явно предназначен для суперкомпьютерных систем, поскольку описывается в рамках «максимальной производительности на узел». Будут ли сами процессоры иметь разные конфигурации, неизвестно, очевидно лишь, что версия 2U в теории предусматривает установку до 8 ускорителей, но вероятнее всего, это следствие более крупных габаритов самого форм-фактора. Скорее всего, в качестве ускорителей предлагается использовать профессиональные версии на базе чипов с архитектурой Vega. Никаких коммутаторов PCI Express не требуется, возможности Naples уже включают в себя поддержку «прямого общения» графических или вычислительных ускорителей между собой. Помимо прочего, это означает минимальную латентность. Такой подход всё же обладает меньшей производительностью в сравнении с использованием специальных высокоскоростных шин вроде NVLink, но он существенно проще и дешевле в реализации.

Naples во всём серверном великолепии. Увидим ли мы эти процессоры в рабочих станциях?

Naples во всём серверном великолепии. Увидим ли мы эти процессоры в рабочих станциях?

Подсистема памяти у Naples весьма развитая, ведь нужно прокормить процессоры с 32 ядрами, способные исполнять 64 потока. Стандартные дизайны платформ, предлагаемые AMD, описывают восьмиканальный доступ к памяти DDR4, нехватки пропускной способности быть не должно; даже у конкурента решения класса Xeon E7 используют лишь шестиканальный доступ. Также интересно, что сами процессоры, в отличие от их младших настольных собратьев, выполнены в корпусах типа LGA и используют разъём AMD SP3. Поскольку по имеющимся данным TDP Naples может варьироваться в пределах от 35 до 180 ватт, то мы вполне можем увидеть и версии процессоров с меньшим количеством ядер, предназначенные для рабочих станций. В настоящее время об этом ничего неизвестно, но сертификационное тестирование AMD уже прошёл ряд серверных платформ на базе Naples, как в форм-факторах 1U/2U, так и в виде «серверов-лезвий» (blade). OEM-версии будут включать в себя и поддержку модулей MCM и MXM, что позволит упаковать ещё больше вычислительной мощности в меньший объём.

Постоянный URL: http://servernews.ru/945825
11.12.2016 [21:00], Иван Грудцын

Фото процессора AMD Naples (Zen) в составе 2P-сервера

На днях компания AMD раскроет новые подробности о моделях процессоров Zen (14 нм). Презентация под названием «Новые горизонты» состоится в ночь с 13 на 14 декабря, её начало назначено на 0:00 по московскому времени. Отрадно, что ещё до этого события у нас есть повод упомянуть о самых мощных CPU с архитектурой Zen — серверных моделях Naples. Веб-ресурс WCCFtech поделился с общественностью подборкой фотографий сервера с двумя процессорами Naples/Zen на борту.

Система собрана в корпусе форм-фактора 2U и основана на двух ключевых компонентах — тандеме 16-ядерных процессоров AMD Naples и видеокарте (либо видеокартах) Radeon Pro небольших габаритов. Пара CPU охлаждается с помощью низкопрофильных радиаторов, за интенсивный продув которых отвечают четыре «реактивных» вентилятора. Часть элементов материнской платы, то ли для соблюдения партнёрского NDA (соглашения о неразглашении), то ли ради сохранения инкогнито удачливого «папарацци», накрыты чем-то наподобие коробок.

AMD Naples - Socket SP3

На фото Naples — довольно крупный процессор в конструктиве LGA (Land Grid Array), заметно отличающийся по размерам от настольных PGA-чипов Summit Ridge (14 нм) и APU Bristol Ridge (28 нм) для платформы AMD AM4. Количество контактов в процессорном разъёме пока не известно. Он носит название SP3 и изготовлен компанией-подрядчиком Lotes.

AMD Naples - Socket SP3
AMD Naples - Socket SP3

Два 16-ядерных CPU Naples могут обрабатывать данные в 64 потока и содержат как минимум 32 Мбайт разделяемой кеш-памяти третьего уровня (каждый). Объём кеша на процессорный модуль (CPU Complex) у AMD Naples, вполне возможно, будет больше, чем у Summit Ridge (16 Мбайт при двух модулях/восьми ядрах), но при этом стоит учесть, что предположение WCCFtech о сотнях мегабайт на один кристалл далеко от истины.

Старшие процессоры Naples будут 32-ядерными и, по логике вещей, так же будут совместимы с платами Socket SP3, как и 16-ядерные чипы. Они станут альтернативой серверным моделям 14-нм CPU Intel семейств Broadwell и Skylake с количеством ядер от 20 и выше. Ранее мы предполагали наличие у топовых процессоров Naples 4- или 8-канального контроллера оперативной памяти. Частота 32-ядерного гиганта наверняка будет небольшой — 2 ГГц (без учёта boost-режиме) или меньше.

AMD Naples - Socket SP3

Официальные продажи настольных и серверных процессоров поколения Zen с количеством ядер от 4-х до 32-х начнутся в первые месяцы следующего года.

Постоянный URL: http://servernews.ru/944207
16.11.2016 [13:05], Алексей Степин

Ещё раз о производительности платформы AMD Naples

Результаты предварительного тестирования двухпроцессорной серверной платформы AMD Naples, оснащённой двумя 32-ядерными чипами с поддержкой SMT и способной, следовательно, выполнять до 128 потоков кода одновременно, не вызвали оптимизма — по всей видимости, из-за плохой оптимизации тестового ПО или неполной готовности новых процессоров; в частности, массивный кеш третьего уровня или не был задействован, или использовался некорректно. Впрочем, результаты в Geekbench всегда вызывают много вопросов. Недавно появились новые данные, на этот раз — из базы SiSoftware Sandra. В настоящее время результаты из базы данных SiSoft уже удалены, но мы, разумеется, сохранили их в виде скриншотов.

AMD Diesel с двумя 32-ядерными процессорами Naples

AMD Diesel с двумя 32-ядерными процессорами Naples

Они выглядят заметно интереснее и дают больше информации, нежели опубликованные ранее результаты Geekbench. Во-первых, Sandra корректно указывает частоты платформы: 1,44 ГГц в качестве базового значения и 2,9 ГГц в качестве значения в турборежиме, что совсем неплохо для сложнейшего 32-ядерного процессора с огромным количеством транзисторов и чудовищным объёмом кеша третьего уровня, составляющим 64 Мбайт на процессор и 128 Мбайт на всю систему.

Также стало известно, что 32-ядерные Naples используют идеологию MCM (Multi-Chip Module) и под крышкой теплораспределителя скрывается два 16-ядерных кристалла. Sandra распознаёт такую компоновку, как четырёхпроцессорную с 16 ядрами на процессор. Тесты из раздела «шифрование и безопасность» явно работают некорректно, но разделы «мультимедиа» и «процессорные тесты» показывают вполне благоприятную картину. Следует помнить, что тесты, судя по всему, проводятся не самой AMD, а её партнёрами, имеющими доступ к новому аппаратному обеспечению.

Наконец, раздел «финансовые тесты» демонстрирует отличные результаты: здесь новая платформа AMD в режиме двойной точности показывает 667500 операций в секунду, а это, если верить базе данных SiSoft, быстрее 93 % систем, представленных в этой базе. Конечно, 111-ый результат — явно не первый, но стоит помнить, что на этом поле платформе Naples приходится состязаться и с такими монстрами, как восьмипроцессорная платформа на базе 12-ядерных Intel Xeon E7.

Это играет на руку AMD, которая собирается вернуть утраченные позиции на серверном рынке в том числе и в секторе финансовых вычислений. Судя по данным Zauba, системная плата под кодовым названием Diesel готова довольно давно — первые упоминания о ней встречаются уже 12 августа. Похоже, AMD наводит последние штрихи на практически готовую к выпуску платформу — и платформа эта не разочарует не только поклонников бренда, но и профессионалов. Мы надеемся, что столь же хорошо покажут себя и процессоры для энтузиастов под кодовым именем Summit Ridge.

Постоянный URL: http://servernews.ru/942788
24.10.2016 [14:00], Антон Тестов

AMD: платформа Zen набирает популярность среди производителей серверов и операторов ЦОД

Корпорация Advanced Micro Devices контролировала около трети рынка микропроцессоров для серверов десятилетие назад, но к сегодняшнему дню её доля не дотягивает и до одного процента. В компании надеются вернуться на рынок серверов и возлагают большие надежды на платформу следующего поколения на базе процессоров Naples и микроархитектуры Zen. Судя по всему, не напрасно. По словам главы AMD, в третьем квартале ряд производителей серверов и операторов центров обработки данных (ЦОД) заинтересовался новыми CPU.

AMD Opteron

AMD Opteron

Корпорация AMD начала разработку серверной платформы на базе микроархитектуры Zen лишь после консультаций с потенциальными клиентами и пониманию их заинтересованности в машинах на базе микросхем Advanced Micro Devices. Компания никогда не раскрывала имён ключевых партнёров на рынке серверов, но логично предполагать, что речь идёт о крупнейших поставщиках подобных систем. Как уже сообщалось, во втором квартале этого года AMD начала поставки опытных образцов процессоров приоритетным разработчикам серверов (включая OEM- и ODM-производителей), что дало возможность заручиться их поддержкой. В третьем квартале процессоры и платформа Naples прошли ряд важных этапов разработки, кроме того, AMD расширила круг получателей образцов соответствующих изделий. Судя по всему, Naples и Zen показали высокий уровень производительности, и неназванные компании начали разработку машин на их базе.

«Мы успешно прошли ряд технологических этапов разработки процессоров и платформы в третьем квартале, а партнёры среди OEM, поставщиков серверов и операторов облачных центров обработки данных, приняли решение по использованию процессоров Zen в своих разработках», — сказала Лиза Су (Lisa Su), исполнительный директор AMD, в ходе телеконференции с инвесторами и финансовыми аналитиками. «Мы по-прежнему планируем представить наши высокопроизводительные процессоры Zen для серверов в первой половине следующего года».

Прототип материнской платы на базе процессоров AMD Naples. Фото AnandTech.

Прототип материнской платы на базе процессоров AMD Naples. Фото AnandTech.

Несмотря на то, что оптимистичные высказывания касательно заинтересованности в собственной продукции присуще разработчикам, комментарии госпожи Су являются важными свидетельствами того, что поддержка Zen среди производителей и операторов серверов растёт. В частности, глава AMD упомянула о том, что по крайне мере один владелец облачных ЦОД принял решение использовать процессоры Zen для своих машин. Ранее компания говорила о заинтересованности в данных CPU среди OEM- и ODM-производителей, а также поставщиков серверного оборудования. Таким образом, AMD подтвердила, что Naples стали доступны для операторов ЦОД и впечатлили по крайней мере одного из них. Принимая во внимание тот факт, что крупнейшие владельцы центров обработки данных (Amazon, Google, Facebook и другие) собирают серверы сами, значение интереса подобных компаний к Naples трудно переоценить.

«У нас есть множество клиентов как на стороне ПК, так и на стороне серверов, у которых уже есть работающие образцы процессоров семейства Zen в их лабораториях», — сказала глава AMD. «Они дорабатывают свои платформы и программное обеспечение, и мы рады тому, как плавно всё идёт».

AMD Zen: Ключевые улучшения

AMD Zen: ключевые улучшения

Хотя AMD всё еще предстоит раскрыть данные о производительности серверных процессоров Naples в реальных приложениях, а также их подробные технические характеристики, уже опубликованные спецификации выглядят многообещающе. Так, Naples будет иметь до 32 вычислительных ядер с технологией многопоточности и восьмиканальный контроллер памяти, а значит, каждый такой процессор будет способен обрабатывать до 64 потоков одновременно и иметь пиковую пропускную способность памяти около 136,5 Гбайт/с (при использовании DDR4-2133). При условии, что подобный процессор будет работать на относительно высокой тактовой частоте, его производительность обещает быть крайне высокой, принимая во внимание микроархитектурные улучшения Zen. Иными словами, новые серверные CPU AMD будут куда более конкурентоспособные, чем сегодняшние. Другой вопрос, насколько быстро AMD сможет восстановить былые позиции на серверном рынке и сможет ли вообще? Это покажет только время.

Постоянный URL: http://servernews.ru/941414
06.09.2016 [15:00], Алексей Степин

Первые результаты тестирования серверной платформы AMD Naples

Как известно, не столь давно компания Advanced Micro Devices демонстрировала не только опытные образцы процессоров для настольных систем под кодовым названием Summit Ridge, в основе которых лежит новая микроархитектура Zen, но и целую двухпроцессорную серверную платформу, где была установлена пара 32-ядерных процессоров Naples с той же архитектурой. На днях в зарубежных источниках появились первые данные о её производительности. Речь идёт о базе данных Geekbench и тестовом наборе четвёртой версии.

Образец системной платы AMD с двумя 32-ядерными чипами Naples

Образец системной платы AMD с двумя 32-ядерными чипами Naples

В ней фигурирует некая система AMD Corporation Diesel 2S1451A4VIHE4_29/14_N, отмеченная также как AMD Eng Sample, когда речь идёт о процессорах. Сомнений нет, это та самая платформа, тем более, что дальше сообщается о наличии двух процессоров с 32 ядрами у каждого. Тактовые частоты, правда, не столь впечатляют, как в первых сообщениях о демонстрации данной платформы: в обычном режиме процессоры работают на частоте всего лишь 1,44 ГГц, и только в турборежиме это значение достигает 2,9 ГГц. По всей видимости, последнее значение актуально не при полной загрузке и не для всех ядер. Оценка одноядерной производительности не слишком высока, но результаты многоядерного теста существенно лучше.

И их не самые впечатляющие результаты

И их не самые впечатляющие результаты

Надо сказать, что в сравнении с другими результатами Geekbench v4 результаты новой платформы AMD не выглядят впечатляющими. Так, система на базе двух далеко не самых новых процессоров Intel Xeon E5-2630 v3 (8 ядер/16 тредов на процессор) и платы ASUS Z10PE-D8WS показала в аналогичном наборе тестов 3178 и 20813 очков соответственно, а ведь частота процессоров тоже была не слишком высокой и составляла всего 2,4 ГГц. А ближе всего к результатам Naples оказалась система на базе процессора Intel Core i5-6600K, работающего на частоте 3,5 ГГц, но в однопоточном тесте она набрала 5505 очков. На этом фоне 1141 очко, продемонстрированное Naples, удивляет — это слишком мало для новой архитектуры даже с учетом частоты 1,4 ГГц.

Эти данные приведены для сравнения

Эти данные приведены для сравнения

Выводы делать, впрочем, рано. Не только частота тестовой платформы AMD была слишком низкой, но и сам набор тестов Geekbench v4 мог не учитывать специфики новой архитектуры Zen. Об этом свидетельствует строка, рапортующая об отсутствии кеша L3, тогда как мы знаем, что в Zen на каждые четыре ядра  приходится 8 Мбайт разделяемого кеша третьего уровня (128 Мбайт на всю платформу с двумя 32-ядерными процессорами). Либо кеш L3 в тестируемых образцах был отключён аппаратно из-за каких-то недоработок, что и могло вызвать падение производительности. На доработку самих процессоров у AMD есть немало времени, ведь подтверждено, что серверные Zen начнут массово поставляться на рынок лишь начиная со второго квартала следующего года и лишь после начала поставок процессоров Summit Ridge для настольных систем. Соответственно, есть время и у разработчиков программного обеспечения; впрочем, мы надеемся, что у последних будет немного работы, ведь архитектура Zen должна демонстрировать свои лучшие качества в среде уже имеющегося парка программного обеспечения, и именно этого добивается AMD.

Постоянный URL: http://servernews.ru/938970
19.08.2016 [13:20], Константин Ходаковский

Ранние сведения о серверном CPU и материнской плате Zen

Благодаря очередному анонсу микроархитектуры Zen на прошедшем мероприятии AMD стали известны некоторые подробности о серверной платформе нового поколения. 32-ядерный процессор с кодовым именем Naples получит многопоточный режим, благодаря чему сможет обрабатывать одновременно 64 потока. Таким образом, система c двумя контактными площадками будет способна обрабатывать 128 потоков одновременно. Такие платы уже есть на руках ряда партнёров AMD.

Компания дала понять, что публика услышит в ближайшие месяцы новые подробности о её серверных решениях (на SuperComputing 2016 в ноябре и на International SuperComputing в июне 2017 года). Коммерческие поставки AMD планирует начать во втором квартале 2017 года. Но некоторое представление можно составить уже сейчас, проанализировав фотографии материнской платы AMD на два процессора.

Компания показала плату с двумя громадными контактными площадками, 8-фазовым дизайном для каждого сокета и восемью слотами DDR4 на каждый CPU. Не ясно, оснащаются ли CPU 4-канальным контроллером памяти по два модуля DIMM на канал, или речь идёт о 8-канальной конфигурации. Обычно дублирующиеся слоты выполняются другим цветом, так что в данном случае можно предположить наличие 8-канального контроллера. Подсистема питания также косвенно указывает на это.

Кстати, среди других особенностей материнской платы можно отметить отсутствие на фотографиях чипсета или южного моста. Там, где обычно располагается системная логика, имеется чип Xilinx Spartan FPGA без радиатора, хотя сомнительно, что он заменяет южный мост — рядом расположена кнопка FPGA Button, так что чип вероятнее всего используется для отладки системы.

Слева на фото расположены восемь портов SATA, все синего цвета, что обычно говорит о принадлежности их к одному контроллеру. Это подтверждается надписью рядом «ALL SATA CONNS CONNECTED TO P1», то есть первый процессор напрямую управляет всеми этими портами. Среди других обычных средств ввода-вывода можно отметить сетевой порт 10/100 (для администрирования) и порты USB 3.0.

Отсутствие на фото чипсета и расположение портов SATA может указывать на то, что южный мост интегрирован в Naples, то есть речь идёт об однокристальной системе, нежели о чистом CPU. Перенос функций южного моста на 14-нм FinFET техпроцесс позволит дополнительно экономить энергию (чипсеты обычно выпускаются с соблюдением более старых литографических норм).

Стоит отдельно остановиться на слотах PCIe. Плата включает четыре слота, причём при ближайшем рассмотрении видно, что речь определённо идёт о 16 полноценных линиях на каждый слот. Есть небольшая надпись, проливающая дополнительный свет на распределение линий PCIe: «Слот 3 имеет X15 линий PCIe, если MGMT PCIe подключён и X16 PCIe линий, если MGMT PCIe отключён».

Постоянный URL: http://servernews.ru/938049
Система Orphus