Тектонический сдвиг: Intel рассказала о конструкции и особенностях Xeon Granite Rapids

 

На конференции Hot Chips 2023 компания Intel сообщила довольно подробные сведения об архитектуре 144-ядерных Xeon Sierra Forest. Одновременно была опубликована достаточно детальная информация об особенностях чипов Granite Rapids.

Intel уже давно испытывала проблемы с масштабированием процессоров, выполненных по традиционной технологии с монолитным кристаллом. В четвёртом поколении Xeon Scalable (Sapphire Rapids) видны зачатки модульного подхода в XCC-версиях процессоров, использующих «сшивку» четырёх 15-ядерных тайлов (чиплетов) с помощью EMIB. Однако лишь в следующем поколении, к которому относятся и Sierra Forest, и Granite Rapids, модульность будет реализована в полной мере.

Источник изображений здесь и далее: Intel via ServeTheHome

Новый подход Intel во многом напоминает тот, что применяет в своих процессорах AMD, но имеет ряд присущих только ему особенностей. К примеру, Intel решила оставить контроллеры памяти в составе вычислительных чиплетов, поэтому IO-чиплеты работают только с PCI Express и CXL, а также служат местом размещения различных ускорителей, таких, как DSA, IAA, QAT и DLB.

Стоит отметить универсальность портов I/O-тайла. Они могут конфигурироваться как UPI, PCIe или CXL. При этом возможны разные режимы бифуркации, включая смешанную работу PCIe и CXL в пределах одного контроллера. Интерфейс UPI работает на скорости 24 ГТ/с, что в 1,8 раза быстрее, нежели в прошлом поколении, а связь с блоками ускорителей позволяет передавать 64 байта за такт, то есть вдвое быстрее, чем у предыдущих Xeon.

Сшиваются компоненты новых Xeon по-прежнему с помощью EMIB, отвечающей, в том числе, за проброс интерконнекта Intel Modular Mesh Fabric. Каждый чиплет получит свои средства управления электропитанием, но ведущим будет лишь один контроллер, который и будет отвечать за этот процесс. Сама фабрика интерконнекта логически монолитна и обеспечивает в рамках одного процессорного разъёма полноправный и равноценный доступ компонентов друг к другу. Модульность же позволяет варьировать число столбцов и строк меш-сети внутри каждого кристалла.

Напомним, что ядро получит «кусок» кеша LLC (для Granite Rapids — 4 Мбайт), но в составе всего процессора эти блоки образуют единый раздел LLC большого объёма с возможностью разбиения на кластеры для каждого NUMA-узла.

Вычислительные чиплеты Granite Rapids получат только P-ядра Redwood Cove. Производятся они с использованием процесса Intel 3, а значит, «прыжок» через техпроцесс (Sapphire Rapids использует Intel 7) даст ещё больший выигрыш в энергоэффективности. Поскольку речь идёт о Р-ядрах, Granite Rapids будет обладать поддержкой всех современных расширений и форматов вычислений, включая AVX-512 и AMX. Последний сможет работать с форматом FP16.

Некоторые улучшения микроархитектуры найдут своё место в новых ядрах: они получат 64 Кбайт кеша инструкций, более продвинутые механизмы предсказания ветвлений и восстановления конвейера при «промахе», поддержку умножения чисел с плавающей запятой за три такта (ранее требовалось до пяти), а также новые средства работы с памятью (в частности, можно более тонко контролировать, что будет попадать в L2-кеш) и продвинутые средства управления питанием.

К вопросу о памяти: от Sapphire Rapids новые Xeon с P-ядрами будет отличать поддержка стандарта MCR (Multiplexer Combined Ranks) DIMM. Как утверждает не только Intel, но и SK hynix, уже демонстрировавшая соответствующие модули, MCR DIMM станет самой быстрой серверной памятью. Со скоростью 8800 МТ/с на модуль и при 12 каналах Intel заявляет, что производительность подсистемы памяти у Granite Rapids будет выше, нежели у Xeon Max, оснащённых HBM2e, обычные же Sapphire Rapids она превзойдёт в 2,5 раза.

Конечно же, не забыла Intel и о поддержке CXL, благо, концепция «выносной» памяти становится всё более и более популярной. Новые процессоры получат полноценную поддержку устройств памяти CXL Type-3, которой нет у Sapphire Rapids. Будут реализованы средства многоуровневого распределения (tiering), как аппаратные, так и программные, причём аппаратное распределение полностью прозрачно для ПО.

В отличие от Sierra Forest, Granite Rapids станет основой для серверов и систем, ориентированных не только на горизонтальное масштабирование, но и на вертикальное. Поэтому один сервер может объединить до 8 процессорных разъёмов, и такая платформа отлично подойдёт для любых сценариев, где требуется высокая производительность в пересчёте на ядро, включая сценарии ИИ и HPC. А поможет мощным Р-ядрам развитая подсистема памяти с поддержкой MCR DIMM и CXL.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER. | Можете написать лучше? Мы всегда рады новым авторам.

Источник:

Постоянный URL: https://servernews.ru/1092304
Система Orphus