Материалы по тегу: skylake-x

16.06.2017 [15:00], Алексей Степин

В новых процессорах Intel используется mesh-схема соединений

Один из ведущих разработчиков Intel, Ахилеш Кумар (Akhilesh Kumar), ответственный за разработку серверных процессоров Skylake-SP, опубликовал в блоге пост, посвящённый анонсу новой архитектуры внутрипроцессорных соединений, которая придёт на смену предыдущей, реализованной в чипах Core i7 класса HEDT, а также в процессорах Xeon v3 и v4 (Haswell/Broadwell-EP). Новая технология носит название Intel Scalable Processor Platform и главной её целью является конкуренция с технологией AMD Infinity Fabric. Последняя, как известно, служит для связи между модулями в процессорах Ryzen, Threadripper и EPYC. Чтобы понять, почему Intel решила сменить структуру внутрипроцессорных соединений, надо понять, в чём заключается узкое место предыдущей структуры. Здесь надо отметить, что Intel всегда использовала монолитные кристаллы даже в многоядерных процессорах, тогда как AMD в Threadripper и EPYC решила прибегнуть к компоновке типа MCM (Multi-Chip Module) с несколькими кристаллами в едином корпусе. Каждый подход имеет свои достоинства и недостатки, о чём ниже.

 Схема внутрипроцессорных соединений в Broadwell-EP. Серым цветом выделены межкольцевые коммутаторы

Схема внутрипроцессорных соединений в Broadwell-EP. Серым цветом выделены межкольцевые коммутаторы

Если в обычных потребительских процессорах проблема пропускной способности внутренних шин стоит не так остро, то в многоядерных решениях она начинает играть существенную роль, ведь для эффективной многопоточной обработки данных все ядра должны быть вовремя «накормлены», иначе они просто будут простаивать впустую в ожидании поступления новой порции данных. До появления Scalable Processor Platform компания Intel использовала три разновидности кристаллов: LCC (Low Core Count, до 10 ядер), MCC (Medium Core Count, до 14 ядер) и HCC (High Core Count, от 16 ядер); это справедливо для Broadwell-EP, в случае с Haswell-EP числа несколько иные, но это не столь важно. На приведённой выше диаграмме хорошо видно, что для соединения отдельных кластеров ядер используются двунаправленные кольцевые шины. В случае с LCC такая шина всего одна, в MCC вторая шина не образует полное кольцо, и, наконец, в HCC работают два полноценных двунаправленных кольца. Друг с другом кольца соединяются посредством буферизированных коммутаторов (серые прямоугольники), что порождает дополнительную задержку в 5 тактов при необходимости передать данные из одного кольца в другое.

 В новых решениях Intel используется одноранговая сеть

В новых решениях Intel используется одноранговая сеть...

По мере наращивания количества ядер задержки растут, шины и коммутаторы должны работать на более высокой частоте, чтобы это компенсировать, а это, в свою очередь, приводит к повышению потребляемой процессором мощности и росту уровня тепловыделения. Именно с этой проблемой столкнулась бывшая ATI Technologies в процессе увеличения количества потоковых процессоров в графических чипах Radeon, и именно поэтому в новой архитектуре Skylake (как HEDT, так и Xeon v5) Intel отказалась от кольцевой топологии, перейдя к сетевой (mesh). Впервые сетевая топология внутренних соединений была использована в чипах Knights Landing, и это неудивительно с учётом огромного количества ядер у этих процессоров.

 Схема сети для процессоров Knights Landing

Схема сети для процессоров Knights Landing

Новая схема выглядит как двунаправленная решётка, а контроллеры памяти переехали к краям кристалла. Исчезли коммутаторы и сопутствующие им схемы буферизации. Небольшие кольца, впрочем, сохранились — теперь они находятся в пересечениях горизонтальных и вертикальных шин и обеспечивают оптимальное распределение потоков данных. Если верить Intel, то возросла и пропускная способность новых шин. Кроме того, для систем с процессорами Purley будет применён новый внешний интерфейс UPI вместо привычного QPI. В целом, новый дизайн кристалла, разработанный Intel, не просто эффективнее старого, но и позволяет наращивать количество процессорных ядер сравнительно малой кровью.

 Но с её топологией в реальном кристалле Skylake-X всё не так просто, как на схеме

...но с её топологией в реальном кристалле Skylake-X всё не так просто, как на схеме

На диаграмме соединения сосредоточены в правой части каждого ядра или функционального блока, однако снимок ядра XCC (eXtreme Core Count) демонстрирует несколько иную топологию: ядра ориентированы зеркально по отношению друг к другу. Это может внести дополнительные задержки при перемещении данных по горизонтали, поскольку расстояние между узлами сети в этом случае неодинаково, но это в любом случае эффективнее старой схемы с двумя кольцами и буферизированными коммутаторами.

 Межкристалльные шины AMD Infinity Fabric в процессоре EPYC

Межкристалльные шины AMD Infinity Fabric в процессоре EPYC

Схема, реализованная AMD, выглядит совершенно иначе: каждые два четырёхъядерных блока CCX (CPU Complex) образуют восьмиядерный кристалл, в котором они общаются между собой с помощью 256-битной двунаправленной шины Infinity Fabric. В 32-ядерном процессоре EPYC таких кристаллов четыре, соединяются они аналогичным образом, но шины пролегают в корпусе чипа. Это ведёт к задержкам при обращении одного процессорного кристалла к данным, находящимся в кеше другого кристалла, особенно, расположенного диагонально — данным приходится преодолевать и промежуточный кристалл, поскольку шин всего четыре и Х-образное соединение в решении AMD не используется.

 Сборка из двух AMD CCX делит общий контроллер памяти

Сборка из двух AMD CCX делит общий контроллер памяти

Впрочем, этот эффект может компенсировать грамотная программная оптимизация, а что касается наращивания количества ядер, тут AMD в выигрыше: отказ от монолитного многоядерного кристалла позволяет в случае нужды установить в корпусе вместо четырёх восьмиядерных сборок шесть или даже восемь, расплатившись, разумеется, соответствующим ростом латентности и уровня тепловыделения. Intel наверняка использует этот факт в рекламе своей новой технологии, но какой подход покажет себя более жизнеспособным, покажет время.

Постоянный URL: http://servernews.ru/954055
27.04.2017 [12:24], Иван Грудцын

Раскрыты названия и частоты 34 моделей CPU Xeon Gold и Platinum

В последнем документе Product Change Notification (PCN) компания Intel рассекретила названия более чем трёх десятков процессоров Xeon Gold и Xeon Platinum. Их объединяет конструктивное исполнение LGA3647 и принадлежность к семейству CPU Skylake-SP для платформы Purley. Как утверждает немецкий ресурс ComputerBase, суффикс «SP» заменит многие другие — E, EN, EP и EX. При этом модели Intel Skylake-SP будут встречаться как в качестве компонентов платформы Purley/LGA3647, так и Basin Falls/LGA2066.

 Серверный узел LGA3647, фото eTeknix.com

Серверный узел LGA3647, фото eTeknix.com

В последнем Intel PCN перечислены 14 процессоров Xeon Platinum. Они предназначены для систем с максимально возможной производительностью в рамках платформы Purley. Количество физических ядер для каждого CPU не указано. По данным источника, их минимальное количество — 22 шт., максимальное — 28 шт. Частоты варьируются от 2,0 до 3,6 ГГц.

Процессор Частота Степпинг Код sSpec
Intel Xeon Platinum 8153 2,0 ГГц H0 CD8067303408900 SR3BA
Intel Xeon Platinum 8156 3,6 ГГц H0 CD8067303368800 SR3AV
Intel Xeon Platinum 8158 3,0 ГГц H0 CD8067303406500 SR3B7
Intel Xeon Platinum 8160 2,1 ГГц H0 CD8067303405600 SR3B0
Intel Xeon Platinum 8160M 2,1 ГГц H0 CD8067303406600 SR3B8
Intel Xeon Platinum 8160T 2,1 ГГц H0 CD8067303592800 SR3J6
Intel Xeon Platinum 8164 2,0 ГГц H0 CD8067303408800 SR3BB
Intel Xeon Platinum 8168 2,7 ГГц H0 CD8067303327701 SR37J
Intel Xeon Platinum 8170 2,1 ГГц H0 CD8067303327601 SR37H
Intel Xeon Platinum 8170M 2,1 ГГц H0 CD8067303319201 SR3BD
Intel Xeon Platinum 8176 2,1 ГГц H0 CD8067303314700 SR37A
Intel Xeon Platinum 8176M 2,1 ГГц H0 CD8067303133605 SR37U
Intel Xeon Platinum 8180 2,5 ГГц H0 CD8067303314400 SR377
Intel Xeon Platinum 8180M 2,5 ГГц H0 CD8067303192101 SR37T

Процессоров Intel Xeon Gold в общей сложности 20. Они работают в том же частотном диапазоне (2,0–3,6 ГГц). Если у чипов Platinum поддержку технологии Hyper-Threading стоит рассматривать как нечто само собой разумеющееся, то у некоторых Xeon Gold её может не быть. Предварительно, количество x86-64 ядер у «золотых» Xeon составляет от 14 до 22 шт.

Процессор Частота Степпинг Код sSpec
Intel Xeon Gold 5122 3,6 ГГц H0 CD8067303330702 SR3AT
Intel Xeon Gold 6126 2,6 ГГц H0 CD8067303405900 SR3B3
Intel Xeon Gold 6126T 2,6 ГГц H0 CD8067303593100 SR3J9
Intel Xeon Gold 6128 3,4 ГГц H0 CD8067303592600 SR3J4
Intel Xeon Gold 6130 2,1 ГГц H0 CD8067303409000 SR3B9
Intel Xeon Gold 6130T 2,1 ГГц H0 CD8067303593000 SR3J8
Intel Xeon Gold 6132 2,6 ГГц H0 CD8067303592500 SR3J3
Intel Xeon Gold 6134 3,2 ГГц H0 CD8067303330302 SR3AR
Intel Xeon Gold 6134M 3,2 ГГц H0 CD8067303330402 SR3AS
Intel Xeon Gold 6136 3,0 ГГц H0 CD8067303405800 SR3B2
Intel Xeon Gold 6138 2,0 ГГц H0 CD8067303406100 SR3B5
Intel Xeon Gold 6138T 2,0 ГГц H0 CD8067303592900 SR3J7
Intel Xeon Gold 6140 2,3 ГГц H0 CD8067303405200 SR3AX
Intel Xeon Gold 6140M 2,3 ГГц H0 CD8067303405500 SR3AZ
Intel Xeon Gold 6142 2,6 ГГц H0 CD8067303405400 SR3AY
Intel Xeon Gold 6142M 2,6 ГГц H0 CD8067303405700 SR3B1
Intel Xeon Gold 6148 2,4 ГГц H0 CD8067303406200 SR3B6
Intel Xeon Gold 6150 2,7 ГГц H0 CD8067303328000 SR37K
Intel Xeon Gold 6152 2,1 ГГц H0 CD8067303406000 SR3B4
Intel Xeon Gold 6154 3,0 ГГц H0 CD8067303408900 SR3J5
 servethehome.com

servethehome.com

Более доступные в ценовом отношении серверные процессоры Intel Xeon Bronze и Xeon Silver, скорее всего, будут выполнены в форм-факторе LGA2066, как и настольные CPU Skylake-X и Kaby Lake-X (Core i7-7000). Коллеги из ComputerBase полагают, что у «серебряных» Xeon будет от 10 до 12 вычислительных ядер, а у «бронзовых» — до 10.

 overclock3d.net

overclock3d.net

Приём заказов на процессоры Intel Xeon, получившие названия металлов, начнётся в третьем квартале.

Постоянный URL: http://servernews.ru/951409
Система Orphus