Материалы по тегу: avx-512

14.10.2021 [22:10], Андрей Галадей

Оптимизации NumPy для AVX-512 ускорила ряд функций в десятки раз

Компания Intel внесла оптимизации для AVX-512 в основную версию Python-библиотеки NumPy. Как отмечается, это должно увеличить её производительность на современных «синих» процессорах в десятки раз. Исходники обновления открыты, они были позаимствованы из Intel Short Vector Math Library (SVML). Первоначальный вариант апдейта Intel выпустила минувшим летом. В него входила реализация 44 математических функций в вариантах с одинарной и с двойной точностью.

Однако в итоге были внедрены только 18 из них. При этом специалисты Intel обнаружили, что даже со старыми процессорами на базе микроархитектуры Skylake с поддержкой AVX-512 рост производительности в некоторых функциях составлял до 55 раз. В среднем же ускорение составило до 14 раз для операций с двойной точностью и до 32 раз — с одинарной.

Постоянный URL: http://servernews.ru/1051236
05.07.2021 [15:37], Андрей Галадей

Intel Xeon Sapphire Rapids получат инструкции AVX-512 FP16

Разработчики из компании Intel готовят патчи для ПО с поддержкой будущих процессоров Xeon семейства Sapphire Rapids, которые, как теперь выяснилось, будут включать инструкции AVX-512 FP16. Соответствующая документация была выложена в публичный доступ в самом конце июня. А вслед за этим появились патчи для GCC и LLVM, на которые обратил внимание ресурс Phoronix.

Поддержка FP16-вычислений с помощью AVX-512 будет актуальна, в первую очередь, для приложений машинного обучения. При этом не следует путать их с BF16 (Bfloat16), которая появилась ещё в семействе Cooper Lake в прошлом году. Для GCC Intel подготовила набор из 62 патчей для поддержки всех новых функций AVX512 FP16, а также автоматической векторизации _Float16 и связаных задач. Для LLVM добавлены патчи, «знакомящие» Clang с новым форматом и инструкциями.

Судя по всему, полноценная поддержка появится только в GCC 12, то есть, как теперь понятно, ближе к релизу самих процессоров в первой половине 2022 года. И очередные релизы крупных дистрибутивов её не получат. Что касается Clang, то есть все шансы, что поддержка будет добавлена уже в LLVM 13 — релиз намечен на осень.

Постоянный URL: http://servernews.ru/1043516
08.02.2017 [15:17], Иван Грудцын

Первые данные о процессоре Xeon Gold 6150 (Skylake-EP)

В обозримом будущем компания Intel выпустит семейство процессоров Skylake-EP для высокопроизводительных рабочих станций и серверов. CPU серии Xeon E5-2600 v5 будут содержать максимум 28 или 32 физических ядра, получат поддержку инструкций AVX-512 и новую структуру кеш-памяти. Материнские платы LGA3647, для которых предназначены эти процессоры, доступны для заказа ещё с лета прошлого года в связи с выходом CPU Xeon Phi 200 (Knights Landing), поэтому в базах данных бенчмарков время от времени публикуются результаты тестирования опытных образцов Skylake-EP.

Intel Skylake-EP

На сайте SiSoftware Sandra, одной из старейших утилит для оценки производительности компонентов системы, был обнаружен результат двухпроцессорной конфигурации на базе тандема Xeon Gold 6150. CPU трудились в составе сервера Supermicro на платформе Intel Purley (название матплаты указано не было). В тестовом пакете Processor Multi-Media система показала результат 4040,67 Мпикс/с, ставший вторым в мире.

Несмотря на отличную от обычной номенклатуру, имеются все основания полагать, что «золотой» Xeon родственен моделям Xeon E5-2600 v5. Возможно, приставка Gold указывает на привлекательное соотношение производительности и TDP, или это просто маркетинговый ход в угоду крупным клиентам (например, Apple с её рабочими станциями Mac Pro).

Индекс модели никак не соотносится с количеством ядер. Xeon Gold 6150 содержит 18 вычислительных (x86-64) ядер, обрабатывающих данные в 36 потоков. Номинальная частота чипа составляет 2,7 ГГц, в турборежиме она повышается до 3,7 ГГц (для части ядер). Процессорные ядра имеют собственный кеш второго уровня объёмом 1 Мбайт. У Broadwell-EP, напомним, только 256 Кбайт кеш-памяти второго уровня на одно ядро. Разделяемый кеш третьего уровня, наоборот, небольшой — 24,75 Мбайт. Частота встроенного контроллера памяти DDR4 также довольно скромная — 2,4 ГГц.

Зафиксированное программой Sandra 2015 энергопотребление в 396 Вт впечатляет, но данное значение, скорее всего, относится к системе в целом. Так, результат №8 в рейтинге Processor Multi-Media на двух неанонсированных CPU Xeon E5-2696 v4 с TDP в 150 Вт сопровождается ненамного меньшим значением энергопотребления — 360 Вт.

Как видим, поддержка AVX-512 обеспечивает большое преимущество Skylake-EP над предшественниками. Но будет ли оно столь же значительным в реальных приложениях? Ответ мы узнаем ближе к лету. Поговаривают, что релиз первых моделей процессоров Skylake-EP состоится на выставке Computex 2017, которая откроет свои двери 30 мая.

Постоянный URL: http://servernews.ru/947229
Система Orphus