Материалы по тегу: intel xe

03.12.2020 [13:49], Андрей Галадей

Выход Intel Xe HP не за горами: компания готовит Linux-драйверы Gen12HP

Некоторое время назад компания Intel анонсировала графический процессор Xe HP, предназначенный для конкуренции с игровыми и профессиональными ускорителями AMD и NVIDIA. В готовых решениях он появится только в 2021 году, но подготовка к этому идёт уже сейчас.

Сообщается, что компания готовится к развертыванию поддержки драйверов Linux с открытым исходным кодом под эти ускорители. Они предназначены не только для версии Gen12 (используется в Tiger Lake, Rocket Lake — Xe LP), но и для Gen12.5 или Gen12HP. Как ожидается, готовые драйверы появятся до конца января в составе Mesa 20.1. Они, скорее всего, будут поддерживать OpenGL/Vulkan и другие современных графически технологии. Всего в новом пакете добавлено более семи тысяч строк нового кода, а также различные изменения в драйверах Iris Gallium3D и ANV Vulkan.

На данный момент компания пока не особо распространяется на тему обновлений так что остаётся ждать новых данных. Напомним, что ранее в Geekbench протестировали видеокарту Intel Xe-HP NEO с 512 вычислительными блоками. Результаты пока не слишком впечатляют. Быть может, у финальной версии Xe HP с оптимизированными драйверами они будут лучше. Пока что в серверном сегменте доступен лишь ускоритель на базе четырёх GPU Intel Xe LP, который ориентирован на облачный гейминг.

Постоянный URL: http://servernews.ru/1026909
11.11.2020 [17:01], Игорь Осколков

H3C XG310, первый серверный GPU Intel, предназначен для облачного гейминга

Intel анонсировала дискретный графический ускоритель, ориентированный на серверное применение. Первая модель H3C XG310 выпущена в партнёрстве с китайским производителем и ориентирована на рынок облачных игр для Android. Среди первых партнёров, использующих новинку, значатся Gamestream, Tencent Games и Ubitus.

H3C XG310 включает сразу четыре GPU-чипа на базе архитектуры Xe-LP, ближайшего родственника дискретной графики Iris Xe Max, и 8 Гбайт памяти LPDDR4. Судя по всему, это и есть SG1, о котором стало известно в конце лета. Чуть укороченная однослотовая карта XG310 имеет полную высоту и интерфейс PCIe 3.0 x16, которые делится между отдельными GPU посредством набортного PCIe-коммутатора.

Две таких карты, как утверждается, способны обслуживать до 160 игроков одновременно (в зависимости от типа игры), с собственно рендерингом картинки и её кодированием на лету. Например, Tencent говорит о том, что им удаётся поддерживать 100 сессий в популярных играх King of Glory и Arena of Valor на сервере с двумя картами. А типовая конфигурация сервера может включать до четырёх ускорителей. Стоит отметить, что в данном случае приоритет отдан не столько качеству графики, сколько низкому уровню задержки.

Кроме того, новые ускорители можно использовать и просто для (де-)кодирования видеопотоков. Поддерживаются стандарты AVC, HEVC, MPEG2, VP9 и AV1. Программная составляющая включает Intel Media SDK, который вскоре вольётся в oneAPI VPL (Video Processing Library), а также готовые плагин для FFmpeg. Для 3D-графики предлагается использовать открытую библиотеку Mesa. Также Intel анонсировала новый проект Flipfast — стек, ориентированный на игры в среде Linux, который позволяет запускать в виртуальной машине графические приложения практически без потери производительности при работе с GPU.

В целом, Intel активно занимается развитием поддержки Linux, что пригодится в будущем при запуске «полноценных» GPU-ускорителей более высокого класса. В частности, компания переработала драйверы, унифицировав большую часть кода для Linux и Windows и подтянув производительность. Также Intel разрабатывает готовые наборы ПО для RHEL, SuSE и Ubuntu. Во многом новый программный стек опирается на oneAPI.

Постоянный URL: http://servernews.ru/1025140
21.08.2020 [20:34], Алексей Степин

Intel Xe готовит ускорители SG1 для обработки потокового видео силами четырёх GPU DG1

Популярность различных служб потокового видео чрезвычайно высока, и это означает, что со стороны серверов и ЦОД востребованность решений, способных в реальном времени транскодировать множество видеопотоков, так же высока. В портфолио Intel уже много лет есть серия особых ускорителей под общим названием Visual Compute Accelerator. До недавнего времени в них использовались процессоры Xeon со встроенной графикой Iris Pro, но с появлением Intel Xe VCA может получить новое дыхание.

Так был устроен Intel VCA2

Так был устроен Intel VCA2

Ускорители из серии VCA действительно уникальные решения: в стандартный двухслотовый конструктив платы расширения PCIe Intel умещала три процессора общего назначения Xeon E3-1200 v4, каждый с собственным модулем eDRAM объёмом 128 Мбайт и массивом DRAM объёмом 32 Гбайт. Такой ускоритель мог обрабатывать 14 потоков в формате 4K при 30 кадрах в секунду или 44 потока в более низком разрешении 1080p. Но не столь давно платы Intel VCA2 получили статус EOL — их жизненный цикл закончен.

Для коммутации VCA2 использвовала два чипа PEX. В SG1 придётся коммутировать PCIe для четырёх чипов

Для коммутации VCA2 использвовала два чипа PEX. В SG1 придётся коммутировать PCIe для четырёх чипов

Прямой замены VCA2 сейчас нет; по всей видимости, такая архитектура не оправдала себя в должной степени. Но, как известно, компания готовится выложить на стол новый козырь в виде графических процессоров Xe. Помимо монструозных Xe-HP, предназначенных для вычислительных задач, «синие» готовят и интегрированную Xe-LP, которая должна дебютировать в новых мобильных процессорах Tiger Lake уже 2 сентября.

Архитектура Xe-LP имеет и дискретный вариант: Discrete Graphics 1 (DG1). Прототип такой платы довольно компактен, он сопоставим по габаритам с графическими картами начального уровня AMD и NVIDIA. Судя по отсутствию дополнительных разъёмов питания, он должен укладываться в 75-ваттный пакет энергопотребления. Похоже, гипотетический ускоритель VCA3 будет называться SG1, поскольку Intel упомянула, что SG1 как раз и нацелен на применение в области ускорения обработки видео и потокового вещания. Это хорошо согласуется с «отставкой» VCA2 — ускорители на базе архитектуры Xe явно производительнее и процессорной части, и Iris Pro, тем более что отдельно последняя не выпускается.

Представитель Intel подтвердил Anandtech, что SG1 будет иметь четыре чипа DG1 на одной плате. Как и VCA2, гипотетический пока ещё VCA3/SG1 должен получить сетевую часть. Какой объём памяти будет сопровождать DG1 в этих платах, пока неизвестно, как и то, каким образом будут распределяться линии PCI Express. Уверенно можно сказать только то, что новый процессор сможет транскодировать видео в форматах AVC, HEVC, MPEG2 и VP9, а также декодировать формат AV1.

Постоянный URL: http://servernews.ru/1018823
27.07.2020 [18:43], Илья Коваль

Экзафлопс на перепутье: задержка Intel в освоении новых техпроцессов может повлиять на сроки запуска суперкомпьютера Aurora

Основной темой обсуждений в СМИ пятничного доклада Intel о состоянии дел во втором квартале стало признание проблем с освоением техпроцесса 7 нм и связанные с этим задержки выхода продуктов на его основе, которые могут составить от 6 до 12 месяцев. И одним из таких продуктов является ускоритель Ponte Vecchio, который должен стать ключевым компонентом суперкомпьютера Aurora.

Впрочем, у данной машины, создаваемой для Аргоннской национальной лаборатории (Argonne National Laboratory), непростая судьба. Изначально анонс суперкомпьютера Aurora состоялся в 2015 году. Прежний проект предполагал построением силами Intel и Cray машины производительностью 180 Пфлопс, которая должна была заработать в 2018 году. Основной для ней должны были стать 10-нм чипы Xeon Phi семейства Knights Hill (KNH), выход которых был запланирован на всё тот же 2018 год. Как мы теперь знаем, ни своевременного освоения 10 нм, ни ускорителей KNH компания сделать не смогла. Более того, в конце концов развитие Xeon Phi было остановлено, а финальные партии последнего поколения Knights Mill будут отгружены в конце июля. Та же судьба постигла анонсированный вместе с KNH интерконнект Omni-Path (OPA).

В конце 2017 года произошло сразу три важных для Aurora события. Во-первых, проект суперкомпьютера был полностью переработан — запуск был перенесён на 2021 год, а запланированная производительность поднялась до отметки в 1 Эфлопс. По задумке, Aurora должна была стать самым лучшим и производительным суперкомпьютером в США, а то и в мире. Вместо Xeon Phi, и это во-вторых, для него было запланировано использование ускорителей нового поколения, которые теперь известные как Intel Xe Ponte Vecchio. В-третьих, в Intel перешёл Раджа Кодури (Raja Koduri), который возглавил группу разработки дискретных GPU.

Старая презентация Aurora

Старая презентация Aurora

Очевидным выходом из сложившейся ситуации является обращение к сторонним фабрикам, которые уже освоили необходимые норма. В первую очередь речь идёт, конечно, о TSMC, которая обслуживает конкурирующие AMD и NVIDIA. Сообщается, что Intel разместила на TSMC заказ на 180 тыс. 6-нм (но не 5-нм, как ожидалось) пластин. Ранее Intel использовала TSMC в основном для производства относительно простых и недорогих чипсетов и SoC, а также FPGA. Для сравнения — объём заказов AMD составляет 200 тыс. пластин. Какие именно продукты и компоненты будут производиться на стороне, точно не говорится, хотя в ходе квартального доклада Intel упоминала о разнородных кристаллах в Ponte Vecchio, часть из которых действительно можно было бы отдать стороннему подрядчику.

Архитектура Ponte Vecchio действительно является модульной и предполагает подбор необходимых вычислительных блоков в зависимости от задачи и предназначения устройства. При этом до конца не ясно, предполагается ли многочиповая компоновка для таких блоков или же нет. В прошлогодней презентации Intel Xe HPC, которые и будут установлены в Aurora, явно говорилось только о подключении HBM2-памяти посредством EMIB, а также об упаковке Foveros для формирования Rambo Cache, кеша общей шины XE Memory Fabric, объединяющей CPU, GPU и память.

В комментарии изданию insideHPC аналитик Hyperion Research Стив Конвей (Steve Conway) отмечает, что «запуск Aurora может быть перенесён на конец 2021 года или на самое начало 2022. Это не слишком большая задержка, но всё-таки задержка. <…> Проблемы с техпроцессом касаются не только GPU, но и вообще всех 7-нм компонентов». Конвей говорит, что Intel, по-видимому, будет отдавать часть производства на аутсорс, но только в начальный период времени. Нельзя не отметить, что серверный сегмент важен для Intel.

Новая Aurora

Новая Aurora

В любом случае, эта ситуация может положительно сказаться на AMD. По словам аналитика, нынешние 7-нм AMD EPYC хороши с точки зрения пропускной способности памяти, а цена на эти процессоры зачастую меньше. Комбинация этих двух факторов способствует росту. Сейчас на базе решений AMD (CPU + GPU) разрабатываются два суперкомпьютера: El Capitan с производительностью более 2 Эфлопс, ввод в строй которого намечен на 2023 год, и Frontier мощностью 1,5 Эфплос, который должен быть запущен в следующем году. Как и в случае Aurora, подрядчиком в обоих проектах выступает Cray (теперь уже HPE).

Постоянный URL: http://servernews.ru/1016740
18.11.2019 [07:02], Игорь Осколков

SC19: подробности об архитектуре ускорителей Intel Xe HPC

Как и было обещано ранее, архитектура Xe (Exascale for everyone) будет универсальной, и на её основе можно будет создавать GPU любого уровня. Правда, речь, как оказалось, шла всё-таки больше о программной совместимости на уровне драйверов и интерфейсов для сохранения наследия, оставшегося от интегрированной графики. Ведь пользователей таких GPU миллионы и миллионы. 

А вот микроархитектур для разных задач будет несколько, и их соотношение в готовых продуктах тоже будет разным.

Ускоритель Intel X<sup>e</sup> HPC

Ускоритель Intel Xe HPC

Для ультрабуков и мобильных устройств всё так же останется интегрированная видеокарта класса Xe LP (Low Power) с упором на энергоэффективность. В картах среднего уровня Intel сделает акцент на графическую составляющую. Решения класса Xe HP для дата-центров уже не имеют существенных ограничений по питанию, поэтому получат более мощные вычислительные блоки.

Наконец, карты Xe HPC под кодовым названием Ponte Vecchio, которые и были представлены сегодня, получат тысячи исполнительных блоков и будут самыми мощными во всей серии. Ускорители Xe будут сочетать подходы SIMT и SIMD, характерные для GPU и CPU соответственно, и использовать векторные инструкции переменной длины. Предварительные тесты показывают, что такое сочетание может дать прирост в 1,5–2,5 раза на некоторых классах задач. Для упрощения разработки и портирования кода предлагается воспользоваться oneAPI, который также был анонсирован в рамках доклада Intel.

Кроме того, новые ускорители обещают эффективную работу и с разными типами данных. Для форматов INT8, Bfloat16 и FP32 будет отдельный движок Matrix Engine для параллельной обработки матриц. Вероятно, это аналог TensorCore. Проще говоря, всё это нужно для ИИ, машинного обучения и так далее. Но и классические для HPC вычисления двойной точности тоже не забыты. Обещано ускорение таких операций до 40 раз на каждый исполнительный блок.

Масштабирование касается не только типов вычислительных блоков и их числа, но и доступа к памяти, который в Xe тоже кардинально переделали. Сами блоки Xe и HBM2-память связаны посредством отдельной фабрики XEMF (XE Memory Fabric) с поддержкой когерентности. К ней же подключаются и CPU, и GPU, и другие ускорители. XEMF оснащена особым, сверхбыстрым и ёмким кешем Rambo Cache. Такой подход призван устранить дисбаланс, характерный для ряда современных ускорителей, которые могут попросту не получать вовремя данные для обработки.

Конкретный размер Rambo Cache пока не уточняется, но говорится, что его объёма хватит для наиболее крупных блоков данных, которые сейчас используются при вычислениях. Rambo Cache будет упакован с помощью Foveros, а для подключения HBM-памяти будет использоваться EMIB. Техпроцесс, как уже было сказано много-много раз, будет 7-нм.

Кроме того, ускорители Xe HPC получат те же технологии обеспечения надёжности и стабильности работы, что используются в Intel Xeon. Итого: к 2021 году за счёт аппаратных и программных инноваций компания обещает в 500 раз повысить производительность вычислительных узлов на базе технологий Intel.

Постоянный URL: http://servernews.ru/997874
14.11.2019 [08:00], Андрей Созинов

Intel Ponte Vecchio: первый дискретный графический процессор на архитектуре Intel Xe

Компания Intel поделилась с прессой информацией о своих будущих 7-нм графических процессорах на архитектуре Intel Xe с кодовым названием Ponte Vecchio. Ресурс VideoCardz по своему обыкновению поделился этой информацией с широкой общественностью.

Ponte Vecchio или по-русски Понте-Веккьо — старинный и весьма известный мост во Флоренции. Такое кодовое название явно указывает на то, что для этих графических процессоров предполагается работа не поодиночке, а в связках, например, с использованием интерконнекта CXL (Compute Express Link).

Использование интерконнекта говорит о том, что Intel Ponte Vecchio будут использоваться не в игровых видеокартах. Первые графические процессоры с архитектурой Xe лягут в основу ускорителей вычислений для суперкомпьютеров экзафлопсного уровня.

Сообщается, что 17 ноября Intel раскроет подробности о своём новом проекте Aurora (англ. — Аврора) — экзафлопсной суперкомпьютерной платформе на центральных процессорах Xeon Sapphire Rapids, графических процессорах Ponte Vecchio и с новыми средствами разработки OneAPI. Если точнее, то кластер Aurora будет включать:

  • Два процессора Intel Xeon Scalable на микроархитектуре нового поколения Sapphire Rapids
  • Шесть графических процессоров Intel Xe Ponte Vecchio
  • Среду OneAPI

По данным источника, в новых материалах для прессы Intel заявляет, что при создании графических процессоров Ponte Vecchio будет использоваться многокристальная 3D-компоновка Foveros и интерконнект CXL. Сообщается, что графические процессоры Intel Xe будут обладать очень большим объёмом кеша и высокой пропускной способностью памяти. Ещё отмечается, что чипы Ponte Vecchio будут обладать высокой производительностью в вычислениях двойной точности (FP64).

Также в свежих материалах Intel перечисляет все направления, в которых будет представлена графическая архитектура Intel Xe. Это высокопроизводительные вычисления и суперкомпьютеры экзафлопсного уровня, глубокое обучение и ИИ, облачные системы, рабочие станции, игровые компьютеры, а также мобильные и ультрамобильные ПК. То есть, Intel планирует использовать свою новую графику везде.

Постоянный URL: http://servernews.ru/997616
Система Orphus