Материалы по тегу: fpga

21.12.2024 [14:00], Сергей Карасёв

Для невыпущенного суперчипа Tachyum Prodigy выпустили 1600-страничное руководство по оптимизации производительности

Словацкая компания Tachyum, разрабатывающая процессоры Prodigy с уникальной архитектурой, объявила о выпуске руководства по оптимизации производительности этих чипов. Точнее, для FPGA-эмулятора Prodigy, поскольку самих чипов всё ещё нет. Огромный документ на 1600 страниц содержит подробную информацию о том, как в полной мере воспользоваться потенциалом новинки.

Первая информация о разработке Prodigy появилась в 2019–2020 гг. Эти суперпроцессоры, как утверждается, объединяют возможности CPU, GPU и TPU. Они предназначены для решения различных ресурсоёмких задач, связанных в том числе с ИИ и машинным обучением.

Сроки выпуска Prodigy несколько раз пересматривались: сначала выход чипов был перенесён с 2021-го на 2022 год, затем — на 2023 год, а впоследствии — на 2024-й. В соответствии с текущими планами Tachyum намерена начать отгрузку образов чипов в 2025 году.

 Источник изображения: Tachyum

Источник изображения: Tachyum

Подготовленное руководство для изделий Prodigy, как заявляет компания, содержит рекомендации по созданию высокопроизводительного ПО для этой платформы. Документ описывает конкретные методы оптимизации, включая управление ограничениями диспетчеризации, улучшение процедур работы памяти и пр. Кроме того, описаны способы обработки операций кеширования и доступа к специальным регистрам для тонкой настройки с целью достижения максимальной производительности.

В руководстве рассматриваются особенности чипов. Архитектура набора инструкций Prodigy (ISA) представляет собой смесь RISC и CISC, но не включает какие-либо сложные и/или длинные и неэффективные инструкции переменной длины. Все инструкции имеют ширину 32 или 64 бит, а некоторые из них содержат функции доступа к памяти для дальнейшего повышения производительности.

Изделия Prodigy объединяют до 192 ядер с тактовой частотой до 5 ГГц и выше. Реализованы 16 каналов памяти DDR5-7200 с возможностью использования до 32 Тбайт ОЗУ в расчёте на процессорный разъём. Поддерживаются 96 линий PCIe 5.0. Планируемая технология производства — 5 нм. В конце 2023 года Tachyum получила заказ на поставку чипов Prodigy для создания суперкомпьютера с ИИ-производительностью до 8 Зфлопс.

Постоянный URL: http://servernews.ru/1115753
12.12.2024 [17:36], Сергей Карасёв

FPGA + EPYC: AWS представила AMD-инстансы EC2 F2 с процессорами Milan и ПЛИС Virtex UltraScale+

Облачная платформа AWS анонсировала инстансы второго поколения с FPGA на борту. Экземпляры EC2 F2 ориентированы на решение задач в области геномики, обработки мультимедийных материалов, больших данных, спутниковой связи, компьютерных сетей, моделирования кремниевых чипов и видеотрансляций в реальном времени.

В новых инстансах применяются FPGA AMD Virtex UltraScale+ HBM VU47P. Эти изделия содержат 2,852 млн логических ячеек и 9024 DSP. Заявленная ИИ-производительность достигает 28 TOPS при вычислениях INT8. Кроме того, в состав EC2 F2 входят процессоры AMD EPYC поколения Milan.

Новые инстансы доступны в вариантах f2.12xlarge и f2.48xlarge — с 48 и 192 vCPU и 2 и 8 FPGA соответственно. Каждая ПЛИС оперирует 16 ГиБ памяти HBM и 64 ГиБ памяти DDR4. Таким образом, в случае f2.12xlarge используется в сумме 32 ГиБ HBM и 128 ГиБ DDR4, а в случае f2.48xlarge — 128 ГиБ и 512 ГиБ соответственно.

 Источник изображения: AWS

Источник изображения: AWS

Конфигурация f2.12xlarge включает 512 ГиБ системной памяти и два накопителям NVMe SSD суммарной вместимостью 1900 ГиБ. Пропускная способность сетевого подключения составляет 25 Гбит/с, пропускная способность EBS-томов — 15 Гбит/с. У экземпляра f2.48xlarge объём памяти составляет 2048 ГиБ, общая вместимость NVMe SSD — 7600 ГиБ. Пропускная способность сетевого подключения и EBS-томов достигает 100 Гбит/с и 60 Гбит/с соответственно. Для этого экземпляра предусмотрена поддержка AWS Cloud Digital Interface (CDI) для надёжной передачи несжатого видео (задержка между инстансами заявлена на уровне 8 мс).

Постоянный URL: http://servernews.ru/1115320
25.11.2024 [16:17], Владимир Мироненко

В Lattice Semiconductor обсуждают возможность покупки у Intel всего FPGA-подразделения Altera

Lattice Semiconductor из Хиллсборо (штат Орегон) проявила интерес к покупке Altera (ранее PSG), подразделения Intel, специализирующегося на разработке ПЛИС. Это не вполне согласуется с планами производителя чипов продать лишь миноритарный пакет акций подразделения для улучшения своего финансового положения. Именно такое предложение Intel разослала потенциальным покупателям.

Тем не менее, по данным источников Bloomberg, в Lattice Semiconductor обсуждают с консультантами возможность подачи предложения о полной покупке Altera и сейчас ищут потенциального частного инвестора для финансирования сделки. Как сообщают источники, компании, специализирующиеся на поглощениях, включая Francisco Partners, Bain Capital и Silver Lake Management, также рассматривают варианты инвестирования в Altera. Кроме того, возможность покупки доли в Altera может привлечь интерес и других полупроводниковых компаний.

Предложения о покупке Altera должны быть поданы в четверг на этой неделе, сообщили источники агентства. По мнению аналитиков Bloomberg, приобретение Altera станет для Lattice сложной задачей, учитывая её относительно небольшие размеры. Рыночная стоимость Lattice составляет $7,48 млрд, что менее половины суммы, которую Intel заплатила за Altera в 2015 году — около $17 млрд.

 Источник изображения: Intel

Источник изображения: Intel

По словам источников, предложения о покупке доли в Altera, чьи многоцелевые чипы преимущественно используются в телекоммуникационных сетях, должны быть тщательно структурированы. Частные инвестиционные компании рассматривают возможность инвестирования порядка $3 млрд, которые могут быть представлены в форме сложных интегрированных инструментов. Это может привести к оценке Altera ниже той стоимости, за которую её приобрела Intel, отмечают источники.

Intel в прошлом месяце вновь заявила о намерении продать долю в Altera, не отказываясь от планов дальнейшего проведения IPO. Это является частью более широкой стратегии чипмейкера по реорганизации своего бизнеса. На этой неделе состоится заседание совета директоров Intel, повестка которого включает обсуждение будущего Altera, сообщили источники, повторив, что Intel предпочла бы продать миноритарную долю в Altera, а не все подразделение.

Генеральный директор Intel Пэт Гелсингер (Pat Gelsinger) заявил, что компания намерена решить вопрос с Altera в начале следующего года. Источники подчеркнули, что потенциальные покупатели Altera продолжают обсуждения, и гарантий того, что сделка состоится, пока нет.

Постоянный URL: http://servernews.ru/1114523
20.10.2024 [20:39], Владимир Мироненко

Intel разослала предложения по продаже своей доли в Altera

Intel намерена продать по крайней мере миноритарную долю в своем подразделении Altera (ранее PSG), специализирующемся на разработке ПЛИС, чтобы получить несколько миллиардов долларов для укрепления пошатнувшегося финансового положения, сообщил CNBC со ссылкой на информированные источники. Крупнейшим конкурентом Altera, как и крупнейшим производителем FPGA является AMD, которая вышла на этот рынок в 2022 году благодаря приобретению Xilinx за $49 млрд.

По словам источников ресурса, на минувшей неделе компания обратилась к ряду частных и стратегических инвесторов с предложением о продаже доли в Altera. Некоторым из них она сообщила о готовности продать контрольный пакет акций. В предлагаемой сделке Intel исходит из рыночной стоимости Altera в $17 млрд, что ненамного больше $16,7 млрд, уплаченных за неё в 2015 году.

 Источник изображения: Intel

Источник изображения: Intel

Сообщение CNBC подтверждает сделанное ранее заявление гендиректора Altera Сандры Ривера (Sandra Rivera) о том, что компания продолжает следовать плану, объявленному более года назад. План предусматривает продажу доли в компании и проведение IPO в 2026 году. Ривера заявила об этом после появления сообщений о том, что Intel может продать Altera полностью, возможность чего она исключает.

Постоянный URL: http://servernews.ru/1112743
20.10.2024 [11:09], Сергей Карасёв

AMD выпустила ускоритель для трейдеров Alveo UL3422 на базе FPGA Virtex UltraScale+ VU2P

Компания AMD анонсировала изделие Alveo UL3422: это, как утверждается, самый быстрый в мире однослотовый ускоритель половинной длины (FHHL) для брокерских и биржевых приложений. Новинка уже поставляется заказчикам из финансового сектора по всему миру.

В устройстве применена FPGA Virtex UltraScale+ VU2P. Конфигурация включает 32 трансивера с ультранизкой задержкой, 787 тыс. LUT и 1680 DSP. В состав FPGA входят 256 Мбайт встроенной памяти — 76 Мбайт блочной RAM и 180 Мбайт UltraRAM. Заявленная задержка на уровне трансиверов составляет менее 3 нс.

Карта использует интерфейс PCIe 4.0 x8 (коннектор x16). Заявленный показатель TDP равен 120 Вт; используется пассивное охлаждение. В оснащение входят 16 Гбайт памяти DDR4-2400. Предусмотрены два разъёма QSFP-DD (16​×​10/25G) и два коннектора ARF6.

 Источник изображения: AMD

Источник изображения: AMD

Ускоритель Alveo UL3422 может использоваться в комплексе с платформой разработки Vivado Design Suite. AMD также предоставляет клиентам среду разработки FINN с открытым исходным кодом и поддержкой сообщества, что позволяет интегрировать модели ИИ с низкими задержками в высокопроизводительные торговые системы. FINN использует PyTorch и методы квантования нейронных сетей.

Ускоритель поставляется с набором референсных проектов и тестов производительности. Среди ключевых сфер применения новинки названы торговые операции со сверхнизкими задержками и анализ рисков.

Постоянный URL: http://servernews.ru/1112738
24.09.2024 [20:05], Владимир Мироненко

Altera поделилась подробностями об FPGA Agilex 3 и анонсировала предстоящий релиз Quartus Prime Pro

Компания Altera, созданная на базе выделенной из Intel группы программируемых решений (PSG), поделилась на ежегодной конференции для разработчиков Altera Innovators Day новыми подробностями о следующем поколении оптимизированных по энергопотреблению и стоимости чипов Agilex 3, а также анонсировала новые комплекты разработки и поддержку ПО для FPGA Agilex 5.

Altera сообщила, что новые FPGA Agilex отличается от предыдущего поколения более высоким уровнем интеграции, повышенной безопасностью и более высокой производительностью, объединяя эти качества в компактном корпусе с плотностью от 25 тыс. до 135 тыс. логических элементов. Наряду с ПЛИС, наделённой возможностями ИИ, семейство Agilex 3 содержит пару Arm-ядер Cortex-A55.

 Источник изображений: Altera via ServeTheHome

Источник изображений: Altera via ServeTheHome

FPGA серии Agilex 3 ориентированы на системы, в которых энергоэффективность важнее производительности. Intel полагает, что эти чипы найдут применение в таких продуктах, как подключённые устройства, промышленные роботы и автономные транспортные средства. Для интеллектуальных периферийных приложений именно FPGA обеспечивают вычисления в реальном времени для чувствительных ко времени приложений. А для интеллектуальных технологий автоматизации производства Agilex 3 предложат бесшовную интеграцию датчиков, драйверов, актуаторов и алгоритмов машинного обучения.

Agilex 3 используют архитектуру HyperFlex и имеют в 1,9 раза более высокую производительность по сравнению с предыдущим поколением, говорит Altera. Рост производительности достигнут за счёт интегрированных высокоскоростных трансиверов (до 12,5 Гбит/с) и поддержки экономичной памяти LPDDR4. Для удовлетворения потребности как оборонных систем, так и коммерческих проектов в области безопасности, в Agilex 3 добавлено шифрование потоков данных, аутентификация и функция обнаружения физического несанкционированного доступа.

Компания сообщила, что ПО для Agilex 3 FPGA выйдет в I квартале 2025 года, а поставки комплектов разработчика и самого продукта, как ожидается, начнутся в середине 2025 года. Altera также анонсировала предстоящий выпуск ПО Quartus Prime Pro 24.3 для современных ПЛИС Agilex и расширенную поддержку встраиваемых решений. Речь как об аппаратных блоках, так и, например, о программном RISC-V ядре Nios V. Кроме того, объявлено о поддержке Agilex 5 SoC в Linux, VxWorks и Zephyr.

Клиенты смогут использовать Quartus Prime Pro 24.3 для серии Agilex 5 D, которая нацелена на более широкий спектр вариантов использования по сравнению с Agilex 5 E, оптимизированной для обеспечения эффективных вычислений на периферии. При этом для Agilex 5 E-серии доступна бесплатная лицензия ПО Quartus Prime, что снизит барьер для входа при работе с FPGA Altera среднего уровня. Также отмечена выросшая почти на треть скорость компиляции.

Наконец, Altera и её партнеры по экосистеме объявили о выпуске 11 новых комплектов разработчика на основе Agilex 5 и SoM. В дальнейшем Altera сосредоточится именно на работе с партнёрами, а сама заниматься созданием плат и решений вряд ли будет.

Постоянный URL: http://servernews.ru/1111448
14.09.2024 [00:42], Владимир Мироненко

Altera не будут продавать — лишь долю в бизнесе, как и планировалось

Сандра Ривера (Sandra Rivera), гендиректор компании Altera, созданной на базе выделенной из Intel группы программируемых решений (PSG), опровергла сообщения о планах чипмейкера по продаже Altera с целью получения средств для выхода из кризисного положения. В интервью ресурсу CRN Ривера заявила, что для компании ничего не изменилась, и предприятие по-прежнему следует плану, который был объявлен более года назад. Он предполагает продажу доли в бизнесе, а не всей компании целиком, и проведение IPO в 2026 году.

Напомним, что на прошлой неделе агентство Reuters сообщило со ссылкой на неназванные источники, что Intel планирует вынести на рассмотрение совета директоров на заседании в середине сентября потенциальную продажу предприятий, не являющихся ключевыми для её стратегии, в том числе Altera.

 Источник изображения: Intel

Источник изображения: Intel

Altera с начала 2024 года работает независимо от Intel, но процесс разделения бизнеса с материнской компанией всё ещё не завершён, хотя и «фактически опережает график». По словам Риверы, крайний срок завершения разделения структур и функций двух компаний — 1 января 2025 года.

В настоящее время ведётся подготовка к продаже доли компании, проводятся встречи с банками, а также выполняется необходимая для этого работа, говорит Ривера. «И команда очень, очень сосредоточена на нашей долгосрочной цели, нашей конечной цели — стать номером один в отрасли. И IPO — это важная и волнующая веха на этом пути», — заявила она.

Intel приобрела компанию Altera в 2015 году за $16,7 млрд. В октябре прошлого года Intel объявила о предстоящем выделении с 1 января 2024 года группы программируемых решений (PSG) в отдельную бизнес-структуру, а в феврале 2024 анонсировала возрождение независимого бренда Altera.

Постоянный URL: http://servernews.ru/1110965
20.05.2024 [19:32], Александр Бенедичук

FPGA с HBM2e: AMD без лишнего шума выпустила ускоритель Alveo V80 стоимостью всего $9,5 тыс.

AMD начала массовое производство ускорителя Alveo V80 стоимостью $9,5 тыс., передаёт Wccftech. Новинка на базе SoC Versal HBM предназначена для рабочих нагрузок среднего уровня, существенно зависящих от пропускной способности памяти (ПСП), и, как ожидается, получит широкое распространение в области HPC, сетей и СХД.

Alveo V80 базируется на гибридной 7-нм SoC Versal XCV80 HBM и включает 32 Гбайт HBM2e-памяти с ПСП 820 Гбайт/с. FPGA предлагает 10 848 DSP, 2,6 млн LUT, 132 Мбит BRAM и 541 Мбит UltraRAM. Также есть два ядра общего назначения Arm Cortex-A72, дополненных 4 или 8 Гбайт DDR4-3200 ECC, и пара ядер Arm Cortex-R5F. На плате есть DIMM-слот для установки 32 Гбайт DDR4-памяти.

 Источник изображения: AMD

Источник изображения: AMD

Ускоритель обладает развитой сетевой подсистемой, которая включает три криптодвижка класса 400G, шесть 100G Ethernet MAC, три 600G Ethernet MAC и один 600G-интерфейс Interlaken для межчипового взаимодействия. Впрочем, на самой карте есть только четыре порта QSFP56, работающих либо в режиме 2 × 100GbE, либо 4 × 10/25/40/50GbE. Сама карта имеет интерфейс PCIe 4.0 x16, который также может быть сконфигурирован как два PCIe 5.0 x8. В задней части есть пара коннекторов MCIO x4 и один MCIO x8.

 Источник изображения: AMD

Источник изображения: AMD

Ускоритель выполнен в виде двухслотовой карты с пассивным охлаждением и имеет TDP до 190 Вт. При этом у него есть сразу два восьмиконтактных гнезда для дополнительного питания. По словам компании, Alveo V80 является своего рода наследницей Alveo U55C и в 2–4 раза лучше её по ряду параметров.

Постоянный URL: http://servernews.ru/1105060
11.04.2024 [14:47], Сергей Карасёв

AMD представила гибридные FPGA Versal Gen 2 для встраиваемых систем с ИИ

Компания AMD анонсировала так называемые адаптивные SoC семейства Versal второго поколения (Gen 2), предназначенные для встраиваемых систем со средствами ИИ. Утверждается, что чипы обеспечивают до трёх раз более высокий показатель производительности TOPS/Вт по сравнению с решениями Versal AI Edge первого поколения.

Дебютировали чипы серий Versal AI Edge Gen 2 и Versal Prime Gen 2. Изделия первого семейства, как утверждается, содержат оптимальный набор блоков для решения задач на встраиваемых системах с ИИ: это предварительная обработка данных с помощью программируемой логики FPGA, инференс и постобработка с использованием ядер Arm.

 Источник изображений: AMD

Источник изображений: AMD

Производительность INT8 у чипов Versal AI Edge Gen 2 в зависимости от модификации варьируется от 31 до 185 TOPS, быстродействие MX6 — от 61 до 370 TOPS. В составе процессора приложений задействованы ядра Arm Cortex-A78AE, количество которых может составлять 4 или 8. Кроме того, используются 4 или 10 ядер реального времени Arm Cortex-R52. Заявлена поддержка интерфейсов PCI Express 5.0 x4, USB 3.2, DisplayPort 1.4, 10GbE и 1GbE, UFS 3.1, CAN/CAN-FD, SPI, UART, USB 2.0, I2C/I3C, GPIO.

В свою очередь, решения Versal Prime Gen 2 предназначены для ускорения задач в традиционных встраиваемых системах, которые не работают с ИИ-приложениями. Они объединяют до восьми ядер Arm Cortex-A78AE и до 10 ядер реального времени Arm Cortex-R52. Набор поддерживаемых интерфейсов аналогичен изделиям Versal AI Edge Gen 2. Говорится о возможности многоканальной обработки видео в формате 8K.

Отмечается, что новые процессоры лягут в основу систем для автомобильной, аэрокосмической и оборонной отраслей, промышленности, а также сфер машиностроения, здравоохранения, вещания и пр. Чипы позволяют разрабатывать высокопроизводительные продукты для периферийных вычислений.

Постоянный URL: http://servernews.ru/1103101
10.04.2024 [14:34], Сергей Карасёв

Intel и Altera представили Agilex 5 — первую FPGA с ИИ-архитектурой

Возродив бренд Altera, корпорация Intel анонсировала FPGA серии Agilex 5, рассчитанные на широкий спектр применений. Это могут быть различные встраиваемые и промышленные устройства, решения для систем связи, обеспечения безопасности, видеоаналитики и пр.

Intel называет Agilex 5 первыми в отрасли FPGA с ИИ-архитектурой. Изделия производятся по технологии Intel 7. Это первые FPGA в своём классе, оснащённые усовершенствованным (Enhanced) DSP с тензорным ИИ-блоком (AI Tensor Block), который отвечает за высокоэффективную обработку операций, связанных с ИИ.

 Источник изображений: Intel

Источник изображений: Intel

Кроме того, как утверждается, Agilex 5 — это первые на рынке FPGA с асимметричным блоком процессора приложений, состоящим из двух ядер Arm Cortex-A76 и двух ядер Cortex-A55. Такая конфигурация в зависимости от рабочих нагрузок позволяет оптимизировать производительность и энергоэффективность. Тактовая частота ядер Cortex-A76 достигает 1,8 ГГц, ядер Cortex-A55 — 1,5 ГГц.

В семейство Agilex 5 вошли модели E-Series и D-Series. Первые оптимизированы для edge-устройств с небольшим энергопотреблением, а вторые предлагают более высокую производительность. Быстродействие INT8 достигает соответственно 26 и 56 TOPS. Решения E-Series могут работать с памятью DDR5-3600, DDR4-2667 и LPDDR4/5-3733. Реализована поддержка PCIe 4.0 x4 и шести интерфейсов 10/25GbE. В случае D-Series заявлена возможность использования памяти DDR5-4000, DDR4-3200, LPDDR4/4x/5-4267 и QDR-IV-2132. Обеспечена поддержка PCIe 4.0 x8 и 16 интерфейсов 25GbE.

Постоянный URL: http://servernews.ru/1103026