Материалы по тегу: supermicro
|
15.11.2025 [16:14], Владимир Мироненко
Broadcom упростила сертификацию оборудования для VCF для ускорения внедрения современных частных облаковBroadcom объявила о значительном обновлении VMware Cloud Foundation (VCF) 9.0 с целью предоставления компаниям более широкого выбора в области оборудования, сетевых решений и open source ПО с открытым исходным кодом. По словам компании, VCF представляет собой частную облачную платформу, открытую и адаптируемую ко всем уровням инфраструктуры. Изменения формируют открытую, гибкую экосистему, которая позволяет клиентам создавать, подключать, защищать и развивать современные частные облака в предпочитаемых ЦОД, периферийных локациях и хостинговых средах. VCF 9.0 теперь сочетает в себе эффективность облачной операционной модели с локальным управлением, расширяя совместимость с решениями разных провайдеров, возможности использования ИИ и преимущества в совокупной стоимости владения, отметил ресурс StorageReview.com. «Создавая открытую экосистему VCF, мы даём компаниям возможность создавать современные частные облака, соответствующие их стратегическим потребностям, гарантируя, что они смогут использовать технологии, необходимые для их уникальных сред», — заявил Пол Тернер (Paul Turner), директор по продуктам подразделения VMware Cloud Foundation компании Broadcom. Обновление включает расширение компанией программы открытой сертификации оборудования, чтобы расширить возможности OEM- и ODM-партнёров. В частности, программа VCF AI ReadyNodes (готовые к работе с VCF ИИ-узлы) призвана упростить процесс сертификации ИИ-узлов, позволяя заказчикам внедрять CPU, GPU и ускорители следующего поколения по мере их появления. VCF AI ReadyNodes будет использоваться для сертификации серверов, прошедших предварительную квалификацию для обучения ИИ-моделей и инференса. Сертифицированные согласно VCF AI ReadyNodes узлы представляют собой предварительно настроенное оборудование с ПО VMware с предсказуемой производительностью, простым управлением и гибкой виртуализацией со сквозным доступом к GPU, а также включают сетевые функции для минимизации задержки и масштабирования пропускной способности. Такие узлы снижают риски проблем при интеграции и сокращают время выхода продукта на рынок, предлагая предварительно проверенные ПАК для обучения и инференса. Они поддерживают плавное обновление через SDDC Manager, обеспечивая синхронизацию обновлений драйверов GPU, прошивок сетевых карт и VMware ESXi для поддержания стабильности в производственных ИИ-средах. Supermicro станет одним из первых OEM-партнёров, сертифицировавших свои серверы в рамках AI ReadyNode. Broadcom также расширила программу VCF ReadyNode, предоставив ODM-партнёрам возможность самостоятельно сертифицировать готовые узлы в рамках программы Broadcom Technology Alliance (TAP). Все сертифицированные системы будут проверены на полную совместимость с VMware Cloud Foundation с последовательным управлением жизненным циклом VCF. Это расширяет возможности поиска поставщиков и сокращает время выполнения заказов. Для узлов для периферийных вычислений компания предлагает вариант VCF Edge, ориентированный на надёжные и компактные серверы для промышленных, оборонных, розничных и др. нужд. Broadcom также сообщила о новой стратегии, направленной на унификацию сетевых инфраструктур и упрощение сетевых операций в современном частном облаке с помощью стандартизированных сетей с EVPN и BGP. Клиенты получат преимущества от защиты на уровне VPC, согласованных сетевых операций, маршрутизации и видимости во всех доменах VCF Networking (NSX) и сетевых решениях сторонних производителей, обеспечивающих унифицированные операции с помощью комплексной автоматизации. Этот подход согласует VCF со стратегией Cisco Nexus One Fabric, обеспечивая более согласованные и надёжные результаты работы для совместных клиентов Cisco и VMware. Cisco Nexus One Fabric расширяет возможности VCF, предоставляя современную, масштабируемую и автоматизированную сетевую архитектуру на основе VXLAN EVPN. VCF Networking (NSX) также теперь поддерживает популярную открытую NOS SONiC. SONiC обеспечивает клиентам снижение затрат за счёт использования стандартного коммутационного оборудования разных производителей, снижая как капитальные, так и эксплуатационные расходы. Кроме того, Broadcom продолжает участвовать в сообществе Kubernetes, являясь одним из пяти крупнейших участников CNCF (Cloud Native Computing Foundation) и работая над проектами Antrea, Cluster API, ContainerD, Contour, etcd, Harbor и т.д. Broadcom объявила, что VMware vSphere Kubernetes Service (VKS) был сертифицирован CNCF как платформа, соответствующая требованиям Kubernetes AI Conformant Platform. Как сообщает The Register, эта недавно запущенная программа соответствия призвана дать клиентам уверенность в том, что контейнерная платформа может надёжно выполнять реальные рабочие нагрузки ИИ. Программа определяет минимальный набор возможностей и конфигураций, необходимых для запуска широко распространенных фреймворков ИИ и машинного обучения в инфраструктуре Kubernetes.
06.11.2025 [12:18], Владимир Мироненко
Статус: всё сложно — шестой квартал подряд результаты Supermicro ниже прогнозов Уолл-стритSupermicro объявила неаудированные финансовые результаты за I квартал 2026 финансового года, закончившийся 30 сентября 2025 года. Как и сообщалось в предварительном отчёте, выручка компании составила $5,02 млрд, что на $0,9 млрд или 15 % меньше год к году и значительно меньше собственного прогноза от $6,0 до $7,0 млрд. Также выручка оказалась меньше консенсус-прогноза аналитиков, опрошенных LSEG, в размере $6,0 млрд (по данным CNBC). Согласно данным аналитиков Bloomberg, это шестой квартал подряд, когда результаты Supermicro не оправдывают ожиданий Уолл-стрит. Выручка почти на $1,5 млрд переместилась в следующий квартал из-за обновления в последнюю минуту конфигурации крупным заказчиком, пояснил генеральный директор Чарльз Лян (Charles Liang) в ходе телефонной конференции с аналитиками после публикации финансовой отчётности, пишет Reuters. «Эти изменения в основном вызваны сложностью новых стоек с GPU, которые требуют сложной интеграции, тестирования и проверки, что увеличивает время их закупки и сборки», — отметил Лян. Скорректированная прибыль (Non-GAAP) на акцию тоже ниже прогноза от LSEG — $0,35 против $0,40, хотя и на $0,07 больше, чем в I квартале 2025 финансового года. Чистая прибыль (GAAP) упала более чем вдвое до $168,29 млн или $0,26 на разводнённую акцию, с $424,33 млн или $0,67 на разводнённую акцию годом ранее. Валовая рентабельность (Non-GAAP) составила 9,5 %, что на 10 п.п. меньше, чем в предыдущем квартале и на 360 п.п. меньше показателя годом ранее в размере 13,1 %, а также, как отметили инвесторы, значительно ниже, чем у конкурентов, занимающихся продажей оборудования, таких как Dell и HPE, пишет The Register. Лян объяснил низкую маржу необходимостью «разработки новой сверхмасштабной оптимизированной стоечной платформы» на базе NVIDIA GB300. «Нам нужно было убедиться, что мы поставляем заказчику именно самую качественную и надёжную систему. Именно поэтому мы тратим так много времени на запуск нашего решения», — сказал он. Финансовый директор Supermicro Дэвид Вейганд (David Weigand) заявил, что иногда крупные проекты продвигаются не по плану из-за своей сложности. К тому же у клиентов, выполняющих множество логистических задач, чтобы подготовить свои ЦОД, сроки не всегда идеально совпадает со сроками окончания кварталов. «Поэтому мы и говорим, что по мере того, как мы продолжаем работать с крупными клиентами, будут возникать ситуации, которые мы не можем контролировать», — сообщил Вейганд, отметив, что компания добилась больших успехов, увеличив за последние два года выручку с $7 до $22 млрд. В презентации компании отмечено, что платформы на базе ИИ-ускорителей теперь обеспечивают более 75 % выручки компании, что подчеркивает стратегический поворот Supermicro в сторону высокопроизводительной вычислительной инфраструктуры. Supermicro указала, что ключевым стратегическим направлением остаётся расширение использования технологий жидкостного охлаждения, особенно для высокоплотных сред ИИ-вычислений. Компания планирует достичь производственной мощности в 6000 стоек в месяц к концу 2026 финансового года, включая 3000 стоек с прямым жидкостным охлаждением (DLC). Supermicro уже поставляет стойки мощностью 150 кВт, а решения мощностью 250 кВт и 500 кВт находятся в разработке, что позволяет ей удовлетворять растущие требования клиентов к плотности мощности передовых ИИ-систем, пишет investing.com. Во II квартале 2026 финансового года компания прогнозирует выручку в размере $10,0–11,0 млрд, что выше консенсус-прогноза аналитиков в $7,83 млрд, согласно LSEG. Согласно прогнозу компании, скорректированная прибыль на разводнённую акцию составит от $0,46 до $0,54. Кроме того, Supermicro повысила свой прогноз выручки на весь 2026 финансовый год до $36 млрд с предыдущего прогноза в $33 млрд. Инвесторы негативно отреагировали на невыполнение компанией своих обязательств по прибыли, несмотря на повышение годового прогноза. Падение акций на 6,4 % в ходе торгов, а затем ещё на 4,12 % после их закрытия, отражает опасения по поводу способности компании оправдать краткосрочные ожидания, отметил investing.com. Ресурс также указал на значительный разрыв между результатами I квартала и прогнозом II квартала, что говорит о потенциальных проблемах с исполнением или несвоевременными решениями при крупных развёртываниях решений для клиентов.
27.10.2025 [13:26], Владимир Мироненко
Миллиард туда, миллиард сюда: Supermicro снизила прогноз по выручке, но не видит оснований для беспокойстваSupermicro опубликовала предварительный отчёт в преддверии оглашения результатов за I квартал 2026 финансового года, завершившийся 30 сентября, которые будут обнародованы 4 ноября. Ожидаемая выручка компании в минувшем квартале составит $5 млрд при собственном прогнозе от $6,0 до $7,0 млрд. Снижение выручки объясняется тем, что из-за изменений в конструкции поставляемого оборудования завершение работ переносится на следующий квартал, то есть для беспокойства нет никакого повода. Однако инвесторы не приветствуют подобные «сюрпризы», и стоимость акций Supermicro упала, пишет The Register. Акционеры компании уже сталкивались с подобными новостями, когда Supermicro сообщила в апреле предварительные финансовые результаты за III квартал 2025 финансового года, закончившийся 31 марта — выручка оказалась ниже прогноза более чем на $1 млрд. Компания объявила об этом после задержки с предоставлением годового отчёта за 2024 год, поскольку у руководства не было уверенности в корректности внутренней отчётности. Нанятый аудитор Ernst & Young отказался от дальнейшего сотрудничества, что поставило Supermicro под угрозу делистинга на фондовой бирже NASDAQ, хотя в итоге проблемы были решены. Согласно отчёту, «недавние проекты получили более $12 млрд, поставка которых запланирована на II квартал 2026 финансового года». Также указано, что наблюдается устойчивый спрос на системы Supermicro на базе NVIDIA GB300, B300, RTX Pro, AMD 355X LC, поставки которых уже начались. The Register оценил позитивно обе новости, поскольку речь идёт новом оборудовании для ИИ-вычислений, которое в настоящее время пользуется высоким спросом, и $12 млрд представляет собой крупную сумму, которая составляет более трети от $33 млрд выручки, прогнозируемой Supermicro на весь 2026 финансовый год. Перенос реализации проекта на II квартал из-за модернизации вызывает интерес, поскольку нет информации о характере манипуляций, вызвавших задержку. The Register полагает, что задержка вызвана необходимостью закупки деталей, не включенных в первоначальную сделку (возможно, других ускорителей или большего объёма памяти, компонентов, которых не хватает), а это означает, что Supermicro не сможет выполнить поставку согласно указанной в контракте конфигурации.
26.10.2025 [14:20], Сергей Карасёв
d-Matrix представила систему SquadRack для ИИ-инференса со сверхнизкой задержкойКомпания d-Matrix анонсировала систему SquadRack — стоечное решение для пакетного инференса со сверхнизкой задержкой. Это, как утверждается, первый в отрасли продукт данного класса. В его разработке приняли участие специалисты Arista, Broadcom и Supermicro. В основу SquadRack положена серверная платформа Supermicro X14 AI. Судя по изображениям, используется модель SYS-522GA-NRT, которая допускает установку двух процессоров Intel Xeon 6900 (Granite Rapids) и 24 модулей оперативной памяти DDR5-8800. Доступны 24 фронтальных отсека для SFF-накопителей U.2/U.3 (NVMe). Устройство выполнено в форм-факторе 5U. Система SquadRack предусматривает использование ускорителей d-Matrix Corsair. Их архитектура основана на модифицированных ячейках SRAM для вычислений в памяти (DIMC), работающих на скорости около 150 Тбайт/с. По заявлениям d-Matrix, решение обеспечивает непревзойдённую производительность ИИ-инференса: быстродействие достигает 2,4 Пфлопс (8-бит вычисления). Кроме того, задействованы IO-карты d-Matrix JetStream, предназначенные для распределения нагрузок инференса. Одна такая карта может обслуживать до четырёх экземпляров Corsair, обеспечивая сетевую задержку на уровне 2 мкс. Решение SquadRack также оборудовано PCIe-коммутаторами Broadcom для масштабирования в пределах одного узла. В свою очередь, связь между узлами обеспечивают коммутаторы Arista Leaf Ethernet, подключённые к картам JetStream. Применяется программный стек d-Matrix Aviator. В одну стойку могут быть установлены до восьми экземпляров SquadRack, что позволяет с высокой скоростью обрабатывать модели ИИ, насчитывающие до 100 млрд параметров. В целом, возможно масштабирование до сотен узлов в нескольких серверных стойках.
25.10.2025 [22:49], Сергей Карасёв
Микрооблако с микро-EPYC: Supermicro представила 20-узловой сервер на базе процессоров AMD GradoКомпания Supermicro анонсировала сервер 6U20N MicroBlade (MBA-315R-1G x20), построенный на аппаратной платформе AMD. Система может применяться для решения таких задач, как облачные вычисления, ИИ-инференс, веб-хостинг, потоковая передача видео и пр.
Источник изображений: Supermicro Устройство, выполненное в форм-факторе 6U, имеет 20-узловую конфигурацию. Каждый узел может нести на борту один процессор EPYC 4005 Grado с 16 вычислительными ядрами (32 потока) и показателем TDP до 170 Вт. Применяется воздушное охлаждение. Доступны четыре слота для модулей оперативной памяти DDR5-5600 суммарным объёмом до 192 Гбайт. Каждый узел оснащён двумя сетевыми интерфейсами 25GbE на базе Mellanox ConnectX-4, контроллером Aspeed AST2500 BMC и двумя коннекторами M.2 для SSD (NVMe). Опционально могут устанавливаться два накопителя U.2 (NVMe). Кроме того, возможен монтаж GPU-ускорителя формата FHHL с интерфейсом PCIe 5.0. Сервер 6U20N MicroBlade может нести на борту два Ethernet-коммутатора и два модуля управления. Питание обеспечивают восемь блоков мощностью 2200/3000 Вт с сертификатом 80 Plus Titanium. Диапазон рабочих температур простирается от +10 до +35 °C. В одну серверную стойку стандарта 48U могут быть установлены до восьми таких систем, что в сумме даст 160 вычислительных узлов. В целом, как отмечается, серверы MicroBlade на процессорах EPYC 4005 построены на основе уникальной модульной архитектуры Supermicro, которая обеспечивает сокращение количества кабелей до 95 %, экономию пространства до 70 % и снижение энергопотребления на 30 % по сравнению с традиционными серверами типоразмера 1U.
12.08.2025 [16:32], Сергей Карасёв
Supermicro представила 4U-сервер на базе NVIDIA HGX B200 с СЖОКомпания Supermicro анонсировала GPU-сервер SYS-422GS-NBRT-LCC для ресурсоёмких нагрузок, включая задачи ИИ, построенный на аппаратной платформе Intel Granite Rapids. Устройство оборудовано системой прямого жидкостного охлаждения DLC-2. Новинка выполнена в форм-факторе 4U. Допускается установка двух процессоров Xeon 6700P с TDP до 350 Вт. Доступны 32 слота для модулей оперативной памяти: максимальный объём ОЗУ составляет 4 Тбайт в случае DDR5-6400 ECC и 8 Тбайт при использовании DDR5-5200 ECC. Сервер располагает восемью слотами PCIe 5.0 x16 для низкопрофильных карт расширения и двумя разъёмами PCIe 5.0 x16 для карт полной высоты и половинной длины (FHHL). Сервер оснащён ИИ-ускорителями NVIDIA HGX B200 поколения Blackwell в конфигурации 8 × SXM. Предусмотрены восемь фронтальных отсеков для накопителей E1.S с поддержкой горячей замены, а также два отсека для M.2 NVMe SSD. Имеются два сетевых порта 10GbE (RJ45) на основе контроллера Intel X710-AT2. Система может быть укомплектована восемью однопортовыми адаптерами NVIDIA ConnectX-7 NIC или NVIDIA BlueField-3 SuperNIC, а также двумя двухпортовыми DPU NVIDIA BlueField-3. Реализованы интерфейсы Mini-DP и D-Sub. Питание обеспечивают четыре блока мощностью 6600 Вт с сертификатом 80 PLUS Titanium. Диапазон рабочих температур — от +10 до +35 °C. Помимо системы DLC-2, установлены шесть вентиляторов диаметром 80 мм. Габариты сервера составляют 174 × 448 × 991,4 мм, масса — 107 кг.
Источник изображения: Supermicro
07.08.2025 [13:47], Владимир Мироненко
Клиенты стали разборчивее: слабый прогноз обрушил акции Supermicro на 18 %Supermicro объявила неаудированные финансовые результаты за IV квартал и весь 2025 финансовый год, закончившийся 30 июня 2025 года. Её акции упали в цене на 18 % после того, как компания опубликовала более слабые, чем ожидалось, финансовые результаты за квартал, отчасти обусловленные повышением пошлин президентом США Дональдом Трампом (Donald Trump), пишет CNBC. «Мы приняли меры для смягчения воздействия, и мы увидим результаты», — заявил генеральный директор Чарльз Лян (Charles Liang) инвесторам. В свою очередь финансовый директор Дэвид Вайганд (David Weigand) отметил, что в ситуации с пошлинами развивается динамично и Supermicro остаётся «лишь наблюдать и реагировать, как и любой другой компании». Выручка Supermicro за IV финансовый квартал составила $5,76 млрд, что на 8 % больше год к году и на 25 % больше по сравнению с предыдущим кварталом, но ниже прогноза Уолл-стрит в размере $5,89 млрд. Тем не менее, аналитики ресурса investing.com отметили значительное ускорение по сравнению с III финансовым кварталом, когда компания сообщила о падении выручки на 19 % по сравнению с предыдущим кварталом. Выручка сегмента серверов и СХД, представляющего основной бизнес компании, составила $5,62 млрд (+26 % в квартальном исчислении и +10 % в годовом исчислении), в то время как выручка сегмента подсистем и аксессуаров составила $139 млн (−1 % в квартальном исчислении и −48 % в годовом исчислении). Это изменение отражает стратегический переход Supermicro к более ценным комплексным системным решениям, отметил investing.com. Supermicro активно расширяет присутствие на рынке серверных решений, оптимизированных для ИИ-нагрузок. Компания определила свою текущую производственную мощность в 5000 стоек в месяц, включая 2000 стоек с прямым жидкостным охлаждением (DLC), с поддержкой до 150 кВт на стойку. Скорректированная прибыль (Non-GAAP) на разводнённую акцию составила 41 цент, что ниже ожидаемых Уолл-стрит 44 центов, а также результата за квартал годом ранее в размере 54 цента. Чистая прибыль на акцию (GAAP) составила 31 цент по сравнению с прогнозом в 34 цента. Чистая прибыль за квартал равняется $195,2 млн, что больше, чем в III финансовом квартале в размере $109 млн, но меньше результата годом ранее, равного $297,2 млн. Инвесторы также были разочарованы тем, что Supermicro не смогла достичь целевых показателей по скорректированной валовой марже (Non-GAAP) — 9,6 против 10 %, на которые рассчитывали аналитики, отметил ресурс SiliconANGLE. Выручка за 2025 финансовый год составила $22,0 млрд по сравнению с $15,0 млрд за 2024 финансовый год, закончившийся 30 июня 2024 года. Чистая прибыль за 2025 финансовый год составила $1,05 млрд или $1,68 на разводнённую акцию, по сравнению с $1,15 млрд или $1,92 на разводнённую акцию за предыдущий финансовый год. Лян сообщил, что Supermicro не хватает оборотного капитала для наращивания производства необходимыми темпами. Поэтому компания пошла на необычный шаг, выпустив конвертируемые облигации на сумму $2 млрд после выпуска в феврале таких же облигаций на сумму $700 млн. Прогноз Supermicro на I квартал 2026 финансового года, завершающийся 30 сентября, составляет по выручке от $6,0 до $7,0 млрд, по скорректированной прибыли (Non-GAAP) на разводнённую акцию — от $0,40 до $0,52. Уолл-стрит прогнозирует скорректированную прибыль на акцию в размере $0,59 при выручке в $6,6 млрд. Supermicro сообщила, что за весь 2026 финансовый год ожидает выручку не менее $33 млрд. Это ниже её февральского прогноза в размере $40 млрд, но выше консенсус-прогноза аналитиков, опрошенных LSEG, в $29,94 млрд. Хольгер Мюллер (Holger Mueller) из Constellation Research сообщил ресурсу SiliconANGLE, что Supermicro не оправдала собственный прогноз в предыдущем квартале, поэтому к её прогнозу роста выручки на 50 % на новый финансовый год следует относиться с осторожностью. Аналитик D.A. Davison & Co. Джил Лурия (Gil Luria) заявил, что проблемы с прибыльностью компании в ближайшее время не прекратятся. «Поскольку мы знаем, что рынок ИИ-серверов сейчас очень силён, можно с уверенностью предположить, что разочаровывающие результаты Supermicro связаны с потерей доли рынка», — сообщил он агентству Reuters, добавив, что «клиенты очень разборчивы и выбирают серверы от Dell, HPE и других компаний». Аналитик Bank of America Руплу Бхаттачарья (Ruplu Bhattacharya) заявил ресурсу Barron’s, что Supermicro способна восстановить потерянную долю рынка, но для этого ей придётся снизить маржу. Он предупредил, что у компании всё ещё имеются недостатки в системе контроля бухгалтерского учёта, а также указал на то, что значительная часть бизнеса Supermicro связана с двумя компаниями, принадлежащими брату Ляна, намекая на возможные «незаконные» сделки. Тем не менее Supermicro является одним из лидеров ИТ-рынка и её акции выросли на 88 % с начала года. Для сравнения, фондовый индекс S&P 500 вырос всего на 7 %.
25.07.2025 [09:23], Владимир Мироненко
Импортозамещение по-южнокорейски: LG AI Research выбрала ускорители FuriosaAI RNGD для своих ИИ-серверовКомпания LG AI Research (ИИ-подразделение LG Group) из Южной Кореи заключила соглашение с южнокорейским стартапом FuriosaAI о выпуске серверов с ИИ-ускорителями RNGD для работы с собственным семейством LLM Exaone, сообщил The Register. Как сообщил генеральный директор FuriosaAI Джун Пайк (June Paik) изданию EE Times, серверы LG с чипами RNGD будут ориентированы на предприятия, использующие модели ExaOne в сфере электроники, финансов, телекоммуникаций и биотехнологий. Серверы поступят в продажу в конце этого года. «После тщательного тестирования широкого спектра опций мы пришли к выводу, что RNGD — высокоэффективное решение для развёртывания моделей Exaone», — заявил Киджонг Чон (Kijeong Jeon), руководитель подразделения продуктов LG AI Research. «RNGD обеспечивает убедительное сочетание преимуществ: превосходную производительность в реальных условиях, значительное снижение совокупной стоимости владения и удивительно простую интеграцию», — добавил он. Подобно системам на базе NVIDIA RTX Pro Blackwell, серверы LG RNGD будут включить до восьми ускорителей с интерфейсом PCIe 5.0. Эти системы будут работать на базе того, что FuriosaAI описывает как высокоразвитый программный стек, включающий библиотеку vLLM. LG также предложит собственную платформу агентского ИИ ChatExaone, которая адаптирована для корпоративных сценариев использования. Она объединяет ряд фреймворков для анализа документов, глубоких исследований, анализа данных и RAG. LG AI Research протестировала работу модели ExaOne-32B на восьмичиповом 4U-сервере c воздушным охлаждением, который был разработан совместно с Supermicro. В 15-кВт стойке можно разместить пять таких серверов. По словам Пайка, LG AI Research протестировала оборудование от нескольких поставщиков оборудования из Южной Кореи и других стран, взяв за основу ускорители NVIDIA A100. «LG AI Research также тестировала облачные решения, но, по их словам, наше решение на данный момент оказалось единственным, отвечающим их требованиям», — сказал Пайк. Как полагает The Register, выбор для сравнения ускорителя NVIDIA A100, дебютировавшего в 2020 году, а не более свежих моделей, вызван тем, что LG AI Research больше интересует энергоэффективность оборудования, чем производительность. И, как отметил Джун Пайк, хотя за пять лет с момента появления A100 ускорители NVIDIA, безусловно, стали мощнее, но произошло это за счёт увеличения энергопотребления и площади кристалла. Сообщается, что LG AI фактически использовала четыре PCIe-ускорителя RNGD, задействовав тензорный параллелизм для запуска модели Exaone 32B с 16-бит точностью. По словам Пайка, у LG были очень чёткие целевые показатели производительности, которые она стремилась достичь при валидации чипа. В частности, ограничения включали время до отдачи первого токена (TTFT) — примерно 0,3 с для небольших запросов на 3 тыс. токенов или 4,5 с для более крупных запросов на 30 тыс. токенов. Результат в 60 токенов/с достигается для контекстного окна размером 4 тыс. токенов или 50 токенов/с для контекстного окна размером 32 тыс. токенов. По словам Пайка, тесты проводились в режиме BF16, поскольку сравниваемые A100 не имеет встроенной поддержки FP8, так что использование RNGD в FP8-режиме позволит удвоить эффективность инференса и снизить TTFT. Кроме того, сервер продемонстрировал в 2,25 раза более высокую производительность инференса LLM на Ватт по сравнению с A100, а полная стойка сможет генерировать в 3,75 раза больше токенов, чем стойка с A100 при том же энергопотреблении. Чип FuriosaAI RNGD обеспечивает производительность 512 Тфлопс (FP8) при TDP 180 Вт. В отличие от ускорителей NVIDIA, оснащённых высокоскоростным интерконнектом NVLink (600 Гбайт/с), FuriosaAI использует интерфейс PCIe 5.0 (128 Гбайт/с). По словам FuriosaAI, чтобы избежать узких мест и накладных расходов, связанных с интерконнектом, компилятор компании помогает оптимизировать процесс обмена данными и собственно вычисления.
26.05.2025 [11:21], Сергей Карасёв
Supermicro представила сервер SYS-822GS-NB3RT на базе NVIDIA HGX B300Компания Supermicro представила модель SYS-822GS-NB3RT на аппаратной платформе NVIDIA HGX B300 (Blackwell Ultra) для ресурсоёмких ИИ-нагрузок. Устройство выполнено в форм-факторе 8U и . Допускается установка двух процессоров Intel Xeon 6500P или 6700P поколения Granite Rapids с высокопроизводительными Р-ядрами. Доступны 32 слота для модулей оперативной памяти DDR5 с поддержкой MRDIMM-8000. Система имеет архитектуру 8-GPU. Во фронтальной части располагаются отсеки для восьми накопителей E1.S (NVMe) с возможностью горячей замены. Кроме того, есть два внутренних слота М.2 для NVMe SSD. Сервер оснащён двумя разъёмами PCIe 5.0 х16 FHHL для DPU NVIDIA BlueField-3. Упомянуты сетевые адаптеры NVIDIA ConnectX-8 SuperNIC. Supermicro позиционирует модель SYS-822GS-NB3RT в качестве передового «строительного блока» для формирования масштабных ИИ-кластеров с воздушным охлаждением. Компания Supermicro также сообщила о том, что в её ассортименте для заказа доступны более 20 систем, поддерживающих установку ускорителей NVIDIA RTX PRO 6000 Blackwell Server Edition с 96 Гбайт памяти GDDR7. Это, в частности, многоузловые серверы SuperBlade, компактные edge-решения, серверы типоразмера 5U с поддержкой до восьми GPU-карт, системы на модульной архитектуре NVIDIA MGX для ИИ-приложений и задач НРС, а также мощные рабочие станции.
24.05.2025 [22:18], Сергей Карасёв
Supermicro представила сервер-микрооблако на базе AMD EPYC GradoКомпания Supermicro представила сервер MicroCloud A+ Server AS-3015MR-H5TNR типоразмера 3U. Эта пятиузловая система (3U5N) ориентирована на организацию облачных вычислений и CDN, поддержание работы потоковых видеосервисов, веб-приложений и пр. Каждый узел рассчитан на установку одного процессора AMD EPYC 4005 Grado в исполнении Socket AM5 (LGA1718) с показателем TDP до 175 Вт (воздушное охлаждение). Кроме того, могут применяться чипы EPYC 4004 и Ryzen 7000/9000, насчитывающие до 16 вычислительных ядер с поддержкой многопоточности. Доступны четыре слота для модулей DDR5-5600 суммарным объёмом до 192 Гбайт. Каждый узел располагает одним слотом PCIe 5.0 x16 FHFL и одним разъёмом PCIe 5.0 x4 Micro-LP или двумя слотами PCIe 5.0 x8 LP. Возможна установка ускорителя NVIDIA L40(S), L4, A16, A2 и A10 или AMD Instinct MI210. Предусмотрены по два посадочных места для накопителей SFF NVMe (PCIe 5.0) и SFF SATA-3. Кроме того, имеется коннектор M.2 M-key для SSD типоразмера 2280/22110 (NVMe). Доступны два порта USB 2.0. Вся система AS-3015MR-H5TNR в целом оборудована четырьмя блоками питания с резервированием мощностью 2000 Вт с сертификатом 80+ Titanium. Задействованы пять вентиляторов охлаждения диаметром 80 мм. Габариты составляют 449 × 775 × 131 мм, масса — 48,76 кг. Диапазон рабочих температур простирается от +10 до +35 °C. Упомянут встроенный модуль TPM 2.0 для обеспечения безопасности. |
|

