Материалы по тегу: сжо

18.10.2024 [00:10], Алексей Степин

Meta✴ представила свой вариант суперускорителя NVIDIA GB200 NVL72

Meta поделилась своими новинками в области аппаратной инфраструктуры и рассказала, каким именно видит будущее открытых ИИ-платформ. В своей презентации Meta рассказала о новой ИИ-платформе, новых дизайнах стоек, включая варианты с повышенной мощностью питания, а также о новинках в области сетевой инфраструктуры.

 Источник изображений: ***

Источник изображений: Meta

В настоящее время компания использует нейросеть Llama 3.1 405B. Контекстное окно у этой LLM достигает 128 тыс. токенов, всего же токенов свыше 15 трлн. Чтобы обучать такие модели, требуются очень серьёзные ресурсы и глубокая оптимизация всего программно-аппаратного стека. В обучении базовой модели Llama 3.1 405B участвовал кластер 16 тыс. ускорителей NVIDIA H100, один из первых такого масштаба. Но уже сейчас для обучения ИИ-моделей Meta использует два кластера, каждый с 24 тыс. ускорителей.

Проекты такого масштаба зависят не только от ускорителей. На передний план выходят проблемы питания, охлаждения и, главное, интерконнекта. В течение нескольких следующих лет Meta ожидает скоростей в районе 1 Тбайт/с на каждый ускоритель. Всё это потребует новой, ещё более плотной архитектуры, которая, как считает Meta, должна базироваться на открытых аппаратных стандартах.

Одной из новинок стала платформа Catalina. Это Orv3-стойка, сердцем которой являются гибридные процессоры NVIDIA GB200. Стойка относится к классу HPR (High Power Rack) и рассчитана на 140 КВт. Сейчас Microsoft и Meta ведут работы над модульной и масштабируемой системой питания Mount Diablo. Свой вариант GB200 NVL72 у Microsoft тоже есть. Также Meta обновила ИИ-серверы Grand Teton, впервые представленные в 2022 году. Это по-прежнему монолитные системы, но теперь они поддерживают не только ускорители NVIDIA, но и AMD Instinct MI300X и будущие MI325X.

Интерконнектом будущих платформ станет сеть DSF (Disaggregated Scheduled Fabric). Благодаря переходу на открытые стандарты компания планирует избежать ограничений, связанных с масштабированием, зависимостью от вендоров аппаратных компонентов и плотностью подсистем питания. В основе DSF лежит стандарт OCP-SAI и ОС Meta FBOSS для коммутаторов. Аппаратная часть базируется на стандартном интерфейсе Ethernet/RoCE.

Meta уже разработала и воплотила в металл новые коммутаторы класса 51Т на базе кремния Broadcom и Cisco, а также сетевые адаптеры FBNIC, созданные при поддержке Marvell. FBNIC может иметь до четырёх 100GbE-портов. Используется интерфейс PCIe 5.0, причём могущий работать как четыре отдельных слайса. Новинка соответствует открытому стандарту OCP NIC 3.0 v1.2.0.

Постоянный URL: http://servernews.ru/1112624
17.10.2024 [12:20], Сергей Карасёв

Dell представила решения AI Factory на базе NVIDIA GB200 и AMD EPYC Turin

Компания Dell Technologies анонсировала интегрированные стоечные масштабируемые системы для экосистемы AI Factory, рассчитанные на задачи НРС и ресурсоёмкие приложения ИИ. В частности, дебютировали решения Integrated Rack 7000 (IR7000), PowerEdge M7725 и PowerEdge XE9712.

 Источник изображений: Dell

Источник изображений: Dell

IR7000 — это высокоплотная 21″ стойка Open Rack Version 3 (Orv3) с поддержкой жидкостного охлаждения. Говорится о совместимости с мощными CPU и GPU с высоким значением TDP. Модификации 44OU и 50OU оснащены салазками, которые шире и выше традиционных: это гарантирует совместимость с несколькими поколениями архитектур процессоров и ИИ-ускорителей. Полки питания в настоящее время поддерживают мощность от 33 кВт до 264 кВт на стойку с последующим увеличением до 480 кВт.

Система Dell PowerEdge M7725 специально спроектирована для вычислений высокой плотности. В основу положены процессоры AMD серии EPYC 9005 (Turin), насчитывающие до 192 вычислительных ядер. Одна стойка IR7000 может вместить 72 серверных узла M7725, каждый из которых оборудован двумя CPU. Таким образом, общее количество вычислительных ядер превышает 27 тыс. на стойку. Возможно развёртывание прямого жидкостного охлаждения (DLC) и воздушного охлаждения. Доступны два IO-слота (PCIe 5.0 x16) в расчёте на узел с поддержкой Ethernet и InfiniBand.

В свою очередь, система Dell PowerEdge XE9712 разработана для обучения больших языковых моделей (LLM) и инференса в реальном времени. Эта новинка использует архитектуру суперускорителя NVIDIA GB200 NVL72. В общей сложности задействованы 72 чипа B200 и 36 процессоров Grace. Утверждается, что такая конфигурация обеспечивает скорость инференса до 30 раз выше по сравнению с системами предыдущего поколения.

Постоянный URL: http://servernews.ru/1112591
17.10.2024 [11:46], Сергей Карасёв

Lenovo представила сервер ThinkSystem SC777 V4 Neptune на базе NVIDIA GB200 с СЖО

Компания Lenovo анонсировала сервер ThinkSystem SC777 V4 Neptune, спроектированный специально для НРС-нагрузок и задач ИИ. Новинка 100 % прямым жидкостным охлаждением, что, как утверждается, обеспечивает максимальную производительность и энергоэффективность без ущерба для удобства обслуживания.

По сравнению с аналогичной системой с воздушным охлаждением сервер ThinkSystem SC777 V4 Neptune обеспечивает увеличение общей производительности до 10 % благодаря постоянной работе в турбо-режиме; сокращение энергопотребления дата-центра до 40 %; снижение уровня шума от вентиляторов до 100 %.

Базовая система ThinkSystem SC777 V4 Neptune, заключённая в 21″ корпус с возможностью вертикального монтажа, несёт на борту два ускорителя NVIDIA GB200, что в сумме даёт четыре чипа B200 и два процессора Grace. Возможна установка до шести адаптеров NVIDIA NDR или трёх адаптеров XDR LP InfiniBand.

 Источник изображений: Lenovo

Источник изображений: Lenovo

Архитектура сервера допускает использование до десяти накопителей E3.S NVMe в расчёте на лоток. Говорится о поддержке массивов RAID на уровне ОС. В оснащение входят два сетевых порта 25GbE SFP28 LOM. На фронтальную панель выведены интерфейс USB Type-C / DisplayPort, диагностический порт, два разъёма USB 3.0, интерфейс D-Sub, гнездо RJ-45 и пр.

Восемь лотков ThinkSystem SC777 V4 Neptune могут быть размещены в шасси ThinkSystem N1380 Neptune типоразмера 13U, а три таких блока могут быть установлены в 19″ серверную стойку. Названное шасси допускает использование до четырёх узлов ThinkSystem Titanium Power Conversion Stations (PCS) мощностью 15 кВт каждый.

Постоянный URL: http://servernews.ru/1112587
14.10.2024 [14:00], Сергей Карасёв

HPE представила архитектуру прямого жидкостного охлаждения без вентиляторов

Компания HPE анонсировала, как утверждается, первую в отрасли архитектуру прямого жидкостного охлаждения (DLC), в составе которой вообще не используются вентиляторы. Решение ориентировано на дата-центры для ресурсоёмких нагрузок ИИ и НРС.

Отмечается, что эффективность ИИ-ускорителей следующего поколения повышается, но их энергопотребление продолжает расти. Поэтому ЦОД, рассчитанные на масштабные рабочие нагрузки ИИ, внедряют новые системы охлаждения. Наиболее эффективной технологией, как заявляет HPE, на сегодняшний день является DLC.

Представленное решение включает жидкостное охлаждение для CPU и GPU, blade-сервера целиком, локального хранилища, сетевой фабрики, стойки, модуля/кластера и блок распределения охлаждающей жидкости (CDU). Применяется высокоплотная конструкция с интегрированной сетевой фабрикой, дополненная специальным ПО для мониторинга. При этом обеспечивается гибкость выбора ИИ-ускорителей. «Новая архитектура прямого жидкостного охлаждения обеспечивает снижение энергопотребления на 90 % по сравнению с традиционными системами воздушного охлаждения», — говорит Антонио Нери (Antonio Neri), президент и генеральный директор HPE.

 Источник изображения: HPE

Источник изображения: HPE

Полностью безвентиляторная архитектура DLC обеспечивает ряд преимуществ по сравнению с другими решениями. В частности, затраты на охлаждение «лезвия» сокращаются на 37 % по сравнению с гибридным прямым жидкостным охлаждением. Это позволяет снизить расходы на коммунальные услуги, а также уменьшить выбросы вредных газов в атмосферу. Кроме того, достигается высокая плотность монтажа оборудования, благодаря чему занимаемые площади в ЦОД могут быть уменьшены в два раза.

Отметим, что российская Группа компаний РСК давно предлагает узлы (в том числе с ускорителями), СХД, коммутаторы и стойки с полностью жидкостным охлаждением.

Постоянный URL: http://servernews.ru/1112410
06.10.2024 [13:01], Сергей Карасёв

Fujitsu и Supermicro займутся разработкой Arm-серверов и СЖО для дата-центров

Компании Fujitsu и Supermicro объявили о стратегическом сотрудничестве, направленном на разработку серверов следующего поколения для широкого спектра рабочих нагрузок — от ИИ и НРС до облачных и периферийных задач. Кроме того, партнёры займутся разработкой СЖО для дата-центров. Речь, в частности, идёт о создании серверов на Arm-процессорах Fujitsu MONAKA.

MONAKA будут изготавливаться по 2-нм технологии TSMC. Они получат до 144 ядер, а также 12 каналов оперативной памяти DDR5, интерфейсы PCIe 6.0 с CXL 3.0. Говорится об использовании архитектуры Armv9-A с поддержкой векторных расширений SVE2. Изделия проектируются с прицелом на двухсокетные системы. Упомянуты возможность применения воздушного охлаждения и высокая энергетическая эффективность.

Выпуск чипов запланирован на 2027 год. На тот момент, как утверждает Fujitsu, эти решения будут демонстрировать двукратное превосходство по показателю производительности на Ватт над конкурирующими серверными процессорами. Разработка MONAKA является частью проекта, курируемого Японской Организацией по развитию новых энергетических и промышленных технологий (NEDO).

 Источник изображений: Fujitsu

Источник изображений: Fujitsu

В рамках партнёрства Fujitsu и Supermicro объединят свои технические возможности и опыт для создания серверов, оптимизированных для различных нагрузок. Отмечается, в частности, что подход Supermicro Building Block к проектированию платформ позволяет быстро создавать и сертифицировать широкий спектр систем для ИИ, HPC и вычислений общего назначения в облачных средах и на периферии. Клиенты смогут выбирать системные компоненты, оптимизированные для их рабочих нагрузок и приложений. Помимо этого, компании сосредоточатся на экологически чистых IT-решениях в области СЖО стоечного масштаба.

Сотрудничество также распространится на Fsas Technologies — дочернюю структуру Fujitsu. Эта компания будет поставлять в глобальном масштабе решения для генеративного ИИ на базе платформы, объединяющей серверы Supermicro с GPU-ускорителями и услуги развёртывания для операторов ЦОД и предприятий.

Постоянный URL: http://servernews.ru/1112059
06.10.2024 [12:41], Сергей Карасёв

Разработчик систем погружного охлаждения Submer получил на развитие $55,5 млн

Компания Submer, специализирующаяся на системах иммерсионного охлаждения для дата-центров, объявила о проведении раунда финансирования Series C, в ходе которого на развитие привлечено $55,5 млн. Программу возглавила инвестиционная фирма M&G, под управлением которой находятся активы в размере £346,1 млрд (около $454,1 млрд).

Submer была основана в 2015 году. Её штаб-квартира находится в Барселоне (Испания), тогда как производственная площадка Gigafactory располагается в Хьюстоне (Техас, США). Компания занимается разработкой систем погружного охлаждения для высоконагруженных ЦОД. При этом применяется нетоксичная охлаждающая жидкость SmartCoolant: она обеспечивает высокую эффективность в широком диапазоне температур, безопасность и стабильность состава. Кроме того, компания сотрудничает с другими производителями жидкостей.

 Источник изображения: Submer

Источник изображения: Submer

Согласно отчету Международного энергетического агентства (IEA), в 2022 году дата-центры по всему миру потребили 460 ТВт·ч энергии, что составляет почти 2 % от глобальных затрат. По прогнозам, к 2026 году этот показатель удвоится. Вместе с тем, как утверждает Submer, воздушное охлаждение и традиционные методы жидкостного охлаждения становятся все менее эффективными. Связано это с постоянно растущими вычислительными нагрузками в условиях стремительного развития ИИ. Решением проблемы, по заявлениям Submer, является погружное охлаждение.

В новом раунде финансирования, помимо M&G, приняли участие существующие инвесторы Planet First Partners и Norrsken VC, а также Mundi Ventures. Полученные деньги будут направлены на расширение бизнес-возможностей и привлечение новых клиентов в рамках глобальной экспансии. Submer намерена уделять приоритетное внимание освоению рынков США и Азиатско-Тихоокеанского региона.

Постоянный URL: http://servernews.ru/1112060
03.10.2024 [18:59], Руслан Авдеев

Perstorp представила биоразлагаемую жидкость Synmerse DC для погружных СЖО

Шведская химическая компания Perstorp представила биоразлагаемую жидкость, предназначенную для погружных (иммерсионных) СЖО, передаёт Datacenter Dynamics. По словам компании, Synmerse DC представляет собой синтетическую жидкость, обеспечивающую безопасность и эффективность эксплуатации, это снижает энергопотребление охлаждающих систем.

Perstorp принадлежит малайзийской нефтегазовой компании Petronas, уже представившей жидкость собственной разработки для систем Iceotope. В Perstorp сообщили, что разработали жидкость при сотрудничестве с ведущими производителями чипов и OEM-компаниями для того, чтобы обеспечить её совместимость с новейшим оборудованием и погружными системами охлаждения. По словам компании, у неё богатый опыт в разработке синтетических жидкостей самого разного назначения.

 Источник изображения: Jimmy Chang/unsplash.com

Источник изображения: Jimmy Chang/unsplash.com

Компания не рассказала о составе жидкости подробно, но сообщила, что она не включает PFAS-соединения («вечные» химикаты), способные нанести вред окружающей среде. Жидкости на основе PFAS традиционно применяются в системах погружного охлаждения, но с принятием во многих странах законов, запрещающих их использование, производители ищут более экобезопасные варианты на основе растительных и минеральных масел, различных фторуглеродов и других соединений. Впрочем, ещё летом 2023 года сообщалось, что Евросоюз намерен отменить запрет на PFAS-химикаты, поскольку те очень важны для рынка СЖО.

Жидкостное охлаждение набирает популярность в последние годы, поскольку ИИ-бум привёл к росту плотности размещения компонентов в серверных стойках. Другими словами, традиционные воздушные системы охлаждения часто не справляются с новыми нагрузками мощных новых серверов. Нефтегазовые компании вроде Gulf Oil, Shell, Castrol, ExxonMobil, ENEOS и SK Enmove активно ведут разработки в новой для себя нише СЖО. Свои варианты представили американский продовольственный гигант Cargill и химический концерн Chemours (Du Pont).

Постоянный URL: http://servernews.ru/1111921
23.09.2024 [10:25], Владимир Мироненко

LiquidStack привлекла $20 млн на расширение разработки серверных СЖО

Разработчик СЖО для ЦОД LiquidStack Holding сообщил о привлечении $20 млн от инвестиционной компании Tiger Global Management в рамках расширенного раунда серии B. Средства направят на увеличение производственных мощностей для выпуска систем прямого и иммерсионного охлаждения, расширение деятельности и научных исследований.

Основанная в 2012 году LiquidStack поставляет СЖО для IT-оборудования, телекоммуникационных решений и блокчейн-систем. Решения компании используются в дата-центрах гиперскейлеров, а также в корпоративных, колокейшн и периферийных ЦОД. Фактически LiquidStack появилась в результате реорганизации Allied Control Limited (ACL, подразделение The Bitfury Group), которая изначально занималась созданием СЖО для майнинговых систем.

 Источник изображения: LiquidStack Holding

Источник изображения: LiquidStack Holding

Новое финансирование позволит LiquidStack расширить разработку систем прямого жидкостного охлаждения, а также двухфазных и однофазных решений для вариантов использования с комплексным жидкостным охлаждением. В 2021 году Wiwynn, которая занимается поставками серверного оборудования для Microsoft, проинвестировала в LiquidStack $10 млн.

Портфолио LiquidStack включает ряд продуктов СЖО, разработанных для обеспечения высокой энергоэффективности и производительности вычислительных систем. В частности, LiquidStack предлагает системы прямого жидкостного охлаждения Direct-To-Chip (DTC), в том числе линейку блоков распределения охлаждающей жидкости (CDU), специально разработанную для высокотребовательных приложений, таких как генеративный ИИ и HPC. Первый продукт в этой серии, блок распределения охлаждающей жидкости CDU-1MW, обеспечивает мощность охлаждения 1350 кВт.

Также LiquidStack занимается разработкой технологий однофазного и двухфазного иммерсионного охлаждения и микр-ЦОД на их основе. Так, в серии MicroModular и MacroModular входят модульные, готовые решения мощностью от 250 кВт до 1,5 МВт. Продукты LiquidStack производятся в США на её предприятии в Кэрролтоне (штат Техас), которое открылось в марте этого года.

Постоянный URL: http://servernews.ru/1111361
24.08.2024 [14:05], Сергей Карасёв

LiquidStack выпустила универсальный блок CDU-1MW для систем прямого жидкостного охлаждения

Компания LiquidStack, разработчик систем погружного (иммерсионного) охлаждения для ЦОД, сообщила о выходе высокопроизводительного блока распределения охлаждающей жидкости CDU-1MW, ориентированного на гиперскейлеров, поставщиков колокейшн-услуг и крупные предприятия. Решение спроектировано с прицелом на ресурсоёмкие нагрузки, такие как генеративный ИИ, большие языковые модели (LLM) и НРС.

CDU-1MW представляет собой универсальное изделие, совместимое с различными коммерческими системами прямого жидкостного охлаждения Direct-To-Chip (DTC). Гибкость интеграции достигается благодаря конфигурируемым на месте верхним или нижним трубопроводам и электрическим соединениям. Стоечный форм-фактор и корпус из некоррозионных материалов обеспечивают долговечность и удобство эксплуатации, говорит компания.

 Источник изображения: LiquidStack

Источник изображения: LiquidStack

Охлаждающая мощность достигает 1350 кВт. CDU оборудован датчиками температуры, давления и расхода во всех критических точках. Резервирование реализовано по схеме N+1: в частности, применяются насосы с возможностью горячей замены. Откидные панели упрощают обслуживание.

По заявлениям LiquidStack, новинка спроектирована так, чтобы обеспечить значительное сокращение потребления энергии и теплононсителя. Это приводит к существенному снижению совокупной стоимости владения (TCO) по сравнению с воздушным охлаждением. Говорится об уменьшении энергопотребления на 36 % и о снижении капитальных затрат на 48 %. Кроме того, значительно повышается эффективность использования площадей в дата-центре.

Блок CDU-1MW разработан при непосредственном сотрудничестве с крупнейшими мировыми ЦОД и производителями микросхем. Применён программируемый логический контроллер Siemens с интуитивно понятными элементами управления и инструментами мониторинга. Для удалённого управления могут применяться MODBUS TCP/IP и RESTful API. Говорится о сертификации ETL, CSA и CE.

Постоянный URL: http://servernews.ru/1109942
20.08.2024 [15:23], Владимир Мироненко

Apheros придумала радиаторы из пенометалла и получила $1,85 млн на коммерциализацию технологии

Швейцарский стартап Apheros объявил о завершении раунда предварительного финансирования в размере $1,85 млн, который возглавила венчурная компания Founderful. Как сообщает стартап, полученные инвестиции позволят ему ускорить разработку и внедрение решений для жидкостных систем охлаждения на основе пенометалла.

Основанный в Цюрихе в прошлом году на базе подразделения университета ETH Zurich, Apheros разработал запатентованную технологию создания пенометалла с «беспрецедентными свойствами». Благодаря большой площади поверхности и низкой плотности новый материал имеет улучшенную теплопередачу и низкое сопротивление потоку, что делает его идеальным для высокопроизводительных систем охлаждения. Автор разработки — Джулия Карпентер (Julia Carpenter), соучредитель и генеральный директор Apheros, докторская диссертация которой в ETH Zurich как раз посвящена пенометаллу.

 Источник изображений: Apheros

Источник изображений: Apheros

На веб-сайте компании сообщается, что микроструктура пенометалла Apheros «превосходно рассеивает тепло», в том числе в системах жидкостного охлаждения, включая двухфазные испарительные СЖО, с которыми решение компании может быть легко интегрировано уже сейчас. Кроме того, технология Apheros может пригодиться для создания электродов и катализаторов.

Компания уже создала первый продукт, в котором используется пеномедь. Как утверждается, это оптимальное решение для пассивного охлаждения, которое значительно превосходит текущие технологии как с точки зрения эффективности, так и с точки зрения экологического воздействия благодаря малоотходному методу производства.

Apheros протестировала свои продукты с неназванными технологическим партнёром и теперь стремится к коммерциализации своих решений. Компания рассчитывает в течение года масштабировать производство до нескольких тонн. При этом для оснащения с нуля или модернизации одного дата-центра потребуется несколько сотен килограмм пенометалла.

Постоянный URL: http://servernews.ru/1109698

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus