Материалы по тегу: hardware
23.05.2024 [09:57], Александр Бенедичук
Гигантские суперчипы Cerebras натренируют ИИ для армии ГерманииCerebras Systems и Aleph Alpha объединятся для разработки суверенных ИИ-решений в интересах армии Германии, сообщает Datacenter Dynamics. Работы альянса будут вестись совместно с компанией BWI GmbH, государственным поставщиком ИТ-услуг, принадлежащим Министерству обороны Германии. Aleph Alpha развернет первый в Европе ИИ-суперкомпьютер Cerebras CS-3 в своем дата-центре Alpha ONE. «Мы считаем, что партнёрство [с Aleph Alpha] позволит создать совершенно новые архитектуры ИИ-моделей, которые могут быть полезны правительствам и предприятиям по всему миру», — сказал глава Cerebras, отметив, что работа с новыми моделями будет безопасной и защищённой, но не уточнив, что именно под этим подразумевается. Aleph Alpha основана в 2019 году для создания моделей генеративного ИИ в рамках концепции «суверенитета данных». ЦОД Alpha ONE был запущен в 2022 году в кампусе GovTech в Германии и используется для исследований и разработки ИИ-приложений как предприятиями государственного сектора, так и частными. Здесь Cerebras и Aleph Alpha будут вместе создавать базовые и мультимодальные модели, а также и новые архитектуры ИИ-моделей с использованием CS-3. В основе Cerebras CS-3 лежит ИИ-ускоритель WSE-3 размером с целую кремниевую пластину. Он содержит 4 трлн транзисторов, 900 тыс. ядер и 44 Гбайт SRAM, а его производительность составляет 125 Пфлопс в разреженных FP16-вычислениях.
23.05.2024 [08:38], Руслан Авдеев
Чтобы не вышло как с TikTok: Norsk Kjernekraft намерена запитать норвежские ЦОД от малых реакторовНорвежская энергетическая компания Norsk Kjernekraft намерена строить малые модульные реакторы (SMR) для дата-центров. Datacenter Dynamics сообщает, что поможет разгрузить энергетические сети страны. Это особенно актуально на фоне прошлогоднего скандала, когда строящийся для нужд TikTok дата-центр практически «отобрал» энергию у оборонного предприятия. Часто атомная энергия называется экологически безопасной и подходящей для обеспечения работы ЦОД. SMR в перспективе будут дешевле и проще в строительстве и эксплуатации, чем крупные АЭС, а компании вроде Norsk Kjernekraft готовятся внедрять их непосредственно рядом с кампусами ЦОД. По расчётам последней, в ближайшие годы в Норвегии понадобится дополнительно от 50 до 233 ТВт∙ч, тогда как в 2023 году все электростанции страны поставили 156 ТВт∙ч. ![]() Источник изображения: Michael Fousert/unsplash.com Уже сегодня норвежские электросети полностью работают на возобновляемой энергии, в основном благодаря гидроэлектростанциям, на которые приходится 88 % поставок электричества в стране, а также ветряным электростанциям. С учётом прохладного климата Норвегия является оптимальным местом для размещения дата-центров. При этом атомных реакторов там до сих пор нет, но в Norsk Kjernekraft подчёркивают необходимость получения дополнительного электричества в больших объёмах. Вопрос в том, сколько смогут вырабатывать электростанции страны в экоустойчивом режиме. Дело в том, что имеется «потолок» для объёмов именно возобновляемой энергии, поэтому придётся пересмотреть взгляды на энергетику в целом. В Norsk Kjernekraft заявляют, что установка SMR при дата-центрах высвободит ресурсы магистральных электросетей, сегодня используемых для питания цифровой инфраструктуры. А тепло реакторов можно дополнительно направить на производственные нужды, для захвата углерода, добычи водорода, аммиака и т.н. электротоплива, а также обогрева помещений. Огромным преимуществом является отсутствие необходимости в прокладке к ЦОД серьёзных ЛЭП. Пока разработчик не сообщает, сколько энергии будут генерировать SMR, как и того, вызвала ли идея интерес у местных операторов ЦОД. Компания предлагает построить до пяти SMR в коммуне Эйгарден (Øygarden) к западу от Бергена. Уже заключена сделка с Rolls-Royce, которая должна будет поставлять реакторы для площадки. Ранее последняя предлагала свои SMR напрямую операторам. Согласно расчётам, электростанция должна заработать в ближайшие десять лет. Целесообразность использования атомной энергии уже изучается некоторыми операторами ЦОД. Например, в марте 2024 года Amazon (AWS) заплатила $650 млн за кампус ЦОД в Пенсильвании, который строится вблизи АЭС и будет питаться от неё, а Microsoft формирует команду специалистов по атомной энергетике для того, чтобы изучить возможность использования SMR для энергоснабжения собственных ЦОД.
22.05.2024 [23:22], Владимир Мироненко
В июле Atos продаст свои активы и определится с планом проведения реструктуризацииИспытывающий финансовые трудности французский IT-холдинг Atos вскоре определится с путями выхода из кризисного положения, утверждает вице-президент входящей в него группы Eviden Бруно Лекуэнт (Bruno Lecointe). Eviden была создана после решения Atos разделить активы. Eviden специализируется на ИТ-инфраструктуре, а Atos — на ИТ-услугах, ПО и кибербезопасности. Как сообщает HPCwire, Лекуанте пожаловался на большой объём дезинформации относительно положения бизнеса и заверил, что компания восстанавливается. По его словам, Atos находится на заключительном этапе реорганизации. В начале мая холдинг получил предложения о приобретении сразу от четырёх компаний, одно из которых — от Bain Capital — было сходу отклонено. Сейчас совет директоров Atos обсуждает предложения от группы держателей облигаций и банков-кредиторов, совместное предложение Attestor Limited и EP Equity Investment, контролируемой чешским миллиардером Дэниелем Кретинским (Daniel Kretinsky), и предложение Onepoint французского инвестора Давида Лаяни (David Layani) в консорциуме с Butler Industries. При рассмотрении предложений совет исходит из интересов сотрудников, клиентов, поставщиков и акционеров холдинга, отметил Лекуэнт. «К концу мая совет директоров завершит выбор одного из трёх, кто нас купит, а к июлю [контракт] должен быть подписан», — сказал глава группы Eviden. По словам Лекуэнта, французское правительство выразило заинтересованность в инвестировании $0,7–$1 млрд в Atos, но ограничиваясь только подразделением BDS (большие данные и безопасность). В настоящее время правительство проводит комплексную проверку, так что сделка может быть заключена в ближайшие месяцы. Французские власти заинтересованы в защите активов, важных для национальной безопасности, а также критической инфраструктуры, такой как суперкомпьютеры и квантовые суперкомпьютеры. Лекуэнт заверил, что работа BDS стабильна, и добавил, что в сделке BDS с французским правительством участвовала третья сторона. ![]() Источник изображения: Atos Сама Atos находится в сложной финансовой ситуации и её акции торгуются на рекордно низком уровне на парижской бирже Euronext Market. 17 мая акции компании закрылись на уровне €2,09, а в апреле падали до €1,7, тогда как ранее их цена достигала €130. Кредиторская задолженность Atos составляет $5 млрд и за два года она трижды меняла генерального директора. Тем не менее, как отмечает HPCwire, компания подаёт надежды на восстановление благодаря финансовому оздоровлению и значительному объёму заказов. В связи с продолжающимся поиском путей выхода из кризиса, Atos отложила утверждение своей финансовой отчётности за 2023 год до конца 2024 года, пишет The Register. Французская компания сообщила в обзоре рынка, что получила одобрение президента Коммерческого суда Сержи-Понтуаза на продление до 31 декабря крайнего срока для проведения ежегодного общего собрания акционеров для утверждения финансовой отчётности за прошлый год. Это связано со стремлением компании добиться стабильности, не меняя договорённостей о промежуточном финансировании, что позволит ей продолжить переговоры с заинтересованными сторонами, направленные на достижение соглашения о финансовой реструктуризации к концу июля. На этой неделе Atos заявила, что будет проводить консультации с акционерами по плану финансовой реструктуризации отдельно от ежегодного общего собрания.
22.05.2024 [21:45], Руслан Авдеев
Google обогнала AMD на рынке процессоров для ЦОД и вот-вот догонит Intel
cpu
google
google cloud platform
hardware
techinsights
tpu
анализ рынка
гиперскейлер
ии
облако
ускоритель
цод
В прошлом месяце компания Google анонсировала долгожданный серверный CPU на архитектуре Arm. Впрочем, как сообщает The Register, она уже оказалась третьей на рынке процессоров для ЦОД (сюда входят не только CPU, но и GPU, TPU и иные ускорители). Согласно отчёту TechInsights, компания теперь уступает только NVIDIA и Intel и давно обогнала AMD. Как и другие крупные облачные операторы, IT-гигант выпускает собственные чипы TPU, шестое поколение которых было представлено на прошлой неделе. Хотя на сторону их не продают, компания заказывает огромные партии TPU для оснащения собственных ЦОД — только в прошлом году речь шла о 2 млн штук. Ключевым партнёром Google в создании кастомного «кремния» является Broadcom. Поставки TPU нарастают с каждым поколением, следуя за ростом самой компании. После премьеры TPU v4 в 2021 году в связи с развитием больших языковых моделей (LLM) объём полупроводникового бизнеса Google значительно вырос. TPU применяются компанией для внутренних задач, а ускорители NVIDIA — для облака. В TechInsights считают, что на сегодняшний день у Google имеется крупнейшая в отрасли база установленных ИИ-ускорителей и самая масштабная ИИ-инфраструктура. В прошлом году на серверным рынке произошла «масштабная коррекция запасов» — гиперскейлеры увеличили срок службы оборудования, отложив замену серверов общего назначения и повысив капитальные затраты на ИИ-серверы и ускорители NVIDIA. Аналитики Omdia говорят о таких тенденциях на рынке что в прошлом, что в начале этого года. В TechInsights считают, что по итогам I квартала 2024 года Google сможет догнать или даже перегнать Intel по доле на этом рынке. Конечно, Google — не единственная облачная компания, разрабатывающая собственные чипы. Microsoft работает над серверным CPU Azure Cobalt и ИИ-ускорителями Maia 100. AWS и вовсе годами использует собственные Arm-процессоры Graviton и ИИ-ускорители серий Trainium и Inferentia. В прошлогоднем докладе Bernstein Research сообщалось, что архитектуру Arm используют уже около 10 % серверов по всему миру, а более 50 % из них внедряется AWS. Softbank в начале 2023 года говорила о том, что Arm захватила 5 % облачного рынка. Впрочем, с появлением процессоров TPU V5e и TPU V5p решения Google будут использоваться всё шире из-за «взрывного роста» больших языковых моделей вроде Gemini. В 2024 году у Google появится Arm-процессор Axion. И его внедрение, по мнению TechInsights, будет происходить намного быстрее, чем Graviton, поскольку у Google уже имеется программная инфраструктура для такого чипа. Всё это необходимо компании, чтобы идти в ногу с AWS, Microsoft и, в меньшей степени, Alibaba. При этом в докладе упоминается, что рынок полупроводников для ЦОД быстро меняется — раньше на нём доминировала Intel с архитектурой x86. Теперь его структура определяется потребностями ИИ-систем.
22.05.2024 [15:05], Руслан Авдеев
«Ростелеком» и правительство Нижегородской области договорились увеличить ёмкость местного ЦОД и совместно готовить новые кадры«Ростелеком — Центры обработки данных (ЦОД)» и правительство Нижегородской области пришли к соглашению, предусматривающему увеличение мощности принадлежащего оператору дата-центра. Сотрудничество областных властей и оператора предполагает создание базы для IT-инфраструктуры в рамках национального проекта «Цифровая экономика», утверждённого президентом России. По словам главы области, особое внимание при взаимодействии будет уделяться совместной образовательной и научной деятельности, подготовка специалистов в области информационных технологий станет осуществляться на базе профильного кампуса «НЕЙМАРК», также будет организовано развитие технологий искусственного интеллекта. Помимо подготовки квалифицированных специалистов, предусмотрено и развитие уже действующего ЦОД благодаря увеличению его ёмкости с 440 до 1 тыс. стойко-мест. Всего «РТК-ЦОД» принадлежит 22 дата-центра. Согласно отчёту iKS-Consulting, компания является лидером как по количеству стойко-мест, так и на облачном рынке России. Осень 2024 года оператор намерен провести IPO.
22.05.2024 [14:09], Сергей Карасёв
Dell представила ИИ-сервер PowerEdge XE9680L с ускорителями NVIDIA B200 и СЖОКомпания Dell анонсировала сервер PowerEdge XE9680L, предназначенный для наиболее требовательных больших языковых моделей (LLM) и крупномасштабных сред ИИ, где плотность размещения ускорителей на стойку имеет решающее значение. Новинка станет доступна во II половине 2024 года. Сервер выполнен в форм-факторе 4U. Он может комплектоваться восемью ускорителями NVIDIA HGX B200 (Blackwell). Задействована система прямого жидкостного охлаждения (DLC). Доступны 12 слотов PCIe 5.0 полной высоты и половинной длины для установки сетевых карт и иных адаптеров/контроллеров. «Сервер использует эффективное интеллектуальное охлаждение DLC как для CPU, так и для GPU. Эта революционная технология позволяет создать более плотную конфигурацию 4U, максимизируя вычислительную мощность при сохранении тепловой эффективности», — заявляет производитель. Отмечается, что PowerEdge XE9680L обеспечивает возможность масштабирования до 72 ускорителей Blackwell в расчёте на стойку 52U или до 64 ускорителей на стойку 48U. Прочие характеристики новинки будут обнародованы ближе к началу продаж. В ассортименте Dell уже есть 6U-сервер PowerEdge XE9680. Эта система использует процессоры Intel Xeon Sapphire Rapids. Она поддерживает установку восьми ускорителей NVIDIA H100/A100, а также AMD Instinct MI300X и Intel Gaudi3.
22.05.2024 [13:49], Сергей Карасёв
1,5 Тбайт HBM3: AMD Instinct MI300X стали доступны в облаке Microsoft AzureКорпорация Microsoft сообщила о доступности инстансов Azure ND MI300X v5 на базе ускорителей AMD Instinct MI300X. Отмечается, что это качественно новое семейство виртуальных машин, предлагающее максимально возможный объём памяти HBM и ведущей в отрасли производительности. О подготовке инстансов ND MI300X v5 компания Microsoft объявила в ноябре прошлого года. В составе одной виртуальной машины объединены восемь ускорителей со 192 Гбайт памяти HBM3, соединённых между собой посредством Infinity Fabric 3.0, а с хостом — по PCIe 5.0. Таким образом, общий объём HBM3 достигает 1,5 Тбайт, а пропускная способность — 5,3 Тбайт/с. Отмечается, что виртуальные машины ND MI300X v5 используют открытую программную платформу AMD ROCm, которая предоставляет полный набор инструментов и библиотек для разработки и развёртывания ИИ. Платформа ROCm поддерживает популярные фреймворки, такие как TensorFlow и PyTorch, а также ИИ-библиотеки Microsoft, включая ONNX Runtime, DeepSpeed и MSCCL. Кроме того, ROCm упрощает перенос моделей с одной платформы на другую, что обеспечивает снижение затрат. Компания Hugging Face портировала свои модели на ND MI300X v5 без какого-либо изменения кода. Это позволило увеличить производительность в 2–3 раза по сравнению с AMD Instinct MI250.
22.05.2024 [13:31], Сергей Карасёв
Крошечный компьютер Radxa Zero 3E в формате Raspberry Pi Zero 2W получил 1GbE-портДебютировал одноплатный компьютер Radxa Zero 3E, выполненный на аппаратной платформе Rockchip. Как сообщает ресурс CNX Software, новинка имеет форм-фактор Raspberry Pi Zero 2W с габаритами 65 × 30 мм. Приём заказов на устройство уже начался. Задействован чип RK3566, содержащий четыре ядра Cortex-A55 с тактовой частотой до 1,6 ГГц и графический блок Arm Mali-G52 с поддержкой OpenGL ES 1.1/2.0/3.2, Vulkan 1.1, OpenCL 2.0. Есть NPU-узел с быстродействием 0,8 TOPS. Возможна обработка видеоматериалов 4Kp60 H.265/H.264/VP9. Изделие может оснащаться 1, 2, 4 или 8 Гбайт оперативной памяти LPDDR4. Для хранения данных может быть использована карта microSD. В оснащение входит сетевой контроллер 1GbE на базе RTL8211F-CG (разъём RJ-45) с опциональной поддержкой РоЕ. Присутствуют выход Micro-HDMI, порты USB 3.0 Type-C и USB 2.0 Type-C OTG. Имеются интерфейс камеры MIPI CSI (4 линии) с поддержкой Raspberry Pi Camera V1.3 (OV5647) и Raspberry Pi Camera V2 (IMX219), а также 40-контактная колодка GPIO (28 × GPIO, 5 × UART, 1 × SPI, 2 × I2C, PCM/I2S, 6 × PWM, 5 В, 3,3 В, GND). Питание подаётся через разъём USB 2.0 Type-C (5 В / 2 А). Указана стоимость модификаций Radxa Zero 3E с 1, 2 и 4 Гбайт ОЗУ — приблизительно $16, $21 и $31. Модуль Radxa 3E PoE HAT обойдётся ещё в $10.
22.05.2024 [12:36], Сергей Карасёв
Arm-процессоры Microsoft Cobalt 100 появились в облаке AzureКорпорация Microsoft анонсировала предварительные версии новых инстансов Azure на собственных процессорах Azure Cobalt 100. Пользователи могут выбирать между версиями общего назначения (семейство Dpsv6 и Dplsv6) и конфигурациями, оптимизированными для приложений в памяти (семейство Epsv6). Чипы Cobalt 100 дебютировали в ноябре 2023 года. Они насчитывают 128 ядер Armv9 Neoverse N2 (Perseus). По заявлениям Microsoft, по сравнению с ранее использовавшимися в инфраструктуре Azure чипами Arm изделия Azure Cobalt 100 обеспечивают повышение CPU-производительности в 1,4 раза. Рост быстродействия при рабочих нагрузках на основе Java достигает 1,5 раза, на веб-серверах — 2 раз. Ранее в Azure были доступны Arm-процессоры Ampere Altra. ![]() Источник изображения: Microsoft Инстансы Dpsv6 и Dpdsv6 предназначены для эффективного выполнения масштабируемых рабочих нагрузок и облачных задач. Эти решения хорошо подходят для малых и средних баз данных с открытым исходным кодом, серверов приложений и веб-серверов, говорит компания. Dplsv6 и Dpldsv6 ориентированы на кодирование мультимедийных данных, игровые серверы, микросервисы и другие рабочие нагрузки, не требующие большего объема оперативной памяти. Инстансы Epsv6 и Epdsv6 способны справляться с крупными базами данных, корпоративными приложениями с высоким объёмом требуемой памяти и пр. Серия Dpsv6 предлагает до 96 vCPU с 384 Гбайт оперативной памяти (соотношение RAM к vCPU — 4:1). Семейство Dplsv6 также включает до 96 vCPU, но объём памяти составляет до 192 Гбайт (2:1). В свою очередь, Epsv6 предлагают до 96 vCPU и до 672 Гбайт RAM (8:1). Все эти варианты доступны с локальным хранилищем и без него. Инстансы доступны в регионах Central US, East US, East US 2, North Europe, Southeast Asia, West Europe и West US 2. В режиме превью сами инстансы будут бесплатны. Все виртуальные машины можно разворачивать, используя привычные инструменты, включая портал Azure, SDK, API, PowerShell и CLI. Говорится о совместимости с широким спектром дистрибутивов Linux, в том числе Canonical Ubuntu, CentOS, Debian, Red Hat Enterprise Linux, SUSE Enterprise Linux, Alma Linux, Azure Linux, Flatcar Linux и пр. Также компания подготовила Insider-сборки Windows 11 Pro и Enterprise, расширила возможности Visual Studio и оптимизировала сборки .NET 8 и OpenJDK.
22.05.2024 [00:00], Алексей Степин
EPYC для самых маленьких: AMD представила серверные процессоры EPYC 4004 для сокета AM5AMD продолжает активно расширять серию серверных процессоров EPYC, причём не только «вверх», но и «вниз». Первой ласточкой стал выпуск упрощённых моделей EPYC 8004 Siena с ядрами Zen4c для периферийных вычислений, а сегодня компания анонсировала ещё более доступные односокетные EPYC 4004, стоимость которых начинается со $149. EPYC 4004 целиком построены на базе Ryzen 7000 и используют тот же разъём AM5. Этим анонсом AMD закрывает ещё одну нишу — серверные системы начального уровня, где Intel выступает с модельным рядом Xeon E. Позиционируются такие системы либо как компактные и энергоэффективности решения, например, для выделенных серверов с минимальной удельной стоимостью, либо как корпоративные платформы начального уровня для малого бизнеса. В таких системах ничто не мешает использовать Ryzen 7000, что и делают многие вендоры. Более того, многие уже выпустили обновления BIOS/UEFI, добавляющие таким системам поддержку EPYC 4004. Однако формально Ryzen никогда не были серверным продуктом и, например, лишены поддержки RDIMM. Речь по-прежнему идёт о двухканальной DDR5-5200 в небуферизированных модулях UDIMM. Максимальный объём ограничен 192 Гбайт, но у Xeon E-2400 он ещё меньше и составляет всего 128 Гбайт, да к тому же DDR5-4800. Процессоры предоставляют в распоряжение системы 28 линий PCI Express 5.0, что, больше, чем у Xeon E-2400, насчитывающего всего 16 таких линий. По сути, AMD EPYC 4004 являются перемаркированными Ryzen 7000 с Zen4-ядрами, однако есть отличия: младшая 4-ядерная модель 4124P не имеет «потребительского» аналога. Максимальное количество ядер по-прежнему 16, причём в двух вариантах — 4584PX с 3D V-Cache (128 Мбайт L3-кеша) и обычном 4564P (64 Мбайт L3-кеша). В турборежиме оба флагмана могут разгоняться до 5,7 ГГц, но базовое значение у 4564P выше (4,5 ГГц), ценой повышенного со 120 до 170 Вт теплопакета. Внутри это по-прежнему чиплетные решения с 6-нм IO-блоком, одним-двумя кристаллами с восемью 5-нм ядрами и графикой RDNA2. Вся «серверность» EPYC 4004 сводится к поддержке внешнего BMC-контроллера, возможности создания программных RAID-массивов в RAIDXpert2 for Server и совместимости с современными серверными ОС. Однако у новинок в сравнении с E-2400 есть бонус в виде поддержки AVX-512. Как показывают результаты тесто Phoronix, флагманские модели AMD EPYC 4004 в среднем почти вдвое опережают старший Xeon E-2488, а стоят при этом ненамного больше. ![]() Источник: Phoronix У AMD на этот раз определённо получилось очень удачное решение, аналогов которому по сочетанию стоимости и производительности у конкурента просто нет. Определённую опасность для EPYC 4004 могли бы представлять процессоры Xeon D-2800, имеющие до 22 ядер и полноценную поддержку AVX-512, но это специфические решения для сетевых систем и серверов периферийных вычислений, имеющие существенно более высокую стоимость. |
|