Лента новостей
07.12.2023 [23:02], Владимир Мироненко
Dell выпустит серверы с ИИ-ускорителями AMD Instinct MI300XDell и AMD объявили о расширении портфеля решений Dell Generative AI Solutions с целью ускорения обработки сложных рабочих нагрузок и предоставления компаниям больше возможностей для развёртывания приложений генеративного ИИ. Новые решения включают серверы Dell PowerEdge XE9680 с ускорителями AMD Instinct MI300X. Сервер будет оснащён восемью ускорителями, что даст общую ёмкость HBM3 1,5 Тбайт и FP16-производительность более 10 Пфлопс. Использование PowerEdge XE9680 с MI300X позволит компаниям сократить занимаемую площадь в ЦОД, снизить совокупную стоимость владения и получить конкурентное преимущество, говорит Dell. Для масштабирования нагрузок компания предлагет Ethernet-фабрику с 400G-коммутаторами PowerSwitch Z9664F-ON. PowerEdge XE9680 поставляется с приложением Dell OpenManage Enterprise для администрирования и мониторинга систем. Также сообщается, что сервер обеспечивает высокую защищённость данных благодаря интегрированной киберзащите и использованию концепции Zero Trust. ![]() Источник изображения: Dell Dell также пополнила платформу Dell Generative AI Solutions решением Dell Validated Design for Generative AI with AMD, которое упрощает надёжное развёртывание генеративного ИИ. Его выход ожидается в следующем году с ИИ-платформами на базе AMD ROCm и открытых больших языковых моделей (LLM). Dell PowerEdge XE9680 с ускорителями AMD Instinct MI300X и Dell Validated Design for Generative AI with AMD появится на рынке в I половине 2024 года.
07.12.2023 [21:04], Сергей Карасёв
Google представила Cloud TPU v5p — свой самый мощный ИИ-ускорительКомпания Google анонсировала свой самый высокопроизводительный ускоритель для задач ИИ — Cloud TPU v5p. По сравнению с изделием предыдущего поколения TPU v4 обеспечивается приблизительно 1,7-кратный пророст быстродействия на операциях BF16. Впрочем, для Google важнее то, что она наряду с AWS является одной из немногих, кто при разработке ИИ не зависит от дефицитных ускорителей NVIDIA. К этому же стремится сейчас и Microsoft. Решение Cloud TPU v5p оснащено 95 Гбайт памяти HBM с пропускной способностью 2765 Гбайт/с. Для сравнения: конфигурация TPU v4 включает 32 Гбайт памяти HBM с пропускной способностью 1228 Гбайт/с. ![]() Источник изображений: Google Кластер на базе Cloud TPU v5p может содержать до 8960 чипов, объединённых высокоскоростным интерконнектом со скоростью передачи данных до 4800 Гбит/с на чип. В случае TPU v4 эти значения составляют соответственно 4096 чипов и 2400 Гбит/с. Что касается производительности, то у Cloud TPU v5p она достигает 459 Тфлопс (BF16) против 275 Тфлопс у TPU v4. На операциях INT8 новинка демонстрирует результат до 918 TOPS. ![]() В августе нынешнего года Google представила ИИ-ускоритель TPU v5e, созданный для обеспечения наилучшего соотношения стоимости и эффективности. Это изделие с 16 Гбайт памяти HBM (820 Гбит/с) показывает быстродействие 197 Тфлопс и 394 TOPS на операциях BF16 и INT8 соответственно. При этом решение обеспечивает относительную производительность на доллар на уровне $1,2 в пересчёте на чип в час. У TPU v4 значение равно $3,22, а у новейшего Cloud TPU v5p — $4,2 (во всех случаях оценка выполнена на модели GPT-3 со 175 млрд параметров). ![]() По заявлениям Google, чип Cloud TPU v5p может обучать большие языковые модели в 2,8 раза быстрее по сравнению с TPU v4. Более того, благодаря SparseCores второго поколения скорость обучения моделей embedding-dense увеличивается приблизительно в 1,9 раза. На базе TPU и GPU компания предоставляет готовый программно-аппаратный стек AI Hypercomputer для комплексной работы с ИИ. Система объединяет различные аппаратные ресурсы, включая различные типы хранилищ и оптический интерконнект Jupiter, сервисы GCE и GKE, популярные фреймворки AX, TensorFlow и PyTorch, что позволяет быстро и эффективно заниматься обучением современных моделей, а также организовать инференс.
07.12.2023 [20:49], Руслан Авдеев
Евросоюз готовит суверенный облачный проект с государственной поддержкой до €1,2 млрдЕврокомиссия намерена выделить до €1,2 млрд средств на финансирование проекта IPCEI Cloud. Как сообщает The Register, планируется привлечь ещё €1,4 млрд частных средств. Предполагается, что это позволит продвигать местные региональные интересы в секторе, контролируемом американскими IT-гигантами. Ожидается, что проект Important Project of Common European Interest (IPCEI) обеспечит серьёзный вклад в рост региона, позволит создать новые рабочие места, осуществить переход на «зелёные» и цифровые технологии и повысит конкурентоспособность местной промышленности и экономики. Основная проблема в том, что на облачном рынке Евросоюза доминируют игроки из США, включая AWS, Microsoft и Google. По данным Synergy Research, они сообща занимают уже 72 % рынка, а локальные провайдеры за пять снизили свою долю практически вдвое. Средства на получение облачного суверенитета выделят из фондов семи стран — участниц Евросоюза, включая Германию, Францию, Венгрию, Нидерланды, Италию, Польшу и Испанию. В рамках проекта предполагается объединить облачные и периферийные вычисления множества европейских игроков локального масштаба. Всего выделено четыре направления работы. В рамках первого займутся разработкой интерфейсов для уже существующей инфраструктуры, в рамках второго разработают «эталонную» архитектуру, позволяющую объединить мощности разных провайдеров. Ещё два направления предусматривают создание инструментов и приложений для связи облачной инфраструктуры в единую сеть. ![]() Источник изображения: Christian Lue/unsplash.com Первые результаты должны появиться к концу 2027 года. Это, как рассчитывают в Евросоюзе, позволит создать 1 тыс. рабочих мест в ИИ-индустрии, сегментах, связанных с обеспечением кибербезопасности, разработкой и т.п. Ещё 5 тыс. мест появится, когда реализация проекта достигнет коммерческой фазы. Исследования, разработка и внедрение будут происходить с 2023 по 2031 гг. — участие принимают 19 компаний, включая SAP, Orange и Deutsche Telecom. Государственное финансирование смягчит негативный эффект в случае провала некоторых инициатив, а компании, разрабатывающие ПО с открытым кодом, обеспечат лицензии для его использования без ограничений всем заинтересованным сторонам. Кроме того, 20 % мощностей облачной инфраструктуры, финансируемой за счёт государства, необходимо будет выделить третьим сторонам, а если дела у получателей помощи не пойдут, компании должны будут вернуть предоставленные средства. К сожалению европейских властей, облачные и IT-проекты в регионе развиваются не так успешно, как могли бы. Например, общеевропейский облачный проект предложили реализовать ещё в 2019 году, но по данным на конец 2023 года, работы всё ещё не завершились. В конце 2021 года сообщалось о запуске в ЕС проекта Alliance for Industrial Data, Edge and Cloud без участия китайских и американских компаний. Кроме того, Brexit значительно повлиял на планы развития IT-индустрии в Европе.
07.12.2023 [20:34], Сергей Карасёв
CoreWeave привлекла более $640 млн для развития облачной ИИ-платформыКомпания CoreWeave, предоставляющая облачные услуги для решения ИИ-задач, сообщила о привлечении дополнительных инвестиций в размере $642 млн. Программу финансирование возглавляет Fidelity Management & Research Company при участии Investment Management Corporation of Ontario (IMCO), Jane Street, J. P. Morgan Asset Management, Nat Friedman & Daniel Gross, Goanna Capital, Zoom Ventures и др. CoreWeave, основанная в 2017 году, начинала свой бизнес с майнинга криптовалют, а затем сосредоточила внимание на вычислениях общего назначения и хостинге проектов генеративного ИИ. Затем компания переориентировалась на предоставление специализированных облачных ИИ-решений. Именно это направление CoreWeave активно развивает в настоящее время. ![]() Источник изображения: CoreWeave В качестве аппаратной основы облачных сервисов CoreWeave выступают ускорители NVIDIA. В августе нынешнего года CoreWeave объявила о привлечении $2,3 млрд долгового финансирования под залог ускорителей NVIDIA. Причём полученные средства компания направит на закупку дополнительного аппаратного обеспечения той же NVIDIA. В апреле 2023-го CoreWeave получила $221 млн в рамках инвестиционной программы Series B, а позднее закрыла раунд финансирования ещё на $200 млн. «Индустрия искусственного интеллекта находится на переломном этапе, и CoreWeave сыграла ключевую роль в её развитии, предоставив клиентам дифференцированную инфраструктуру», — сказал Майкл Интратор (Michael Intrator), соучредитель и генеральный директор компании. CoreWeave, по её собственным заявлениям, интегрирует передовые ускорители, сетевые технологии и средства хранения данных в наиболее дифференцированную инфраструктуру ИИ. Компания обеспечивает облачный доступ к изделиям NVIDIA H100, а также A100, A40 и RTX A6000.
07.12.2023 [17:27], Сергей Карасёв
Adlink выпустила модуль COM Express Type 7 на базе AMD Ryzen Embedded V3000Компания Adlink Technology анонсировала модуль Express-VR7 в формате COM Express Type 7 с возможностью работы в широком температурном диапазоне — от -40 до +85 °C. Новинка подходит для создания периферийного сетевого оборудования и серверов, систем промышленной автоматизации, 5G-устройств и пр. В основу легла платформа AMD Ryzen Embedded V3000. Максимальная конфигурация включает процессор Ryzen V3C48 (8 ядер; 16 потоков; 3,3–3,8 ГГц; 45 Вт). Поддерживается до 64 Гбайт оперативной памяти DDR5-4800 ECC/non-ECC в виде двух модулей SO-DIMM. Для подключения накопителей можно задейстовать два порта SATA-3. Доступны 14 линий PCIe 4.0, два интерфейса 10GBASE-KR и один интерфейс 2.5GbE, четыре порта USB 3.x/2.0/1.1, по четыре интерфейса GPO и GPI, два порта UART. В оснащение включён модуль Infineon TPM 2.0. Кроме того, предусмотрена 40-контактная многоцелевая колодка для отладки. Размеры платы Express-VR7 составляют 125 × 95 мм. В оснащение включён контроллер SEMA Board для мониторинга напряжения/тока, управления режимами AT/ATX, контроля вентиляторов охлаждения и пр. Говорится о совместимости с Yocto Linux и Ubuntu 20.04.3 LTS. Новинка удовлетворяет требованиям стандартов IEC 60068-2-64, IEC-60068-2-27 и MIL-STD-202F в отношении стойкости к механическим внешним воздействующим факторам, включая вибрацию. В качестве аксессуаров предлагаются модули охлаждения, включая низкопрофильные радиаторы.
07.12.2023 [17:24], Сергей Карасёв
VAST Data провела новый раунд финансирования и почти утроила капитализацию — до $9,1 млрдКомпания VAST Data, специализирующаяся на разработке решений для управления данными, сообщила о проведении раунда финансирования Series E, в ходе которого на развитие привлечено $118 млн. В результате рыночная оценка стартапа выросла практически втрое, достигнув $9,1 млрд. Фирма VAST Data, основанная в 2016 году, предоставляет программную платформу, которую клиенты могут использовать для построения локальной инфраструктуры хранения данных. Решение позволяет осуществлять раздельное масштабирование СХД и вычислительных ресурсов, благодаря чему достигается экономия средств и энергии. ![]() Источник изображения: VAST Data Кроме того, платформа VAST Data даёт возможность отказаться от многоуровневой архитектуры хранения на основе HDD и SSD в пользу только накопителей на основе флеш-памяти. Благодаря применению алгоритмов сжатия и дедупликации значительно возрастает эффективная ёмкость All-Flash хранилиша. Таким образом, по стоимости в расчёте на 1 Гбайт хранимой информации SSD становятся сопоставимыми с HDD, что позволяет полностью отказаться от последних. Платформа VAST Data оптимизирована для хранения неструктурированных данных, которые могут использоваться для обучения моделей ИИ. По заявлениям VAST Data, её инструменты управляют более чем 10 Эбайт информации для провайдера облачной ИИ-инфраструктуры CoreWeave и других клиентов. Средства в рамках раунда Series E предоставили Fidelity Management & Research Company, New Enterprise Associates (NEA), BOND Capital и Drive Capital. Деньги будут использованы для создания новой инфраструктуры, ставящей данные в центр внимания. В общей сложности на сегодняшний день VAST Data получила от инвесторов более $380 млн.
07.12.2023 [17:18], Сергей Карасёв
Scale Computing представила компактный компьютер HE153 на базе Intel Raptor Lake для периферийных вычисленийКомпания Scale Computing анонсировала первые устройства серии HE100, в основу которых положены компьютеры небольшого форм-фактора ASUS Next Unit of Computing (NUC). Решения, выполненные на платформе Intel Raptor Lake, предназначены для организации периферийных вычислений. Максимальная конфигурация включает процессор Core i7-1370P (6Р+8Е; 20 потоков; 1,4–5,2 ГГц; 20–28 Вт; Intel Iris Xe Graphics). Объём оперативной памяти может составлять 16, 32 или 64 Гбайт. Допускается установка одного SSD формата M.2 (NVMe) вместимостью 1, 2, 4 или 8 Тбайт. Дебютировали модели HE153 и HE153s: первая оснащена двумя сетевыми портами 2.5GbE, вторая — одним. На устройствах применена фирменная «самовосстанавливающаяся» программная платформа, позволяющая приложениям автономно функционировать на периферии. Прочие характеристики новинок пока не раскрываются. ![]() Источник изображения: Scale Computing Благодаря небольшим размерам три компьютера серии HE100 могут бок о бок монтироваться в серверное шасси типоразмера 1U. В качестве альтернативного варианта допускается установка нескольких устройств стопкой друг на друга. На фронтальную панель изделий выведены два порта USB 3.х Type-A. Сзади находится интерфейс HDMI. В продажу новинки поступят в I половине 2024 года по цене от $5400 за кластер из трёх узлов.
07.12.2023 [16:54], Сергей Карасёв
GigaIO создаст уникальное ИИ-облако с тысячами ускорителей AMD Instinct MI300XКомпания GigaIO объявила о заключении соглашения по созданию инфраструктуры для специализированного ИИ-облака TensorNODE, которое создаётся провайдером TensorWave. В составе платформы будут применяться ускорители AMD Instinct MI300X, оснащённые 192 Гбайт памяти HBM3. Основой TensorNODE послужат мини-кластеры SuperNODE, дебютировавшие летом уходящего года. Особенность этого решения заключается в том, что оно позволяет связать воедино 32 и даже 64 ускорителя посредством распределённого интерконнекта на базе PCI Express. TensorWave будет использовать FabreX для формирования пулов памяти петабайтного масштаба. На первом этапе в начале 2024 года платформа TensorNODE объединит до 5760 ускорителей Instinct MI300X в одном домене. Таким образом, при решении сложных задач можно будет получить доступ более чем к 1 Пбайт памяти с любого узла. Это, как отмечается, позволит обрабатывать даже самые ресурсоёмкие нагрузки в рекордно короткие сроки. ![]() Источник изображения: GigaIO В течение следующего года планируется развернуть несколько систем TensorNODE. Архитектура GigaIO обеспечит улучшенную гибкость по сравнению с традиционными решениями: инфраструктуру можно будет оптимизировать «на лету» для удовлетворения как текущих, так и будущих потребностей в области ИИ и больших языковых моделей (LLM). Отмечается, что TensorNODE полностью базируется на ключевых компонентах AMD. Помимо ускорителей Instinct MI300X, это процессоры EPYC Genoa. Облако TensorWave обеспечит снижение энергозатрат и общей стоимости владения благодаря исключению из конфигурации избыточных серверов и связанного с ними сетевого оборудования.
07.12.2023 [02:25], Владимир Мироненко
Российский рынок ЦОД продолжает расти, несмотря на санкции и трудностиКомпания iKS-Consulting опубликовала результаты исследования рынка коммерческих ЦОД в России. В нём отмечено, что пессимистические прогнозы экспертов подтвердились лишь частично, и отрасль ЦОД в России в 2022 году не снизила обороты, а прирастила число введенных стойко-мест на 10,8 % год к году. На конец исследуемого периода число стойко-мест в России составило 58,3 тыс. По итогам 2023 года ожидается прирост на 20,9 % — до 70,1 тыс. стойко-мест. После ухода из страны ведущих западных брендов и введения санкций привычную систему поставок оборудования через дистрибьюторов заменила система параллельного импорта с переходом на оборудование российских и китайских производителей, что привело к увеличению сроков поставок и необходимости вносить изменения в проекты. Вместе с тем сократились зарубежные инвестиции в строительство ЦОД, цикл возврата которых составляет до 10 лет, что привело к проблемам с поиском финансирования. «Несмотря на обозначенные проблемы, игроки рынка продолжают строить новые ЦОД», — отметили в iKS-Consulting. В 2023 году аналитики ожидают вывод на рынок колокации большого количества новых стойко-мест, в первую очередь рассчитанных на крупных клиентов — есть даже выделенные операторские залы на несколько сотен стойко-мест. Благодаря этому, как полагают в iKS-Consulting, в Московском регионе на ближайшие годы будет ликвидирован дефицит стойко-мест, наблюдавшийся последние годы. В исследовании также отмечено, что последние пять лет продолжается рост концентрации рынка с резким увеличением доли лидеров в 2020 году после слияния двух крупнейших российских коммерческих дата-центров – «Ростелеком-ЦОД» и DataLine. Этому также способствует более динамичный рост крупных дата-центров по сравнению с увеличением рынка ЦОД. В 2020–2022 гг. наблюдался рост количества слияний и поглощений. ![]() Доля ТОП-5 ЦОД на российском рынке (по количеству стойко-мест), % iKS-Consulting отмечает выход рынка коммерческих ЦОД в России на стадию зрелости и его рост в денежном выражении на 25 % на фоне всеобщей цифровизации. Аналитики также отметили рост интереса к рынку коммерческих ЦОД со стороны инвесторов, представляющих технопарки, девелоперские компании, предприятия промышленности и энергетики и обладающих компетенциями в определённых аспектах, связанных со спецификой своей деятельности и касающихся строительства ЦОД. Вместе с тем наблюдается нехватка высококвалифицированного персонала и команд по строительству и управлению ЦОД. Активное строительство новых дата-центров привело к дефициту опытных строителей и организаций, специализирующихся на проектировании, возведении и оснащении дата-центров, в связи чем высококлассные специалисты могут переходить из одного ЦОД в другой. Впрочем, рост рынка это не останавливает. ![]() Динамика подведённой электрической мощности коммерческих ЦОД в России По количеству введённых в эксплуатацию стойко-мест по-прежнему безусловным лидером является группа компаний «Ростелеком»/«РТК-ЦОД», на долю которой к концу 2022 года приходилось 15640 стойко-мест. При выполнении заявленных планов на конец 2023 года оператором будет введено 21,4 тыс. стойко-мест. На втором месте по результатам 2022 года была компания DataPro c долей 10,5 % (6131 стойко-место). Замыкала тройку лидеров компания IXcellerate с долей 9,3% (5443 стойко-места), но благодаря вводу новой площадки MOS 5 на территории южного кампуса она может в конце 2023 года выйти на вторую позицию. В 2021–2022 гг. аналитиками было отмечено резкое увеличение мощности благодаря открытию новых кампусов компаний IXcellerate, DataPro и других. В 2018–2020 гг. мощность коммерческих ЦОД увеличивалась на 40–55 МВт в год, но в ближайшие два–три года подведённая мощность будет увеличиваться на 110–130 МВт ежегодно. Лидерами по подведённой мощности являются дата-центры «Ростелеком-ЦОД» и IXcellerate с суммарной долей на рынке по этому показателю около 43%. На пятёрку лидеров, также включающую 3data, DataPro и МТС, приходится 62 % рынка. На протяжении последних двух лет правительством РФ было подготовлено несколько инициатив, связанных с поддержкой развития ЦОД. Как передаёт iKS-Consulting, участники рынка полагают, что реализация комплекса мер поддержки отрасли стимулирует внутренний спрос на инфраструктуру хранения и обработки данных и повысит инвестиционную привлекательность отрасли. При этом они надеются, что государство не будет усиливать регулирование отрасли, чтобы она и далее развивалась по рыночным законам.
06.12.2023 [23:26], Руслан Авдеев
Digital Edge тестирует робота-сопровождающего Nora в манильском ЦОД Narra 1Оператор дата-центров Digital Edge, действующий в азиатско-тихоокеанском регионе, проводит испытания специализированного робота в ЦОД Narra 1 в Маниле (Филиппины). Как сообщает Datacenter Dynamics, прототип предназначен для сопровождения клиента по территории объекта. По словам представителя компании, Nora используется для регистрации и своеобразного «эскорта» клиентов. Робот сопровождает посетитетелй до их серверных стоек. Поддерживается распознавание лиц для идентификации и голосовое управление. Считается, что благодаря роботу у персонала ЦОД освободится время для выполнения более сложных и насущных задач. Digital Edge и Threadborne анонсировали совместное строительство Narra 1 в 2021 году, а в этом году ЦОД начал работу. Объект рассчитан на 2200 стоек и 10 МВт мощности. ![]() Источник изображения: Digital Edge Судя по всему, Nora — это адаптированный робот Temi 3. Модель высотой около метра весит 12 кг и представляет собой «умного» робота-помощника, оснащённого многочисленными камерами, лидаром, микрофонами и динамиками, а также сенсорным дисплеем. Робот может передвигаться со скоростью до 1 м/с и способен проработать на одном заряде до восьми часов — зарядка осуществляется автономно, с помощью специальной док-станции. Это не единственный проект, предусматривающий использование роботов для автоматизации некоторых задач в ЦОД. Например, Digital Realty, Novva, Oracle, Kio и Scala применяют робособак для патрулирования и сбора данных. В NTT Data представили «торс на колёсах» с роботизированными руками. Модель применяется в 15 дата-центрах и может проверять уровень влажности, температуру и прочие показатели, а также выполнять несложные задания. Над собственным роботом работает и подразделение NTT Comms. |
|