Лента новостей
|
14.08.2024 [16:58], Руслан Авдеев
Nimbus Data превратила Tesla Cybertruck в мобильное All-Flash хранилище BatArrayКомпания Nimbus Data создала мобильное хранилище BatArray, представляющее собой комбинацию All-Flash СХД FlashRack Turbo с электромобилем Tesla Cybertruck. По словам компании, BatArray позволит продемонстрировать энергоэффективность решений Nimbus Data и преимущества аккумуляторных технологий Tesla — это новый способ решать задачи по обработке или хранению данных в эпоху ИИ. BatArray использует шесть 2U-систем FlashRack Turbo (глубина 21″), каждая из которых способна хранить 1,5 Пбайт, что суммарно даёт 9 Пбайт чистой ёмкости. Эффективная же ёмкость после компрессии и дедупликации может достигать 25 Пбайт. Кластер СХД запитан от розетки 240В/40А в кузове Cybertruck. Заряда таяговых АКБ хватит на 24 часа работы хранилища данных. Патентованная архитектура Parallel Memory Architecture позволяет BatArray принимать данные со скоростью до 360 Гбайт/с. Это втрое быстрее, чем могли обеспечить фуры AWS Snowmobile. Все данные автоматически шифруются с использованием AES-256 с поддержкой KIMP. Скорость выгрузки данных и вовсе достигает 600 Гбайт/с. В наилучшем случае целиком заполнить BatArray можно за 7 часов, при этом оставшегося заряда АКБ хватит на проезд более 300 км без подзарядки. А используя 400G-трансиверы с FR4-волокном можно связать BatArray с нужным объектом на расстоянии до 2 км. Двухконтроллерная СХД FlashRack Turbo поддерживает установку 24 NVMe SSD (PCIe 4.0) ёмкостью до 64 Тбайт, а также 512-Тбайт SSP (Solid State Pack). Пиковая производительность составляет до 100 Гбайт/с (блоки 1 Мбайт) и 10 млн IOPS (4K-блоки). СХД поддерживает NVMe-oF (TCP/RoCE), iSCSI, iSER, FCP, SRP, NFS, SMB, AFP, S3, WebDAV, FTP. Для связи с миром доступны порты 10/25/50/100/200/400GbE, InfiniBand EDR/HDR/NDR и FC32/64. Энергопотребление не превышает 1100 Вт.
14.08.2024 [14:51], Руслан Авдеев
Не было гвоздя: дефицит быстроразъёмных соединений для СЖО обошёлся Supermicro в $800 млн отложенной выручкиЛюбой производитель не застрахован от сбоя цепочки поставок небольших комплектующих, ведущих к значительным убыткам, иногда исчисляемым сотнями миллионов долларов. Как сообщает Tom’s Hardware, Supermicro не удалось вовремя получить достаточное количество быстроразъёмных соединений для систем жидкостного охлаждения (СЖО), из-за чего произошла задержка поставок готовой продукции покупателям. В результате сформировалась «отложенная выручка» в размере $800 млн, которую пришлось перенести с одного квартала на другой. СЖО чрезвычайно важны для ИИ-серверов и обычно состоят из нескольких компонентов, объединяемых быстроразъёмными соединениями. Такие разъёмы могут подтекать, поэтому их качество имеет ключевое значение. Из-за высокого спроса на ИИ-серверы спрос на соединения тоже вырос. Их цена уже поднялась с $40 до $60, причём потенциальные покупатели готовы переплачивать ещё больше, лишь бы забронировать поставки. Рынок быстроразъёмных соединителей контролируется семью компаниями, в том числе двумя китайскими, попавшими под санкции США, что только усугубляет глобальный дефицит. Тайваньские производители Global Tek, Fositek и Lotes охотно пользуются ситуацией, наращивая и ускоряя производство и сертификацию соответствующих продуктов — это поможет заполнить «пустоту» от ухода попавших под санкции китайских компаний. Global Tek активно работает с партнёрами на своих заводах, образцы уже проходят тестирование. Компания рассчитывает, что выручка от этих проектов начнёт поступать уже в IV квартале 2024 года. Спрос на СЖО действительно высок и ожидается, что к 2028 году они займут треть рынка систем охлаждения для дата-центров. При этом уже поступают рекламации — не исключено, что поставки суперускорителей NVIDIA GB200 могут задержаться из-за протечек вспомогательной «фурнитуры» систем жидкостного охлаждения.
14.08.2024 [12:33], Руслан Авдеев
Создание ЦОД при Кольской АЭС оценили в 1,4 млрд рублей — в ценах 2022 годаРуководство Кольской АЭС, расположенной в Мурманской области, оценило инвестиции в строительство дата-центра на территории станции в 1,4 млрд руб. Как сообщает «Интерфакс» со ссылкой на главу АЭС Василия Омельчука, вложения в ЦОД «Арктика» рассчитаны в ценах 2022 года с учётом НДС. К концу года дата-центр уже собираются ввести в эксплуатацию. По его словам, блочно-модульный объект вместит 48 стоек, ёмкость составляет порядка 1 МВт. Структура нового дата-центра позволяет довольно легко масштабировать проект. Как заявил Омельчук, при наличии клиентов, нуждающихся в обработке информации, руководство АЭС готово довольно быстро нарастить ёмкость ЦОД. Дата-центр предполагалось ввести в эксплуатацию ещё в 2023 году, но позже сроки пришлось перенести. Предполагается, что новый дата-центр обеспечит базовой инфраструктурой клиентов, намеренных использовать высоконагруженные цифровые платформы и сервисы для Северного морского пути. В сферу доступности вычислительных ресурсов попадает и Арктическая зона в целом.
Источник изображения: «Росэнергоатом» По задумке создателей ЦОД, вычислительные мощности на севере страны могут быть использованы для организации логистики, управления «умными городами», для поддержки туризма в регионе и развития других сфер деятельности на прилежащей территории. В конце 2022 года «Ростелеком» запустил первый коммерческий дата-центр в арктической зоне России, в Мурманске.
13.08.2024 [20:33], Владимир Мироненко
Huawei готовит к выпуску ИИ-ускоритель Ascend 910C, конкурента NVIDIA H100Huawei Technologies вскоре представит новый ИИ-ускоритель Ascend 910C, сопоставимый по производительности с NVIDIA H100, сообщила газета The Wall Street Journal со ссылкой на информированные источники. По их словам, китайские интернет-компании и операторы в последние недели тестировали этот чип и в настоящее время ByteDance (материнская компания TikTok), поисковик Baidu и государственный оператор связи China Mobile ведут переговоры по поводу его поставок. Судя по озвученным цифрам, заказы могут превысить 70 тыс. шт. на общую сумму около $2 млрд. Huawei намерена начать поставки уже в октябре, сообщили источники, но компания не стала комментировать эти сообщения. Huawei была включена в «чёрный» список Entity List Министерства торговли США в 2019 году, что лишило её возможности производить закупки передовых чипов и оборудования для их выпуска, а также размещать заказы на производство микросхем за пределами Поднебесной. Однако благодаря многомиллиардной государственной поддержке компания стала национальным лидером во многих областях, включая ИИ, и ключевой частью усилий Пекина по «удалению» американских технологий, отметила WSJ. При этом Китай наращивает поддержку отечественного производства полупроводников и в мае выделил $48 млрд в рамках третьего транша национального инвестиционного фонда для этой отрасли.
Источник изображения: huaweicentral.com Из-за санкций США китайским клиентам NVIDIA приходится довольствоваться ИИ-ускорителем H20, разработанным специально для Китая с учётом экспортных ограничений Министерства торговли США, в то время как американские клиенты NVIDIA, такие, как OpenAI, Amazon и Google, вскоре получат доступ к гораздо более производительным чипам, включая GB200. NVIDIA также готовит для Китая чип B20, хотя есть опасения, что и он может попасть под новые ограничения США. По оценкам аналитиков SemiAnalysis, 910C может быть даже лучше, чем B20, и если Huawei сможет наладить выпуск нового чипа, а NVIDIA по-прежнему не сможет продавать китайским клиентам передовые ускорители, то у последней все шансы быстро потерять долю рынка в стране. Согласно подсчётам SemiAnalysis, в 2025 году Huawei может произвести 1,3–1,4 млн ускорителей 910C, если не столкнётся с дополнительными ограничениями США. Аналитики ожидают, что NVIDIA продаст более 1 млн H20 в Китае в этом году на сумму около $12 млрд, т.е. в штучном выражении примерно вдове больше, чем Huawei 910B. По словам источников, в последние недели Huawei начала накапливать запасы HBM-чипов, используемых в ИИ-ускорителях, в связи с опасениями ввода США новых экспортных ограничений. На прошедшей в июне конференции, посвящённой полупроводниковой промышленности, представитель руководства Huawei сообщил, что почти половина больших языковых моделей (LLM), созданных в Китае, была обучена с помощью ускорителей компании. Он также отметил, что в этих задачах 910B превосходит по производительности NVIDIA A100.
13.08.2024 [18:43], Руслан Авдеев
Huawei Cloud построила сетевой монитор, способный быстро найти отдельный неисправный чип в целом ЦОДВ Huawei Cloud разработали собственный сверхточный инструмент сетевого мониторинга RD-Probe для обслуживания для своих облачных регионов. По данным The Register, он способен выявить проблемы, которые человек заметить не способен. В докладе Huawei и представители Пекинского университета ссылаются на данные Amazon: лишь внутри одного облачного региона AWS имеется 1087 возможных путей передачи данных и 10176 — между регионами. В ЦОД Huawei Cloud используются более 100 тыс. коммутаторов и миллион серверов. Мониторинг всей этой инфраструктуры является чрезвычайно сложной задачей. RD-Probe отслеживает состояние всех L2-портов во всей сетевой фабрике. Исследователи отмечают, что традиционно осуществляется именно мониторинг L3, что не даёт полной картины состояния сети. При этом инструмент Huawei воспринимает коммутаторы как «чёрные ящики» и не полагается исключительно на их внутреннюю телеметрию, благодаря чему легко интегрируется с уже существующей архитектурой системы мониторинга. Инструмент сначала проводит зондирование случайным образом, потом — детерминированным. Подобная двухэтапная схема обеспечивает максимальное покрытие сети при проверках и вместе с тем не нагружает её. Для генерации трафика выделен кластер из 16 узлов, каждый из которых имеет неназванный восьмиядерный процессор с частотой 2,80 ГГц и 64 Гбайт оперативной памяти. Полученные данные в потоковом режиме обрабатывают 48 узлов (16-ядерный CPU и 32 Гбайт RAM). Через месяц после начала использования RD-Probe в Huawei Cloud было найдено множество незамеченных ранее проблем. Конечно, большинство касалось небольших сбоев и эпизодических потерь пакетов, зато выявили их до того, как могли серьёзно пострадать пользователи. Например, инструмент помог определить сбойный чип в коммутаторе ядра сети, из-за которого периодически отбрасывался входящий трафик, но при этом отчёты об ошибках не генерировались. Также была выявлена ошибка в балансировке нагрузки, сбойное SerDes-подключение и проблема с некоторыми BGP-маршрутами. Исследователи Huawei выразили удовлетворение тем, что RD-Probe улучшило покрытие мониторингом сети с 80,9 % до 99,5 %. В скором времени решение планируется применить в других облачных регионах Huawei. При этом авторы доклада подчёркивают, что RD-Probe оценивает только внутренний трафик и не может фильтровать сбои на серверной стороне. Отмечается, что ручной мониторинг не даёт таких хороших результатов.
13.08.2024 [15:45], Руслан Авдеев
Малые ЦОД Китая оказались под угрозой исчезновения из-за новой энергетической политики властейКитайские власти объявили местным провайдерам цифровой инфраструктуры о необходимости снизить выбросы углекислого газа. Кроме того, сообщает The Register, предлагается рассмотреть отказ от использования мелких объектов в рамках «комплексного зелёного перехода». В планах, подготовленных Госсоветом КНР, предполагается, что к 2030 году Китай достигнет «заметных результатов» в процессе «зелёного перехода» во всех сферах социального и экономического развития. К 2035 году «зелёная, низкоуглеродная и циклическая экономическая система развития» должна быть в основном сформирована. Новая политика предусматривает использование цифровых технологий для достижения поставленных целей, поэтому всем отраслям предлагается использовать облачные сервисы и анализировать свои показатели в контексте энергоэффективности операций.
Источник изображения: Luke Stackpoole/unsplash.com Власти на местах должны будут продвигать строительство «зелёной» и низкоуглеродной цифровой инфраструктуры, способствовать внедрению энергосберегающих технологий и экомодернизации уже существующих предприятий, параллельно избавляясь от маленьких, старых и разрозненных объектов. Сообщается, что Китай уже переносит 5 млн серверных стоек из старых ЦОД в новые кампусы, питающиеся от источников возобновляемой энергии. Другими словами, Пекин хочет от операторов дата-центров оптимизации использования электроэнергии. В Китае также хотят, чтобы на национальные системы занимались мониторингом экологических загрязнений и опасных природных явлений, а также выпускали «активные предупреждения» для принятия оптимальных решений. Также предлагается создать настоящую «трёхмерную» модель Китая (фактически цифрового двойника) и расширять возможности «обработки пространственно-временной информации». К 2030 году около 25 % энергопоставок в стране должно осуществляться из источников энергии, работающих на «неископаемом» топливе — с помощью ветряных, солнечных и атомных электростанций, а также ГЭС. Кроме того, энергию рекомендуется добывать из «новых источников» вроде водорода, биомассы, геотермальных источников и с помощью энергии моря. Немалая роль отводится и ГАЭС. В докладе Global Electricity Review 2024 агентства Ember Climate эксперты указали, что в 2023 году вклад Китая в источники новой энергии составил более 50 % от общемировой ёмкости. Ожидалось, что эта доля будет ещё выше, но прошлый год оказался в КНР менее солнечным, чем прогнозировалось, а генерация ГЭС несколько уменьшилась. Впрочем, прибавка в выработке угольных станций в 2023 году оказалась больше (319 ТВт∙ч), чем у солнечных и ветряных (280 ТВт∙ч). В докладе госсовета признаётся, что баланс энергетической структуры по-прежнему смещён в сторону угля и ископаемое топливо всё ещё пользуется в стране большим спросом. Для достижения «зелёных» целей Китай будет финансировать производство экобезопасных продуктов, особенно электромобилей. Предполагается и продвижение электротранспорта и прочей техники в сельской местности, где «зелёная» идея ещё не получила всеобщего признания. Предусмотрены и иные финансовые инструменты для дальнейшего продвижения «зелёной» повестки.
13.08.2024 [13:33], Руслан Авдеев
SK Telecom и Nokia с помощью ИИ превратят коммерческие оптоволоконные сети в гигантские сенсорыSK Telecom (SKT) и Nokia договорились о разработке «чувствительных» оптоволоконных сетей. Технология будет использовать ИИ для мониторинга окружающей среды вокруг кабелей. На первом этапе компании намерены собрать с использованием машинного обучения данные с коммерческой сети SKT. Систему планируется использовать для распознавания землетрясений, климатических изменений и прочих ситуаций, например, инцидентов на близлежащих стройках. К концу года планируется внедрение технологии на территории всей Южной Кореи. Прохождение сигнала по оптоволокну может меняться под влиянием различных факторов, включая перепады температуры, вибрации и т.д. На основе технологии, предусматривающей применение ИИ, SKT и Nokia намерены добиться более стабильной работы оптоволоконных сетей, изучая воздействие погодных условий и даже близлежащих строительных объектов на кабели. При этом никакой модификации самих кабелей не требуется, так что систему мониторинга можно быстро развернуть на существующей инфраструктуре. Идея использования ВОЛС в качестве сенсоров далеко не нова. Такие системы нередко используются в охранных целях, правда, в этом случае речи о передачи данных обычно не идёт. Но операторы пытаются найти новые применения своим сетям. В ноябре появилась новость об использовании кабелей в Японии для оценки снежного покрова, Güralp проложила в водах близ Италии кабель SMART для мониторинга сейсмической активности, а SMART-кабель TAM TAM между Новой Каледонией и Вануату предупредит о землетрясениях и цунами.
13.08.2024 [11:19], Сергей Карасёв
MSI представила сервер S2301 с поддержкой CXL на базе AMD EPYC TurinКомпания MSI в ходе выставки Future of Memory and Storage 2024 (FMS) анонсировала сервер S2301, предназначенный для работы с резидентными базами данных, НРС-приложениями, платформами для автоматизации проектирования электроники (EDA) и пр. Сервер поддерживает стандарт CXL 2.0 на основе интерфейса PCIe. Технология обеспечивает высокоскоростную передачу данных с малой задержкой между хост-процессором и такими устройствами, как серверные ускорители, буферы памяти и интеллектуальные IO-блоки. На основе CXL 2.0 функционирует высокопроизводительный механизм доступа к памяти, который позволяет модулям расширения напрямую взаимодействовать с иерархией памяти CPU. При этом дополнительные блоки памяти работают так, как если бы они были частью собственной памяти системы. Подключив к серверу модули расширения CXL, можно с высокой эффективностью масштабировать ресурсы для обработки сложных задач. Сервер MSI S2301 поддерживает установку двух процессоров AMD EPYC поколения Turin. Доступны 24 слота для модулей ОЗУ. Возможно применение CXL-модулей в форм-факторе E3.S 2T (PCIe 5.0 x8). Такие решения, в частности, в августе 2023 года представила компания Micron Technology. Устройства имеют вместимость 128 и 256 Гбайт. Кроме того, память DRAM с поддержкой CXL 2.0 предлагает Samsung. Во фронтальной части нового сервера располагаются отсеки для SFF-модулей. Говорится об использовании софта Memory Machine X разработки MemVerge, который оптимизирует затраты и помогает улучшить производительность ИИ-приложений и других ресурсоёмких рабочих нагрузок путём интеллектуального управления памятью.
13.08.2024 [01:00], Владимир Мироненко
CMR, 10 Тбайт и воздух: Toshiba представила обновлённую версию жёстких дисков S300 Pro SurveillanceКомпания Toshiba анонсировала обновление серии жёстких дисков S300 Pro Surveillance, предназначенных для систем видеонаблюдения. Эти LFF-накопители ёмкостью до 10 Тбайт поддерживает технологию традиционной магнитной записи (CMR) и заполнены воздухом. Новинки позволяют записывать, хранить и анализировать видеопотоки с 64 HD-камер. Кроме того, они отличаются энергоэффективностью, говорится в пресс-релизе. S300 Pro 2020 года выпуска имеет объём буфера 256 Мбайт и максимальную постоянную скорость передачи данных 248 Мбайт/с. Обновлённый диск S300 Pro получил буфер в 512 МиБ (537 Мбайт) и максимальную скорость передачи данных на 13,3 % выше — до 281 Мбайт/с. Допустимая нагрузка также выросла — со 180 Тбайт/год до 300 Тбайт/год. Также обновлённый S300 поддерживает 600 000 циклов парковки, а показатель MTBF составляет 1,2 млн часов. S300 Pro выпускается в версиях ёмкостью 4, 6, 8 и 10 Тбайт. Они по-прежнему используют интерфейс SATA-3, а их частота вращения шпинделя составляет 7200 об/мин. Количество поддерживаемых дисковых отсеков — до 24. Стандартная гарантия составляет три года. «Специально оптимизированные для крупномасштабных операций видеонаблюдения, где расширенная видеоаналитика, отслеживание лиц и редактирование являются критически важными функциями, жёсткие диски Toshiba S300 Pro следующего поколения обеспечивают повышенную производительность, долговечность и круглосуточную надёжность», — заявил президент подразделения Storage Products Division компании Toshiba Electronics Components Taiwan Corporation.
12.08.2024 [21:30], Руслан Авдеев
CrowdStrike позволит более гибко управлять обновлениями Falcon Sensor, которые стали причиной сбоя миллионов Windows-системКомпания CrowdStrike, ставшая главной виновницей недавнего сбоя ОС Windows на более 8,5 млн компьютеров, решила изменить политику обновления своего ПО. По информации Dark Reading, против компании уже поданы два коллективных иска, так что она планирует существенно пересмотреть процесс подготовки и массового развёртывания апдейтов. Чтобы не повторять ошибок прошлого, компания пообещала сформировать новую процедуру тестирования контента, введение дополнительных этапов внедрения ПО и новых проверок его надёжности, а также новые механизмы валидации обновлений. CrowdStrike также попросила двух сторонних вендоров проанализировать её ПО Falcon Sensor, ставшее причиной инцидента. Кроме того, они должны оценить систему контроля качества и механизм выпуска релизов продуктов. Проблемы CrowdStrike, Microsoft и миллионов пользователей по всему миру начались 19 июля, после выпуска обновления Falcon. Автоматически развёрнутое обновление вызвало сбой ОС по всему миру. Во многих случаях системным администраторам приходилось вручную перезагружать компьютеры, в том числе прибегая к необычным трюкам — в компаниях с большим парком ПК на восстановление ушли дни. Против CrowdStrike уже подано не менее двух коллективных исков, от имени акционеров компании и со стороны пострадавших заказчиков. Особенно агрессивную позицию занимает Delta Air Lines, потерявшая, по её словам, полмиллиарда долларов — эта и другие компании могут подать собственные иски в скором времени, несмотря на оправдания CrowdStrike и Microsoft. Причина сбоя оказалась в недостаточно качественном тестировании системы обновлений для Falcon Sensor. Изменения в ней были сделаны ещё в феврале 2024 года, но аудит показал, что они успешно прошли автоматическую валидацию и многоступенчатое тестирование, хотя этого не должно было произойти. Причём проблема не дала о себе знать даже во время ограниченных тестов на реальных пользователях. |
|
