Лента новостей

16.03.2024 [21:46], Сергей Карасёв

Великобритания рассчитывает снизить стоимость ИИ-инфраструктур в 1000 раз

Агентство перспективных исследований и инноваций Великобритании (ARIA), по сообщению Datacenter Dynamics, инициировало проект стоимостью приблизительно $53,5 млн, целью которого является «переосмысление парадигмы вычислений». Учёные рассчитывают разработать новые технологии и архитектуры, которые позволят снизить стоимость ИИ-инфраструктур в 1000 раз по сравнению с сегодняшними системами.

Стремительный рост востребованности ИИ-приложений и НРС-решений приводит к резкому увеличению нагрузки на дата-центры. Это вынуждает операторов и гиперскейлеров закупать мощные дорогостоящие ускорители, которые оказываются в дефиците. Одновременно растут энергозатраты ЦОД. По оценкам, на дата-центры приходится до 1,5 % мирового потребления электроэнергии и 1 % глобальных выбросов CO2.

 Источник изображения: pixabay.com

Источник изображения: pixabay.com

Компании по всему миру предпринимают различные меры по решению проблемы, включая внедрение СЖО и разработку принципиально новых сверхэффекттивных ИИ-чипов. Проект ARIA в данной сфере получил название Scaling Compute — AI at 1/1000th the cost, или «Масштабирование вычислений — ИИ за 1/1000 стоимости». Руководитель проекта Сурадж Брамхавар (Suraj Bramhavar) говорит, что на протяжении более чем 60 лет человечество «извлекало выгоду из экспоненциального увеличения вычислительной мощности при уменьшении затрат».

Но, по его словам, такой подход больше не соответствует современным реалиям — особенно в свете повсеместного внедрения ресурсоёмких приложений ИИ. Брамхавар говорит, что специализированные решения, используемые для обучения масштабных ИИ-моделей, невероятно дороги, что может иметь далеко идущие экономические, геополитические и социальные последствия. Например, генеральный директор OpenAI Сэм Альтман ранее заявлял, что обучение GPT-4 обошлось его компании более чем в $100 млн.

В рамках нового проекта ARIA будет оказывать финансовую поддержку научным коллективам и компаниям, разрабатывающим перспективные технологии, которые в дальнейшем помогут снизить стоимость ИИ-инфраструктур на порядки. Речь идёт о решениях, сочетающих высокое быстродействие, эффективность и простоту производства. «Природа предоставляет нам, по крайней мере, одно доказательство того, что фундаментально возможно выполнять сложную обработку информации с высокой эффективностью», — отмечает Брамхавар, имея в виду человеческий мозг.

Постоянный URL: https://servernews.ru/1101825
16.03.2024 [20:57], Руслан Авдеев

Сбой в работе подводных кабелей вновь вызвал перебои с интернетом в Африке

Нарушение работы четырёх подводных кабелей к западу от побережья Африки привело к перебоям с интернетом на всём континенте. По данным Bloomberg, кабели West Africa Cable System, MainOne, South Atlantic 3 и ACE пострадали в четверг или пятницу, что сказалось на работе местных мобильных операторов и интернет-провайдеров. Причина до сих пор не установлена.

В первую очередь пострадал запад Африки, больше всего — Кот-д'Ивуар, Либерия и Бенин. Критические проблемы возникли и в Гане, Нигерии и Камеруне. Появились сообщения и о перебоях со связью в Южной Африке. По другим данным, связь обрывалась также в Сенегале и Португалии, из-за чего телеком-операторам пришлось потрудиться над восстановлением работоспособности сетей. В прошлом году West African Cable System наряду с South Atlantic 3 пострадали после подводного оползня. На ремонт повреждённой инфраструктуры ушло около месяца.

 Источник изображения:  Ryan O'Shea/unsplash.com

Источник изображения: Ryan O'Shea/unsplash.com

Примечательно, что не прошло и месяца с тех пор, как три оптоволоконных кабеля оборвали в Красном море, предположительно якорем повреждённого грузового судна. Акватория Красного моря является критически важным маршрутом для телекоммуникационных магистралей, связывающих Европу с Азией и Африкой. Из-за обрыва трафик пришлось направить по другим маршрутам, в том числе вдоль западного африканского побережья. Проблемы со связью в любой части континента означают рост нагрузки на оставшуюся инфраструктуру.

Крупнейшие в Африке операторы беспроводной связи MTN Group Ltd. и Vodacom Group Ltd. заявили, что сбои в работе подводных кабелей негативно сказались на качестве услуг. Vodacom сообщала, что проблемы связи Африки с Европой сохраняются, в том числе и у других бизнесов. Например, Microsoft объявила о перебоях в работе облачных сервисов, включая Microsoft 365, причём речь идёт не только о западном, но и о восточном побережье Африки. Пострадал и островной Маврикий, местной Mauritius Telecom Ltd. тоже пришлось перенаправлять трафик.

Постоянный URL: https://servernews.ru/1101824
16.03.2024 [20:48], Сергей Карасёв

Firefly представила индустриальный модуль Core-3562JQ на платформе Rockchip с расширенными температурным диапазоном

Команда Firefly, по сообщению ресурса CNX-Software, подготовила к выпуску вычислительный модуль (SoM) Core-3562JQ на платформе Rockchip, предназначенный для построения индустриальных и коммерческих устройств. Это могут быть контроллеры, терминалы, оборудование для сферы здравоохранения и пр.

Применён процессор RK3562J, объединяющий четыре ядра Arm Cortex-A53 с частотой до 1,2 ГГц и графический ускоритель Arm Mali-G52 EE с поддержкой OpenGL ES 3.2, Vulkan 1.1, OpenCL 2.0. Блок VPU способен справляться с декодированием видео 4Kp30 H.364, H.264, VP9, а также кодированием материалов 1080p60 H.264.

 Источник изображения: Firefly

Источник изображения: Firefly

Объём оперативной памяти LPDDR4(x) может составлять 2, 4 и 8 Гбайт, вместимость флеш-модуля eMMC — 16, 32 и 64 Гбайт. Предусмотрены три 80-контактные колодки ВTВ (board-to-board). Поддерживаются видеовыходы LVDS (до 1280 × 800 точек; 60 Гц), MIPI-DSI (до 2048 × 1080 пикселей; 60 Гц) и RGB (до 2048 × 1080 точек; 60 Гц), а также входы 2 × MIPI CSI (4 линии) или 4 × MIPI CSI (2 линии) или 1 × MIPI CSI (4 линии) + 2 × MIPI CSI (2 линии).

Среди прочих интерфейсов упомянуты: S/PDIF, PDM, 2 × DAC (I2S/PCM), 100MbE и 1GbE, SDIO (Wi-Fi и Bluetooth; хранение), USB 3.0 OTG / PCIe 2.1 х1, 2 × USB 2.0, 5 × I2C, 10 × UART, 2 × CAN, 3 × SPI, 13 × ADC, 16 × PWM, 1 × SD/MMC.

Размеры составляют 60 × 36 мм, масса — 12 г. Диапазон рабочих температур простирается от -40 до +85 °C. Требуется питание 5 В, а энергопотребление не превышает 3 Вт. Разработчик подготовил образы Ubuntu, Debian и Linux Buildroot+Qt.

Постоянный URL: https://servernews.ru/1101836
16.03.2024 [20:45], Сергей Карасёв

Объём мирового рынка телеком-оборудования в 2023 году пошёл на спад, что не помешало Huawei укрепить своё лидерство

Аналитическая компания Dell’Oro Group опубликовала результаты исследования глобального рынка телекоммуникационного оборудования в 2023 году. Отмечается, что после пяти с половиной лет роста отрасль пошла на спад во II половине года. В результате объём отрасли по итогам 2023-го в целом сократился приблизительно на 5 %.

Dell'Oro Group учитывает затраты по шести ключевым направлениям. Это решения для организации широкополосного доступа, микроволновых линий, оптических сетей, мобильных базовых сетей (MCN) и сетей радиодоступа (RAN), а также коммутаторы и маршрутизаторы для сервис-провайдеров.

 Источник изображения: Dell’Oro Group

Источник изображения: Dell’Oro Group

Аналитики говорят, что результаты 2023 года оказались хуже прогнозов. К падению доходов, в частности, привело более медленное, чем ожидалось, развёртывание сетей 5G с автономной архитектурой (5G SA). Кроме того, после двух лет значительных инвестиций в PON операторы сократили капитальные затраты на расширение широкополосных каналов для домохозяйств.

С региональной точки зрения зафиксирован значительный спад в Северной Америке. Без учёта этого региона весь остальной рынок продемонстрировал рост по итогам 2023 года. Негативное влияние на отрасль продолжают оказывать последствия пандемии COVID-19, из-за которой пострадали цепочки поставок. Плюс к этому на продажи отрицательно воздействуют макроэкономические факторы, высокий уровень инфляции и колебания курсов валют.

Huawei, несмотря на санкции со стороны США, по-прежнему сохраняет свои позиции мирового лидера в области телекоммуникационного оборудования. Доля этой китайской компании в 2023 году достигла 30 % против 28 % годом ранее. На втором месте находится Nokia, которая контролирует 15 % мирового рынка (как и годом ранее). Замыкает тройку Ericsson, чья доля сократилась с 14 % в 2022 году до 13 % в 2023-м. Затем идут ZTE и Cisco с результатом 11 % и 6 %.

Постоянный URL: https://servernews.ru/1101823
16.03.2024 [20:37], Сергей Карасёв

Плата NVMe Base Duo позволяет наделить Raspberry Pi 5 двумя SSD формата М.2

Компания Pimoroni выпустила плату расширения NVMe Base Duo для мини-компьютера Raspberry Pi 5, дебютировавшего в сентябре 2023 года. Новый аксессуар поддерживает установку двух накопителей NVMe SSD, благодаря чему можно построить компактный файловый сервер, мультимедийный центр, обратный прокси-сервер и пр.

NVMe Base Duo содержит два коннектора для SSD формата М.2 2230/2242/2260/2280 с интерфейсом PCIe. Для подключения платы расширения к Raspberry Pi 5 служит гибкий кабель PCIe Flex, который входит в комплект поставки наряду с необходимыми крепёжными элементами и прорезиненными ножками.

 Источник изображений: Pimoroni

Источник изображений: Pimoroni

Говорится о совместимости с широким списком накопителей различных производителей, включая такие изделия, как ADATA Legend 700/800, XPG SX8200 Pro, Crucial P2/Р3, Kingston KC3000, Kioxia Exceria NVMe и Kioxia Exceria G2 NVMe, Lexar NM620/NM710, Netac NV2000/NV3000, PNY CS1030, Sabrent Rocket 4.0 и Sabrent Rocket Nano, Samsung 980/Samsung 980 Pro и Western Digital Black SN750 SE. Могут применяться решения вместимостью 250 Гбайт, 500 Гбайт и более.

Обмен данными осуществляется посредством PCIe 2.0 x1. Как утверждает Pimoroni, общая пропускная способность составляет около 450 Мбайт/с, или немногим более 220 Мбайт/с на каждый из двух SSD в случае одновременного доступа. Плату NVMe Base Duo можно закрепить над или под Raspberry Pi 5.

Стоимость аксессуара составляет £30 (приблизительно $38). За £92 (около $117) можно прибрести комплект с двумя накопителями М.2 ёмкостью 250 Гбайт каждый, а набор с парой SSD на 500 Гбайт обойдётся в £116 (≈$148).

Постоянный URL: https://servernews.ru/1101822
15.03.2024 [23:27], Сергей Карасёв

Миссии NASA задерживаются из-за устаревших и перегруженных суперкомпьютеров

HPC-инфраструктура NASA нуждается в серьёзной модернизации, поскольку в текущем виде не в состоянии удовлетворить потребности организаций в составе национального управления по аэронавтике и исследованию космического пространства США. К такому выводу, как сообщает The Register, пришло в ходе аудита Управление генерального инспектора.

Отмечается, что НРС-инфраструктура NASA морально устарела и не в состоянии эффективно поддерживать современные рабочие нагрузки. Например, в Центре передовых суперкомпьютеров NASA задействованы 18 тыс. CPU и только 48 ускорителей на базе GPU.

 Источник изображения: NASA

Источник изображения: NASA

Кроме того, текущих вычислительных мощностей не хватает для всех потребителей. Поэтому некоторые отделы и научные центры NASA вынуждены закупать собственное оборудование и формировать локальную НРС-инфраструктуру. В частности, одна только команда Space Launch System ежегодно тратит на эти цели $250 тыс. вместо того, чтобы подключаться к централизованной системе. Фактически каждое структурное подразделение NASA, за исключением Центра космических полетов Годдарда и Космического центра Стенниса, имеет собственную независимую вычислительную инфраструктуру.

Ещё одной причиной развёртывания локальных мощностей является путаница вокруг облачных ресурсов и политики NASA, из-за которой возникают сложности с планированием и оценкой финансовых затрат. Аудит также показал, что есть вопросы к безопасности суперкомпьютерного парка NASA. Например, нет должного мониторинга некоторых систем, доступ к которым имеют иностранные пользователи.

В целом, наблюдающаяся картина приводит к задержкам в реализации космических миссий и дополнительным расходам. Для устранения недостатков руководству NASA рекомендовано провести комплексную реформу НРС-сектора, включающую инвентаризацию активов, выявление технологических пробелов и киберрисков. Необходимо также разработать стратегию по улучшению распределения имеющихся вычислительных мощностей.

Постоянный URL: https://servernews.ru/1101790
15.03.2024 [23:18], Владимир Мироненко

«DатаРу» запустила направление «DатаРу Облако»

Российская компания «DатаРу» объявила о запуске нового направления под названием «DатаРу Облако», благодаря чему клиенты получат доступ к популярным облачным сервисам, в том числе PaaS и SaaS на базе собственных аппаратных и комплексных решений DатаРу.

Новое направление обеспечит заказчикам доступ к ряду облачных сервисов, включая публичное облако, частное облако и гибридные инфраструктурные решения. Планы команды «DатаРу Облако» включают развитие линейки PaaS и SaaS собственной разработки на базе собственного же оборудования и решений.

 Источник изображения: «DатаРу»

Источник изображения: «DатаРу»

В «DатаРу» рассчитывают, что облачные продукты будут востребованы со стороны enterprise-сегмента, представителям которого необходим переход на технологически независимую ИТ-инфраструктуру в кратчайшие сроки. Глава «DатаРу» отметил, что компания продолжает развивать новые направления бизнеса. Команда её специалистов располагает всем необходимым для предоставления заказчикам облачных решений — от собственного производства оборудования до предоставления глубокой экспертизы в работе с прикладными системами.

Постоянный URL: https://servernews.ru/1101806
15.03.2024 [23:15], Владимир Мироненко

Amazon и Microsoft заблокируют 20 марта облачные сервисы для клиентов из России

Microsoft разослала клиентам в России уведомление о том, что 20 марта прекратит подписки «на определённое программное обеспечение для управления или проектирования (включая облачные решения) для организаций, зарегистрированных в России», сообщила в своём Telegram-канале вице-президент по инвестициям Softline Елена Волотовская. По факту это может означать полное отключение доступа к облачным решениям, отметила она, добавив, что аналогичные уведомления получили российские клиенты Amazon.

 Источник: t.me/volotovskayaelena

Источник: t.me/volotovskayaelena

В письме Microsoft сообщается, что решение было принято в связи со вступлением с 20 марта в силу санкций ЕС в отношении России. «Microsoft должна прекратить действие этих подписок к 20 марта 2024 года, до будущих указаний ЕС, которые изменят это решение, или общего или специального разрешения от регулирующих органов ЕС. После 20 марта 2024 года вы не сможете получить доступ к этим продуктам или услугам Microsoft, а также к любым данным, хранящимся в них», — указано в документе.

 Источник изображения: ГК Softline

Источник изображения: ГК Softline

В связи с этим компания Softline рекомендовала российским компаниям, которые до сих пор пользуются услугами этих компаний, в оперативном порядке сделать резервное копирование данных со всех облачных сервисов Microsoft, Amazon и Google, в т.ч. на местах пользователя. Компания также создала информационный канал, где заказчики иностранных облачных решений смогут найти ответы и оперативно проконсультироваться по проблемам, которые могут возникнуть с 20 марта 2024 года.

Некоторые другие игроки оперативно отреагировали на сложившуюся ситуацию. Так, в TrueConf сообщили о решении открыть горячую линию и начать предоставлять бесплатные лицензии на сервер ВКС и корпоративный мессенджер TrueConf Server всем организациям, срочно ищущим замену решениям Microsoft Teams и Skype for Business. Похожее предложение есть и у DION.

UPD 16.03.2024: появились уточнения относительно того, что будет заблокировано Microsoft — Azure (в том числе Azure Stack) и все компоненты Microsoft 365. Кроме того, возможна деактивация развёрнутых локально Microsoft Office, SQL Server, BizTalk Server, System Center, Visual Studio. Windows Server и клиентские Windows, вероятно, затронуты не будут.

Постоянный URL: https://servernews.ru/1101812
15.03.2024 [22:50], Сергей Карасёв

Zotac анонсировала GPU-серверы с поддержкой до 10 ускорителей

Компания Zotac объявила о выходе на рынок оборудования корпоративного класса: дебютировали рабочие станции Bolt Tower Workstation башенного типа, а также стоечные GPU-серверы типоразмера 4U и 8U. Устройства рассчитаны на визуализацию данных, обучение ИИ-моделей, моделирование и пр.

Новинки получили модульный дизайн, что облегчает замену или установку дополнительных компонентов. Говорится о поддержке различных дистрибутивов Linux корпоративного уровня, включая Red Hat Enterprise Linux, SUSE Linux Enterprise Server, Ubuntu.

 Источник изображений: Zotac

Источник изображений: Zotac

Продукты разделены на три категории: Essential, Advanced и Premier. В первую входят башенные рабочие станции и серверы 4U, ориентированные на системных интеграторов и предприятия, которым требуется оборудование с оптимальным соотношением цены и производительности. Возможна установка процессоров Intel Xeon Sapphire Rapids и Xeon Emerald Rapids. Системы Bolt Tower Workstation могут нести на борту материнскую плату типоразмера ATX/E-ATX/Micro-ATX/EBB и два блока питания. Возможно развёртывание жидкостного охлаждения.

В серию Advanced включены 4U-серверы для более ресурсоёмких приложений. В зависимости от модификации допускается монтаж до 10 ускорителей. Поддерживаются модели в исполнении SXM/OAM. Подсистема питания может быть выполнена по схеме резервирования 4+1 или 2+2.

Семейство Premier объединяет наиболее производительные серверы 4U и 8U для самых сложных рабочих нагрузок, таких как большие языковые модели (LLM) и облачный ИИ. Есть до 12 слотов PCIe для высокоскоростных сетевых карт (10 Гбит/с) или DPU. Для некоторых серверов возможно применение процессоров AMD.

Постоянный URL: https://servernews.ru/1101795
15.03.2024 [22:43], Алексей Степин

Tenstorrent под руководством Джима Келлера представила свои первые ИИ-ускорители Grayskull на базе RISC-V

Канадский разработчик микрочипов Tenstorrent, возглавляемый легендарным Джимом Келлером (Jim Keller), наконец, представил свои первые решения на базе архитектуры RISC-V — ИИ-процессоры Grayskull и ускорители на их основе, Grayskull e75 и e150. Оба варианта доступны для приобретения уже сейчас по цене $599 за младшую версию и $799 за старшую. Данные решения предназначены для инференс-систем, разработки и отладки ПО.

В комплект разработчика входят инструменты TT-Buda и TT-Metalium. В первом случае речь идёт о высокоуровневом стеке, предназначенном для компиляции и запуска ИИ-моделей на аппаратном обеспечении Tenstorrent, а во втором — о низкоуровневой программной платформе, обеспечивающей прямой доступ к аппаратным ресурсам. Поддерживается PyTorch, ONNX и другие фреймворки. Создатели делают особенный упор на простоте программирования в сравнении с классическими GPU. Поддерживается широкий спектр ИИ-моделей, но Tenstorrent особенно выделяет BERT, ResNet, Whisper, YOLOv5 и U-Net.

 Источник изображений здесь и далее: Tenstorrent

Источник изображений здесь и далее: Tenstorrent

Архитектура Grayskull базируется на RISC-V, в настоящий момент максимальное количество фирменных ядер Tensix достигает 120, работают они на частотах вплоть до 1,2 ГГц. Каждое такое ядро содержит пять полноценных ядер RISC-V, блок тензорных операций, блок SIMD для векторных операций, а также ускорители сетевых операций и сжатия/декомпрессии данных. Дополнительно каждое ядро может иметь до 1,5 Мбайт сверхбыстрой памяти SRAM. Между собой ядра общаются напрямую.

В случае Grayskull e150 процессор работает в полной конфигурации со 120 ядрами и 120 Мбайт SRAM, объём внешней памяти LPDDR4 составляет 8 Гбайт (ПСП 118,4 Гбайт/с). Ускоритель выполнен в формате полноразмерной платы расширения с теплопакетом 200 Вт и интерфейсом PCIe 4.0 x16. У младшей модели, Grayskull e75, активных ядер только 96, их частота снижена до 1 ГГц, а пропускная способность внешней памяти при том же объёме снижена до 102,4 Гбайт/с. При этом теплопакет составляет всего 75 Вт, что позволило выполнить ускоритель в виде низкопрофильной платы расширения и обойтись без дополнительного питания.

Чипы Wormhole тоже используют Tensix. В составе Wormhole n300 таких ядер 128 (2 × 64), частота равна 1 ГГц при теплопакете 300 Вт. Объём SRAM составляет 1,5 Мбайт на ядро, а внешняя подсистема памяти включает 24 Гбайт GDDR6 и с ПСП 576 Гбайт/с. Wormhole n150 оснащены 72 ядрами Tensix, 108 Мбайт SRAM и 12 Гбайт GDDR6 с ПСП 288 Гбайт/с. TDP составляет 160 Вт. От Grayskull эти решения отличаются возможностью масштабирования путём прямого объединения плат. Также есть по паре сетевых интерфейсов 200GbE. Возможна работа с форматами FP8/16/32, TF32, BFP2/4/8, INT8/16/32 и UINT8.

Чипы Tenstorrent Grayskull и Wormhole лежат в основе уникальных масштабируемых платформ собственной разработки — AICloud и Galaxy. В первом случае используются процессоры Grayskull, поскольку Wormhole на рынке должен появиться позже. Платформа предназначена в качестве аппаратной для ИИ и HPC-нагрузок в облаке Tenstorrent.

Каждый 4U-узел AICloud высотой содержит восемь карт (16 чипов) и способен предоставить в распоряжение пользователей от 30 до 60 vCPU и от 256 до 1024 Гбайт памяти, вкупе с дисковым пространством объёмом 100–400 Гбайт. Восемь таких узлов составляют стойку, а четыре стойки — кластер Server Pod. Четыре таких кластера объединены общей системой интерконнекта, управления и СХД (до 200 Тбайт), дальнейшее масштабирование уже выходит на уровень ЦОД.

В Tenstorrent Galaxy упор сделан на возможность создания высокопроизводительных ИИ-систем с быстрым интерконнектом на базе Ethernet. Строительным блоком здесь являются 80-ядерные модули Wormhole. 4U-сервер вмещает 32 таких модуля, что в совокупности даёт 2560 ядер Tensix и 384 Гбайт глобально адресуемой GDDR6. Наличие 16 каналов 200GbE в каждом модуле обеспечивает производительность интерконнекта на уровне 3,2 Тбитс.

На уровне стойки высотой 48U это дает 256 чипов Wormhole, общий объём SRAM в этом случае достигает 30,7 Гбайт, а GDDR6 — 3 Тбайт. Производительность стойки оценивается разработчиками в 20 Попс (Петаопс), а совокупная скорость интерконнекта — в 76,8 Тбит/с. Расплатой за универсальность и производительность станет энергопотребление, достигающее 60 КВт.

Постоянный URL: https://servernews.ru/1101734
Система Orphus