Материалы по тегу: hardware

24.03.2023 [23:38], Сергей Карасёв

Supermicro представила быструю и тихую рабочую станцию для работы с ИИ: 4 × A100, 2 × Sapphire Rapids, RTX A4000 и СЖО

Компания Supermicro анонсировала рабочую станцию SYS-751GE-TNRT-NV1, предназначенную для ИИ- и HPC-нагрузок. Устройство, как утверждается, обладает высокой производительностью, хорошими показателями энергоэффективности и низким уровнем шума.

Применена материнская плата Super X13DEG-QT с парой Intel Xeon 6444Y (16C/32T; 3,6–4,0 ГГц; 270 Вт). В базовую комплектацию входят 512 Гбайт DDR5-4800 в виде 16 модулей по 32 Гбайт. В оснащение включены четыре ускорителя NVIDIA A100 (80 Гбайт, PCIe), попарно соединённых мостиками NVLink и оснащённых водоблоками, и 25GbE-адаптер NVIDIA ConnectX-6 Dx. Кроме того, есть два сетевых порта 10GbE (Intel X550-AT2) и выделенный 1GbE-порт для BMC ASPEED AST2600. Подсистема хранения данных объединяет шесть 1,92-Тбайт NVMe SSD, два из которых объединены в массив RAID 1. Для вывода изображения используется NVIDIA RTX A4000.

 Источник изображения: Supermicro

Источник изображения: Supermicro

Для всех CPU и GPU предусмотрено использование СЖО. Станция также наделена тремя вентиляторами — двумя на 120 мм и одним диаметром 80 мм. Задействованы два блока питания мощностью 2200 Вт каждый. Упомянуты семь слотов расширения PCIe 5.0 x16 FHFL, последовательный порт, разъёмы USB 3.2 Gen1, USB 3.2 Gen2 Type-C и D-Sub. Габариты составляют 218,4 × 454,7 × 701 мм, вес — 44 кг. Диапазон рабочих температур — от +10 до +25 °C. Установлена операционная система Ubuntu 22.04 LTS. В комплекте поставляется подписка на NVIDIA AI Enterprise на 3 года.

Постоянный URL: http://servernews.ru/1083981
24.03.2023 [20:28], Алексей Степин

Kioxia анонсировала серверные SSD на базе XL-FLASH второго поколения

По мере внедрения новых версий PCI Express растут и линейные скорости SSD. Не столь давно 3-4 Гбайт/с было рекордно высоким показателем, но разработчики уже штурмуют вершины за пределами 10 Гбайт/с. Компания Kioxia, крупный производитель флеш-памяти и устройств на её основе, объявила на конференции 2023 China Flash Market о новом поколении серверных накопителей, способных читать данные со скоростью 13,5 Гбайт/с.

Новые высокоскоростные SSD будут построены на базе технологии XL-FLASH второго поколения. Первое поколение этих чипов компания (тогда Toshiba) представила ещё в 2019 году. В основе лежат наработки по BiCS 3D в однобитовом варианте, что позволяет устройствам на базе этой памяти занимать нишу Storage Class Memory (SCM) и служить заменой ушедшей с рынка технологии Intel Optane.

Источник здесь и далее: Twitter@9550pro

Как уже сообщалось ранее, XL-FLASH второго поколения использует двухбитовый режим MLC, но в любом случае новые SSD Kioxia в полной мере раскроют потенциал PCI Express 5.0. Они не только смогут читать данные на скорости 13,5 Гбайт/с и записывать их на скорости 9,7 Гбайт/с, но и обеспечат высокую производительность на случайных операциях: до 3 млн IOPS при чтении и 1,06 млн IOPS при записи. Время отклика для операций чтения заявлено на уровне 27 мкс, против 29 мкс у XL-FLASH первого поколения.

Kioxia полагает, что PCI Express 5.0 и CXL 1.x станут стандартами для серверных флеш-платформ класса SCM надолго — господство этих интерфейсов продлится минимум до конца 2025 года, лишь в 2026 году следует ожидать появления первых решений с поддержкой PCI Express 6.0. Активный переход на более новую версию CXL ожидается в течение 2025 года. Пока неизвестно, как планирует ответить на активность Kioxia другой крупный производитель флеш-памяти, Samsung Electronics, которая также располагает высокопроизводительной разновидностью NAND под названием Z-NAND.

Постоянный URL: http://servernews.ru/1083989
24.03.2023 [19:28], Руслан Авдеев

Lambda Labs привлекла $44 млн на создание «лучшего в мире» ИИ-облака

Lambda Labs значительно меньше гиперскейлеров, но ей удалось найти собственную нишу — компания помимо разработки специализированных решений для ИИ и HPC также предлагает доступ к своему высокоэффективному ИИ-облаку. И теперь, как сообщает DataCenter Dynamics, компания, решениями и услугами которой уже пользуется целый ряд представителей списка Fortune500, смогла привлечь $44 млн в ходе очередного раунда инвестиций.

Сегодня компания имеет ЦОД в Калифорнии и Техасе. Узкая специализация позволяет ей успешно конкурировать с гиперскейлерами, предлагая доступ к ускорителям NVIDIA A100 по почти демпинговым ценам. Так, по данным Lambda, AWS просит за доступ к одному ускорителю $4,10/час, Google Cloud — $2,46/час, а вот сама Lambda — всего $1,10/час. Уже в следующем месяце в облаке Lambda Labs появятся новые ускорители NVIDIA H100. По словам компании, компания занимается созданием «лучшего в мире» облака для обучения ИИ.

 Изображение: Lambda Labs

Изображение: Lambda Labs

Раунд серии B возглавила Mercato Partners, к которой присоединились представители Quora, Cloudera, OpenAI, Weights and Biases и Y Combinator, а также уже вложившиеся ранее в проект венчурный фонд 1517 и Gradient Ventures. Свой вклад внесли «бизнес-ангел» Жорж Харик (Georges Harik), Bloomberg Beta и Crescent Cove. Также известно, что в совет директоров Lambda Labs вошёл управляющий директор Mercato Райан Сандерс (Ryan Sanders).

Привлечённые средства помогут расширить вычислительные мощности и нанять новых сотрудников, в том числе специалистов в области глубокого и машинного обучения, виртуализации GPU, облачных вычислений и сетевой инфраструктуры.

Постоянный URL: http://servernews.ru/1083988
24.03.2023 [15:45], Сергей Карасёв

НТЦ «Модуль» предоставил разработчикам удалённый доступ к решениям на базе российских нейропроцессоров

Научно-технический центр (НТЦ) «Модуль» сообщил о том, что разработчики теперь могут получить удалённый доступ к ряду продуктов на основе нейропроцессоров НТЦ. Это позволит познакомиться с отечественными программно-аппаратными решениями на ядре NeuroMatrix (NMC). В частности, предоставляется доступ к модулям с чипами К1879ВМ8Я (NM Card Mini, NM Mezzo Mini, МС127.05 для Windows и Linux), К1879ВМ6Я (МС121.01 для Windows и Linux) и К1879ВМ5Я (МС76.07 для Windows).

Клиенты могут воспользоваться средствами разработки и отладки (SDK) для ядер Arm и NMC, а также опробовать работу специализированных библиотек NMC для векторно-матричных вычислений, базовых функций, линейной алгебры, цифровой обработки сигналов и изображений. Кроме того, доступен специализированный компилятор обученных нейронных сетей NeuroMatrix Deep Learning (NMDL) с графическим интерфейсом. Программистам предоставляется возможность отработать методологию запуска общего кода С/С++ на ядрах Arm и NMC.

 Источник изображения: НТЦ «Модуль»

Источник изображения: НТЦ «Модуль»

«Удалённый доступ позволяет опробовать интересующие устройства в работе, ознакомиться с программно-аппаратными решениями на базе отечественного ядра NeuroMatrix и сделать все это оперативно, без лишней бумажной волокиты. Более того, удалённый доступ освобождает клиента от организации рабочего места — оно уже оборудовано и настроено (это экономит время и деньги), а также дает возможность получить оперативную консультацию службы технической поддержки нашей компании», — отмечает руководство НТЦ «Модуль».

В рамках новой инициативы пользователи могут самостоятельно оценить производительность собственных нейросетевых решений в NMDL по ряду параметров, таких как частота обработки входных кадров для различных режимов работы процессора и задержка до получения обработанного кадра.

Постоянный URL: http://servernews.ru/1083938
23.03.2023 [22:55], Владимир Мироненко

Инстансы AWS EC2 P5 позволят объединить в облаке до 20 тыс. ускорителей NVIDIA H100

AWS и NVIDIA объявили о заключении соглашения о многостороннем сотрудничестве с целью создания самой масштабируемой в мире инфраструктуры искусственного интеллекта (ИИ) по требованию, оптимизированной для обучения всё более сложных больших языковых моделей (LLM) и разработки генеративных приложений ИИ.

Компании займутся развёртыванием инстансов следующего поколения EC2 P5 на базе ускорителей NVIDIA H100 с продвинутыми сетевыми возможностями и возможностями масштабирования в AWS, что позволит достичь производительности 20 Эфлопс. Каждый инстанс P5 оснащён восемью ускорителями NVIDIA H100. P5 станут первыми инстансами с ускорителями, в которых используются адаптеры AWS Elastic Fabric Adapter (EFA) 2-го поколения с низкой задержкой, скоростью передачи данных 3,200 Тбит/с и поддержкой NVIDIA GPUDirect RDMA, что позволит объединить до 20 тыс. ускорителей. Для сравнения — OCI SuperCluster позволяет объединить до 32 768 ускорителей A100).

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Как отмечено в пресс-релизе NVIDIA, инстансы P5 идеально подходят для обучения и инференса для всё более сложных LLM и моделей компьютерного зрения, лежащих в основе самых требовательных и ресурсоёмких приложений генеративного ИИ. Повышенная производительность инстансов P5 позволяет сократить время обучения моделей машинного обучения (ML) до 6 раз. Ожидается, что инстансы P5 снизят затраты на обучение моделей машинного обучения по сравнению с предыдущим поколением на 40 %.

В результате заказчики получают производительность сравнимую с таковой у локальных HPC-кластеров, но с эластичностью и гибкостью AWS. Кроме того, клиенты смогут использовать портфолои сервисов AWS, включая S3, FSx, SageMaker и т.д. Инстансы P5 станут доступны в ближайшие недели в ограниченной предварительной версии.

Постоянный URL: http://servernews.ru/1083897
23.03.2023 [19:44], Алексей Степин

Google Cloud представила инстансы G2 с ускорителями NVIDIA L4

На GTC 2023 корпорация NVIDIA анонсировала новые ускорители для инференс-систем — сверхмощный H100 NVL и компактный L4. Последний предлагает приличную производительность в форм-факторе HHHL. Google Cloud уже воспользовалась последней новинкой и объявила о доступности инстансов G2 с ускорителями NVIDIA L4.

Инференс-задачи требуют от ускорителя быстрой обработки входных данных. Google Cloud предлагает использовать G2 именно в таком качестве и говорит о возможном снижении инфраструктурной стоимости на 40 %. Также говорится о повышении производительности в сравнении с NVIDIA T4, ускорителями аналогичного класса, но предыдущего поколения.

 NVIDIA L4 (Источник: NVIDIA)

NVIDIA L4 (Источник: NVIDIA)

В зависимости от задачи прирост может варьироваться от двух до четырёх раз. Карта развивает почти 500 Топс (INT8/FP8) и несёт на борту 24 Гбайт памяти с ПСП 300 Гбайт/с. Впрочем, L4 достаточно универсален и может использоваться в любых сценариях, от HPC и рендеринга 3D-графики до параллельного транскодирования потокового видеоконтента. В том числе новинка поддерживает трассировку лучей, технологию масштабирования DLSS 3.0, а также аппаратное кодирование в формате AV1.

В настоящее время новые виртуальные машины доступны в виде закрытого превью, количество используемых ускорителей — от 1 до 8. Инстансы G2 доступны в регионах us-central1, asia-southeast1, europe-west4, а запрос на доступ к ним можно оставить, использовав приведённую ссылку. Также новые ускорители вскоре станут доступны в Google Kubernetes Engine (GKE), Vertex AI и других облачных сервисах.

Постоянный URL: http://servernews.ru/1083920
23.03.2023 [13:31], Сергей Карасёв

Synology представила IP-камеры BC500 и TC500 с 5-Мп матрицей и ИК-подсветкой

Компания Synology анонсировала универсальные IP-камеры BC500 и TC500 с ИИ для организации видеонаблюдения в различных условиях. Устройства, как утверждается, с высокой точностью отличают людей и транспортные средства от других движущихся объектов, сообщают о присутствии посторонних лиц и повышают общий уровень защиты.

Цилиндрическая модель BC500 предназначена для установки на открытых пространствах, а версия TC500 подойдёт для видеонаблюдения в помещениях. Обе новинки имеют защиту по стандарту IP67. Четыре ИК-светодиода обеспечивают видение на 30 м в тёмное время суток. Камеры оборудованы 5-Мп матрицей (1/2,7") с возможностью передачи видео с разрешением 2880 × 1620 точек и скоростью 30 к/с. Применён объектив с фиксированным фокусным расстоянием (2,8 мм) и углом поля зрения 110° по горизонтали (132° по диагонали). Диапазон выдержек простирается от 1/16000 до 1/30 с.

 Источник изображения: Synology

Источник изображения: Synology

Благодаря расширенному динамическому диапазону (HDR) устройства позволяют получать детализированные изображения как в освещённых местах, так и в тени. С помощью функции поиска Instant Search можно находить нужные события в определённой области. Новинки наделены слотом microSD и портом RJ-45 (10/100MbE). Модель BC500 имеет размеры 110 × 161 мм и весит 353 г, версия TC500 — 97 × 88 мм и 387 г. Диапазон рабочих температур — от -30 до +50 °C. Камера BC500 уже доступна для заказа, а вариант TC500 появится в продаже в апреле.

Постоянный URL: http://servernews.ru/1083871
23.03.2023 [13:26], Сергей Карасёв

Австралийский суперкомпьютер Gadi стал мощнее, получив чипы Intel Xeon Sapphire Rapids

Корпорация Fujitsu, по сообщению ресурса HPC Wire, модернизировала суперкомпьютер Gadi, установленный в Национальном университете Австралии в Канберре (NCI). Комплекс получил узлы на новейших процессорах Intel Xeon Sapphire Rapids, что позволило существенно понять общую производительность.

В прежней конфигурации в HPC-системе Gadi уже широко применялись различные чипы Intel. В состав суперкомпьютера, в частности, входят 3074 узла, каждый из которых содержит два 24-ядерных процессора Intel Xeon Cascade Lake и 192 Гбайт памяти.

Также в состав комплекста входят 804 узла с парой 14-ядерных чипов Broadwell, 192 узла с двумя 16-ядерными процессорами Skylake и 160 узлов, каждый из которых наделён четырьмя ускорителями NVIDIA V100 и двумя 24-ядерными процессорами Intel Xeon Cascade Lake-SP. Наконец, есть 10 узлов с двумя 14-ядерными чипами Intel Broadwell и 512 Гбайт памяти и два узла NVIDIA DGX A100.

 Изображения: NCI Australia

Изображения: NCI Australia

После модернизации, как сообщается, комплекс получил 720 узлов с парой 52-ядерных процессоров Intel Xeon Sapphire Rapids и 512 Гбайт RAM, объединённых 200G-интерконнектом InfiniBand HDR. О быстродействии обновлённого суперкомпьютера ничего не сообщается, но ранее Gadi обеспечивал пиковую производительность в 15,14 Пфлопс и занимал 62-ю строку в списке Top500.

Отмечается, что появление узлов на базе Sapphire Rapids — это лишь первый этап масштабной программы по расширению вычислительных ресурсов NCI. Планируется добавление новых GPU и улучшение подсистемы электропитания. Общие инвестиции в проект составят около $26 млн.

Постоянный URL: http://servernews.ru/1083877
23.03.2023 [12:47], Сергей Карасёв

Вышел одноплатный компьютер Orange Pi 5B: Wi-Fi 6, Bluetooth 5.0, до 32 Гбайт RAM и eMMC ёмкостью до 256 Гбайт

Для заказа, по сообщению ресурса CNX-Software, стал доступен одноплатный компьютер Orange Pi 5B — ближайший родственник модели Orange Pi 5, которая дебютировала в ноябре 2022 года. Новинка подходит для организации периферийных вычислений, ИИ-приложений, интеллектуальных платформ Интернета вещей (AIoT) и пр.

Как и оригинальная версия, представленная плата несёт на борту процессор Rockchip RK3588S с восемью ядрами (четыре Cortex-A76 с частотой до 2,4 ГГц и четыре Cortex-A55 с частотой до 1,8 ГГц). Чип содержит графический блок Arm Mali-G610 MP4. Имеется ИИ-ускоритель с производительностью до 6 TOPS. Объём оперативной памяти LPDDR4/4x может варьироваться от 4 до 32 Гбайт.

 Источник изображения: Orange Pi

Источник изображения: Orange Pi

Мини-компьютер комплектуется флеш-накопителем eMMC вместимостью 32, 64, 128 или 256 Гбайт, тогда как вариант Orange Pi 5 снабжён слотом microSD и коннектором M.2 2242 для NVMe SSD. Кроме того, у новинки есть адаптеры Wi-Fi 6 (2,4/5 ГГц) и Bluetooth 5.0 BLE, отсутствующие у прародителя. Предусмотрен сетевой контроллер 1GbE (YT8531C) с разъёмом RJ-45.

Присутствуют порты USB 3.0 и USB 3.1 Gen1 Type-C (совмещён с DP 1.4), интерфейс HDMI 2.1 с поддержкой вывода 8Kp60, два разъёма USB 2.0, стандартное аудиогнездо (кодек ES8388), слот microSD. Реализованы интерфейсы 17 × GPIO, 3 × UART, 6 × PWM, 2 × I2C, 2 × CAN, 2 × MIPI DSI, 1× MIPI CSI, 2 × MIPI DCPHY. Габариты составляют 100 × 62 мм, вес — 52 г. Питание подаётся через дополнительный разъём USB Type-C.

Цена Orange Pi 5B в зависимости от размера памяти варьируется от $90 до $170. Предлагаются образы Orange Pi OS (Android), Orange Pi OS (Arch), Debian 11, Ubuntu 22.04, Ubuntu 20.04, Android 12.

Постоянный URL: http://servernews.ru/1083866
23.03.2023 [12:19], Сергей Карасёв

Marvell Technology тоже сократит штат из-за замедления развития IT-отрасли

Американская компания Marvell Technology, крупный разработчик IT-компонентов, по сообщению Bloomberg, проведёт реструктуризацию, в ходе которой штат будет сокращён приблизительно на 4 %. Сообщается, что уменьшение численности персонала продиктовано сложившимися рыночными условиями, в частности, замедлением развития отрасли микрочипов. В общей сложности по всему миру будут уволены примерно 320 сотрудников.

Ранее Marvell сокращала рабочие места в Китае, но нынешняя инициатива знаменуют собой первые значительные увольнения в США за несколько лет. Компания говорит, что изучила распределение команд по различным регионам и пришла к выводу о необходимости оптимизации организационной структуры. Это позволит повысить эффективность управления, снизить издержки и, в конечном счёте, обеспечить перспективы роста. При этом компания испытывает всё нарастающее давление со стороны конкурентов.

 Источник изображения: Marvell

Источник изображения: Marvell

По имеющимся данным, Marvell решила закрыть свой научно-исследовательский центр в Китае. Кроме того, будут затронуты другие подразделения. Компания прогнозирует, что по итогам I квартала 2023 года поставки HDD и SSD, а также других продуктов для ЦОД снизятся. Marvell завершила 2023 финансовый год, закончившийся 28 января, с рекордными продажами в размере $5,92 млрд. Операционная прибыль составила $238 млн против операционных убытков около $348 млн годом ранее. Однако зафиксирован чистый убыток на уровне $164 млн.

Постоянный URL: http://servernews.ru/1083868
Система Orphus