Материалы по тегу: к

04.07.2023 [16:12], Сергей Карасёв

Компьютер ASUS IoT PE1100N для ИИ-задач на периферии построен на базе NVIDIA Jetson Orin

ASUS IoT, подразделение ASUS по выпуску умных устройств для Интернета вещей, объявило о выходе компактного безвентиляторного компьютера PE1100N, предназначенного для решения ИИ-задач на периферии. В основу новинки положена аппаратная платформа NVIDIA.

Представлены версии с модулем Jetson Orin Nano и Jetson Orin NX. Задействован GPU с 512- или с 1024-ядерным ускорителем NVIDIA Ampere. Объём оперативной памяти LPDDR5 может составлять 4, 8 или 16 Гбайт.

Устройство заключено в корпус с габаритами 152 × 114 × 72 мм. Ребристая внешняя поверхность выполняет функции радиатора для отвода тепла. Диапазон рабочих температур простирается от -20 до +60 °C.

 Источник изображения: ASUS IoT

Источник изображения: ASUS IoT

Компьютер располагает коннектором M.2 2242/2260/2280 для SSD с интерфейсом PCIe, слотом M.2 E key 2230 для адаптера Wi-Fi/Bluetooth (PCIe, USB 2.0, I2C и PCM) и коннектором M.2 B key 3042/3052 для модуля 4G/5G (PCIe, USB 2.0/3.0). Есть два разъёма для карт nano-SIM. В оснащение включён двухпортовый сетевой контроллер 1GbE, а опционально можно добавить приёмник GPS.

Новинка снабжена тремя портами USB 3.2 Gen1 Type-A, интерфейсом HDMI 1.4a или HDMI 2.0b, двумя гнёздами RJ-45 для сетевых кабелей, двумя последовательными портами, гнёздами для подключения антенн, портом Micro-USB и пр. Вес составляет 1,4 кг. Допускается монтаж на стену. В качестве программной платформы применяется Ubuntu.

Постоянный URL: http://servernews.ru/1089375
29.06.2023 [22:54], Алексей Степин

Intel похвасталась результатами Habana Gaudi2 и Xeon Sapphire Rapids в ИИ-бенчмарке MLPerf Training 3.0

Группа MLCommons, разработчик набора тестов для ИИ-систем MLPerf, опубликовала результаты MLPerf Training v3.0. Среди протестированных устройств есть и ускорители Habana Gaudi2, и процессоры Intel Xeon Sapphire Rapids.

В индустрии распространено мнение о том, что генеративный ИИ и большие языковые модели (LLM) создаются практически исключительно на аппаратном обеспечении NVIDIA. Но как показывают опубликованные результаты, в этом секторе Intel готова конкурировать с NVIDIA.

Программная экосистема Habana, по словам Intel, достигла необходимой степени зрелости, а решения компании позволяют говорить о конкурентоспособности даже с NVIDIA H100. Производительность и масштабируемость Gaudi2 была протестирована с помощью GPT-3 (целиком LLM обучать в рамках бенчмарка не требуется) — покорить этот рубеж в MLPerf смогли только NVIDIA и Intel. Кластер из 384 ускорителей Gaudi2 смог завершить обучение за 311 минут, а при росте количества ускорителей с 256 до 384 показал 95 % эффективность масштабирования.

 Изображения: Intel

Изображения: Intel

Также заслуживает упоминания тот факт, что по сравнению с ноябрьскими результатами Gaudi2 демонстрируют 10-% и 4-% прирост производительности в BERT и ResNet соответственно, причём обошлось без специальной отладки и оптимизации. Кластер из 32 процессоров Intel Xeon Sapphire Rapids тоже заработал «из коробки», показав неплохие в своём классе результаты. Так, в «закрытом» дивизионе он смог «справиться» BERT и ResNet-50 за 48 и 88 минут соответственно. Поддержка матричных расширений Intel Advanced Matrix Extensions (AMX) обеспечила солидный прирост производительности.

Постоянный URL: http://servernews.ru/1089194
29.06.2023 [18:46], Алексей Степин

Опубликованы результаты тестов Intel Xeon Max: набортная HBM-память даёт заметное преимущество в ИИ- и HPC-нагрузках

Процессоры Intel серии Xeon Max отличаются от своих обычных, «не максимальных» собратьев наличием интегрированной памяти HBM2e объёмом 64 Гбайт. Что же это даёт им на практике? Этот вопрос исследовал ресурс Phoronix — им в руки новейшие двухсокетные системы Supermicro Hyper SuperServer SYS-221H-TNR с чипами Xeon Max 9468 и 9480.

Напомним, Intel Xeon Max отличается от своих обычных собратьев серии Sapphire Rapids наличием 64 Гбайт HBM2e на борту, причём объём одинаков для всех моделей, хотя количество ядер может варьироваться от 32 до 56. Процессоры Xeon Max были протестированы в трёх режимах: только с памятью HBM (без DDR5), с HBM в качестве кеша для 512 Гбайт DDR5, а также в «плоском» режиме, но без отдачи HBM какому-либо процессу, то есть фактически только с DDR5.

 Изображение: Intel

Изображение: Intel

Тесты показали, что два первых режима действительно могут обеспечить преимущество в некоторых сценариях нагрузки. Результаты получились вполне закономерными: там, где сравнительно небольшого объёма HBM2e достаточно, режим HBM Only оказывается самым быстрым из-за высокой пропускной способности и отсутствия необходимости как-то синхронизировать работу с DDR5.

 Источник: Phoronix

Источник: Phoronix

Однако режим кеширования тоже обеспечивает выигрыш, хотя в ряде нагрузок, таких как OpenFOAM, он не такой большой. В ИИ-сценариях, в частности, в тестах OpenVINO, разница меньше, а иногда отключение HBM2e и вовсе позволяет добиться чуть лучшей производительности, особенно на системе с Xeon Max 9480, где на каждое ядро приходится меньше памяти. Но в других тестах, таких как PETSc и Stress-NG, использование HBM2e может дать огромный прирост производительности, который глупо было бы игнорировать.

В целом, можно уверенно заявлять, что в среднем, прирост производительности при HBM-кешировании составляет 10–11 %, а при отказе от DDR5 к этому значению можно добавить ещё около 8 %. Также очевидно, что потребление системы в таком режиме заметно ниже, поскольку не требуется питание для модулей DDR5. В целом можно говорить о 18–20 % превосходства на широком спектре нагрузок, сообщает Phoronix.

Постоянный URL: http://servernews.ru/1089160
29.06.2023 [18:45], Сергей Карасёв

Компьютер-брелок PopStick за $29 использует чип Allwinner и ОС Linux

Команда Popcorn Computer, по сообщению ресурса CNX Software, создала крошечный компьютер Popstick, внешне выглядящий как обычный USB-брелок. В устройстве соседствуют аппаратная платформа Allwinner и ОС на ядре Linux.

Новинка несёт на борту чип Allwinner F1C200s ARM926EJ-S (ARMv5TE) с частотой 533 МГц, который наделён 64 Мбайт интегрированной оперативной памяти DDR1. Для хранения софта служат 128 Мбайт памяти SPI NAND Flash. Дополнительно можно установить карту формата microSD.

 Источник изображения: Popcorn Computer

Источник изображения: Popcorn Computer

Для подключения к персональному компьютеру служит коннектор USB Type-A. Этот же разъём применяется для подачи питания (5 В). Через переходники USB Micro-B, USB-C или Lightning устройство можно подсоединить к планшету, смартфону и пр. Предусмотрен также консольный коннектор Micro-USB.

PopStick может функционировать в режиме аксессуара USB: таким образом, для хоста новинка может выглядеть как клавиатура, мышь, накопитель и пр. Устройство заключено в прозрачный корпус. Приобрести мини-компьютер можно по цене $29.

Постоянный URL: http://servernews.ru/1089191
29.06.2023 [13:28], Сергей Карасёв

Ramon.Space привлекла $26 млн на создание космического сервера

Компания Ramon.Space, разработчик решений для космических вычислений, по сообщению ресурса Siliconangle, закрыла очередной раунд финансирования, в ходе которого привлечено $26 млн. Деньги пойдут на «масштабирование деятельности в соответствии с рыночными потребностями».

Напомним, Ramon.Space занимается развитием концепции сети спутников для обработки данных на орбите. Главное преимущество такого подхода заключается в том, что он позволит предоставлять услуги практически в любой точке Земли, даже если там нет наземного интернет-доступа.

Ramon.Space проектирует оборудование, которое позволит космическим аппаратам хранить, обрабатывать и анализировать большие объёмы информации, а также обмениваться данными с наземными станциями. Компания заявляет, что её решения дадут возможность развернуть новое поколение приложений и сервисов, в том числе на базе ИИ.

 Источник изображения: Ramon.Space

Источник изображения: Ramon.Space

В частности, Ramon.Space создала ряд модульных продуктов для использования на орбите — устройства NuStream, NuPod и NuBox. Эти системы спроектированы с прицелом на эксплуатацию в суровых космических условиях и оснащены радиационно-стойкими компонентами для долгосрочной надёжной эксплуатации.

Весной 2021 года Ramon.Space получила инвестиции в размере $17,5 млн. В нынешнем раунде приняли участие Ingrasys Technology Inc., подразделение Foxconn Technology Group, и Strategic Development Fund из Абу-Даби. В раунде также приняли участие существующие инвесторы Grove Ventures, Deep Insight и UMC Capital.

Постоянный URL: http://servernews.ru/1089153
28.06.2023 [13:18], Сергей Карасёв

ИИ-решения принесли «Сбербанку», «Яндексу», ВТБ и VK почти 140 млрд руб., выяснил ИИ

По итогам 2022 года суммарный заработок «Сбербанка», «Яндекса», ВТБ и VK на решениях в области ИИ составил 137,3 млрд руб. Это, как сообщает ТАСС, следует из составленного нейросетью совместного рейтинга «билайна» и Brand Analytics компаний и институтов, которые занимаются средствами ИИ в России.

Говорится, что инвестиции «Сбербанка» в решения ИИ составили 10 млрд руб., а объём покупки компаний для развития ИИ достиг отметки в 14,7 млрд руб. При этом в течение 2022 года соответствующие продукты принесли «Сбербанку» приблизительно 93,8 млрд руб.

«Яндекс» в прошлом году получил благодаря ИИ-решениям около 11,5 млрд руб., тогда как объём покупок компаний составил 27,7 млн руб. ВТБ получил 23,7 млрд руб. благодаря внедрению ИИ-технологий. Сумма инвестиций по данному направлению оценивается в 80 млн руб., объём покупок компаний, развивающих соответствующую сферу, достиг 123,6 млрд руб.

 Источник: Brand Analytics

Источник: Brand Analytics

В исследовании говорится, что выручка VK от внедрения ИИ-инструментов в 2022 году составила 8,3 млрд руб. На приобретение компаний из этой области потрачено 153,8 млн руб. В рейтинг также вошли «Газпромбанк» и ретейлер «Магнит», инвестиции которых в сферу ИИ по итогам 2022 года составили соответственно 28,5 млрд руб. и 20,2 млрд руб. Замыкают десятку оператор МТС, АРПП «Отечественный софт», «МегаФон» и «Сколково».

Говорится, что для поиска публикаций по теме ИИ и подготовки массивов данных было проанализировано более 5 млрд материалов СМИ и Telegram-каналов. Из 1 млн найденных публикаций после исключения дублей остался массив в 500 тыс. материалов, который использовался для обучения нейросети и формирования рейтинга.

Постоянный URL: http://servernews.ru/1089075
27.06.2023 [19:00], Владимир Мироненко

NVIDIA похвасталась рекордами H100 в новом бенчмарке MLPerf для генеративного ИИ

NVIDIA сообщила, что во всех восьми ИИ-бенчмарках MLPerf Training v3.0 её ускорители H100 установили новые рекорды, причём как по отдельности, так и в составе кластеров. В частности, коммерчески доступный кластер из 3584 ускорителей H100, созданным стартапом Inflection AI и облаком CoreWeave, смог завершить обучение ИИ-модели GPT-3 менее чем за 11 минут.

Компания Inflection AI, основанная в 2022 году, использовала возможности решений NVIDIA для создания продвинутой большой языкой модели (LLM) для своего первого проекта под названием Pi. Компания планирует выступать в качестве ИИ-студии, создавая персонализированные ИИ, с которыми пользователи могли бы взаимодействовать простыми и естественными способомами. Inflection AI намерена в сотрудничестве с CoreWeave создать один из крупнейших в мире ИИ-кластеров на базе ускорителей NVIDIA.

«Сегодня наши клиенты массово создают современные генеративные ИИ и LLM благодаря тысячам ускорителей H100, объединённых быстрыми сетями InfiniBand с малой задержкой, — сообщил Брайан Вентуро (Brian Venturo), соучредитель и технический директор CoreWeave. — Наша совместная с NVIDIA заявка MLPerf наглядно демонстрирует их высокую производительность». Отдельно подчёркивается, что благодаря NVIDIA Quantum-2 InfiniBand облачный кластер CoreWeave обеспечил такую же производительность, что и локальный ИИ-суперкомпьютер NVIDIA.

 Источник изображений: NVIDIA

Источник изображений: NVIDIA

NVIDIA отметила, что H100 показали высочайшую производительность во всех тестах MLPerf, включая LLM, рекомендательные системы, компьютерное зрение, обработка медицинских изображений и распознавание речи. «Это были единственные чипы, которые прошли все восемь тестов, продемонстрировав универсальность ИИ-платформы NVIDIA» — сообщила компания. А благодаря оптимизации всего стека NVIDIA удалось добиться в тесте LLM практически линейного роста производительности при увеличении количества ускорителей с сотен до тысяч. Отдельно компания напомнила об энергоэффективности H100.

Также сообщается, что обновлённый бенчмарк MLPerf для рекомендательных систем использует больший набор данных и более современную модель, что позволяет лучше отразить проблемы, с которыми сталкиваются провайдеры облачных услуг. NVIDIA была единственной компанией, представившей результаты расширенного теста. Также компания представила результаты MLPerf для платформ L4 и Jetson. Ну а в следующем раунде MLPerf стоит ждать появления NVIDIA Grace Hopper.

В текущем раунде результаты тестов с использованием платформы NVIDIA представили десяток компаний. Заявки поступили от крупных производителей систем, включая ASUS, Dell Technologies, GIGABYTE, Lenovo и QCT. Более 30 замеров было сделано на ускорителях H100. NVIDIA отметила прозрачность и объективность тестов, поэтому пользователи могут полностью полагаться на результаты MLPerf для принятия решения о покупке систем.

Постоянный URL: http://servernews.ru/1089042
27.06.2023 [14:08], Сергей Карасёв

Giga Computing (Gigabyte) анонсировала бизнес-компьютеры Brix на базе AMD Ryzen 7030U

Компания Giga Computing, серверное подразделение Gigabyte, представила новые компьютеры небольшого форм-фактора Brix, рассчитанные на использование в бизнес-сфере. В основу устройств положены процессоры AMD Ryzen 7030U с архитектурой Zen3.

В общей сложности анонсированы пять моделей: GB-BRR7H-7730, GB-BRR5H-7530, GB-BRR3H-7330, GB-BRR7HS-7730 и GB-BRR5HS-7530. Как отражено в индексе модели, задействован процессор Ryzen 7 7730U (8 ядер; 16 потоков; до 4,5 ГГц), Ryzen 5 7530U (6 ядер; 12 потоков; до 4,5 ГГц) или Ryzen 3 7330U (4 ядра; 8 потоков; до 4,3 ГГц).

Компьютеры могут нести на борту до 32 Гбайт DDR4-3200 в виде двух модулей SO-DIMM. Первые три из перечисленных моделей допускают установку одного SSD формата M.2 с интерфейсом PCIe 4.0 x4 или SATA и одного SFF-накопителя, две другие — трёх модулей M.2 (один с интерфейсом PCIe 4.0 x4 или SATA и два с интерфейсом PCIe 4.0 x1 или SATA) и одного SFF-накопителя.

 Источник изображения: Giga Computing

Источник изображения: Giga Computing

Все новинки располагают адаптерами Wi-Fi 6 и Bluetooth 5.2, контроллером 2.5GbE. Есть по два интерфейса HDMI 2.0 и DP 1.4, а также по два порта USB 3.2 Gen2 Type-A, USB 3.2 Gen2 Type-C/DP и USB 2.0 Type-A. Габариты составляют 124 × 120 × 49,7 мм. Диапазон рабочих температур простирается от 0 до +35 °C. Допускается монтаж посредством крепления VESA.

Постоянный URL: http://servernews.ru/1088996
26.06.2023 [19:40], Сергей Карасёв

«Сбербанк» запасается серверами и СХД из США и Китая

«Сбербанк», по сообщению газеты «Коммерсантъ», намерен закупить американское и китайское оборудование для дата-центров на общую сумму почти $160 млн. Речь идёт прежде всего о поставках серверов и СХД. Кроме того, серверным оборудованием запасаются и другие участники российского рынка.

Известно, что «Сбербанк» открыл семь лотов на закупку 2,6 тыс. серверов на общую сумму $40,5 млн. Запрос датируется 25 мая нынешнего года, а итоги торгов будут подведены 31 августа. Кроме того, «Сбербанк» объявил ещё как минимум два тендера. Один из них касается закупки серверов китайской Huawei на общую сумму $80 млн, второй — СХД американской Dell или NetApp на $38 млн. Таким образом, общая стоимость запланированного к приобретению оборудования составляет $158,5 млн.

 Источник изображения: pixabay.com

Источник изображения: pixabay.com

Участники рынка полагают, что «железо» может потребоваться «Сбербанку» для подготовки к внедрению цифрового рубля. Высказываются также предположения, что банк обновляет парк оборудования или попросту формирует запасы, поскольку правительство РФ в настоящее время рассматривает возможность блокировки параллельного импорта зарубежной вычислительной техники.

Говорится также, что за последние несколько месяцев крупный IT-интегратор Softline задекларировал несколько десятков позиций по оборудованию Huawei, XFusion, HPE и др. Соответствующие данные отражены в едином реестре сертификатов соответствия и деклараций о соответствии.

Постоянный URL: http://servernews.ru/1088966
26.06.2023 [15:15], Сергей Карасёв

Процессинг «Газпромбанка» будет переведён на российские «Эльбрусы», ОС ALT Linux и СУБД «Синергия»

АО «МЦСТ» сообщает о том, что «Газпромбанк» намерен к 2025 году перевести программные модули системы процессинга на российские микропроцессоры «Эльбрус». Отмечается, что подобные проекты в России до сих пор не реализовывались.

О том, что «Газпромбанк» планирует внедрить отечественный стек технологий, впервые говорилось в марте нынешнего года. Тогда сообщалось, что новая платформа, помимо чипов «Эльбрус», будет включать в себя программные решения «СмартВиста» и импортозамещенную СУБД.

Теперь стало известно, что проект предусматривает применение ОС ALT Linux. Помимо этого, будет использоваться СУБД «Синергия». В рамках масштабной инициативы «Газпромбанк» намерен внедрить российские криптографические модули. Наконец, будут устанавливаться отечественные банкоматы. Иными словами, предполагается импортозамещение всех ключевых банковских технологий.

 Источник изображения: МЦСТ

Источник изображения: МЦСТ

«Подобных проектов в России ещё не было реализовано, поэтому перед нами стоит важная миссия по разработке и тестированию новых решений, которые смогут обеспечить технологическую независимость. Уверен, что наши разработки и опыт будут востребованы российским банковским рынком», — отметил заместитель председателя правления «Газпромбанка» Дмитрий Зауэрс.

Система процессинга банка отвечает за авторизацию и позволяет беспрерывно оказывать набор платёжных услуг, включая реализацию различных финансовых инструментов. Это, в частности, оплата покупок и обработка операций банкоматами, переводы с карты на карту и пр.

Постоянный URL: http://servernews.ru/1088930
Система Orphus