Лента новостей
22.10.2023 [14:06], Сергей Карасёв
Видео дня: строительство 2-Эфлопс суперкомпьютера El CapitanЛиверморская национальная лаборатория им. Э. Лоуренса (LLNL) Министерства энергетики США опубликовала видео (см. ниже), демонстрирующее процесс сборки вычислительного комплекса El Capitan, которому предстоит стать самым мощным суперкомпьютером мира. В текущем рейтинге TOP500 лидирует система Frontier, установленная в Национальной лаборатории Окриджа (ORNL), также принадлежащей Министерству энергетики США. Быстродействие Frontier достигает 1,194 Эфлопс. Суперкомпьютер El Capitan сможет демонстрировать производительность более 2 Эфлопс (FP64). Сборка комплекса началась в июле нынешнего года, а ввод в эксплуатацию запланирован на середину 2024-го. Стоимость проекта оценивается приблизительно в $600 млн. В основе El Capitan — платформа HPE Cray Shasta. Применена гибридная архитектура AMD с APU Instinct MI300A: изделие содержит 24 ядра с микроархитектурой Zen 4 общего назначения, блоки CDNA 3 и 128 Гбайт памяти HBM3. ![]() Источник изображения: LLNL Отмечается, что в проекте El Capitan задействованы сотни сотрудников LLNL и отраслевых партнёров. Суперкомпьютер состоит из тысяч вычислительных узлов и требует столько же энергии, сколько город среднего размера. В течение нескольких лет специалисты готовили инфраструктуру для El Capitan, создавая подсистемы электропитания и охлаждения, устанавливая компоненты и монтируя сетевые соединения. После запуска суперкомпьютер будет использоваться для решения задач в сферах ядерной энергетики, национальной безопасности, здравоохранения, изменений климата и пр.
22.10.2023 [13:58], Сергей Карасёв
Hyve Solutions представила платформу хранения Hercules 9120 сверхвысокой плотностиКомпания Hyve Solutions, подразделение корпорации TD SYNNEX, на мероприятии OCP Global Summit 2023 анонсировала аппаратную платформу Hercules 9120 для формирования хранилищ данных сверхвысокой плотности. Новинка соответствует стандартам OCP Open Edge. Утверждается, что решение обеспечивает преимущества в плане надёжности, доступности и удобства обслуживания. Стойка Hercules 9120 содержит восемь шасси в форм-факторе 5U, каждое из которых рассчитано на установку 96 HDD. Таким образом, общее количество накопителей в составе системы достигает 768. Заявлена поддержка интерфейса PCIe 5.0. Кроме того, говорится о совместимости с процессорами Intel Xeon Emerald Rapids, которые дебютируют в декабре нынешнего года, а также с чипами AMD EPYC Genoa. ![]() Источник изображения: Hyve Solutions В новой СХД реализована технология Rotational Vibration Interference (RVI), снижающая влияние вибрации дисков на работу платформы в целом. Благодаря этому, как утверждается, в перспективе можно будет применять HDD вместимостью до 50 Тбайт: выпуск таких накопителей ожидается ориентировочно в 2026 году. В этом случае суммарная ёмкость системы будет достигать 38,4 Пбайт. Платформа Hercules 9120 ориентирована на гиперскейлеров и операторов облачных платформ. Решение подходит для поддержания приложений ИИ, машинного обучения и других задач, предъявляющих высокие требования к СХД.
21.10.2023 [16:44], Сергей Карасёв
Gcore развернула кластер генеративного ИИ с ускорителями NVIDIAПровайдер облачных и периферийных сервисов Gcore, по сообщению ресурса Datacenter Dynamics, запустил вычислительный кластер для решения задач в области генеративного ИИ. Площадка, расположенная в Люксембурге, использует ускорители NVIDIA. Ранее Gcore уже развернула в Люксембурге ИИ-платформу на базе Graphcore IPU (Intelligence Processing Unit). Кроме того, компания оперирует такими системами в Амстердаме (Нидерланды) и Уэльсе (Великобритания). Новый кластер позволит клиентам ускорить решение задач в сферах генеративного ИИ и машинного обучения. Запущенная в Люксембурге площадка объединяет 20 серверов с ускорителями NVIDIA A100. До конца текущего года будут добавлены 128 узлов на базе NVIDIA H100 и ещё 25 серверов с изделиями A100. О текущей и планируемой производительности кластера данных пока нет. Отмечается лишь, что заказчики смогут разворачивать на базе платформы крупномасштабные ИИ-модели. ![]() Источник изображения: NVIDIA На сегодняшний день Gcore имеет точки присутствия в более чем в 140 регионах на шести континентах, а также более чем 20 облачных локаций. Компания была основана в 2014 году, а услуги CDN и хостинга начала предоставлять в 2016 году.
21.10.2023 [16:09], Сергей Карасёв
В Аргоннской национальной лаборатории запущена ИИ-система GroqАргоннская национальная лаборатория Министерства энергетики США сообщила о запуске вычислительного кластера, использующего специализированные ИИ-решения Groq. Ресурсы системы предоставляются исследователям на базе тестовой площадки ALCF (Argonne Leadership Computing Facility). Groq является разработчиком чипов GroqChip, спроектированных с прицелом на решение задач ИИ и машинного обучения. Эти изделия, наделённые 230 Мбайт памяти SRAM, обеспечивают производительность до 750 TOPS INT8 и до 188 Тфлопс FP16. ![]() Источник изображения: Аргоннская национальная лаборатория Процессоры GroqChip являются основой ускорителей GroqCard с интерфейсом PCIe 4.0 x16. Восемь таких карт входят в состав сервера GroqNode формата 4U. Наконец, до восьми серверов GroqNode используются в кластерах GroqRack. И именно такие узлы являются основой новой ИИ-платформы ALCF. Заявленная производительность каждого узла достигает 48 POPS (INT8) или 12 Пфлопс (FP16). Экосистема программного и аппаратного обеспечения Groq предназначена для ускорения решения сложных ИИ-задач, в частности, инференса. Исследователи будут применять НРС-платформу при реализации ресурсоёмких научных проектов в таких областях, как визуализация, термоядерная энергия, материаловедение, создание лекарственных препаратов нового поколения и пр. Отмечается, что уникальная архитектура Groq и универсальный компилятор обеспечат повышенную производительность для широкого спектра ИИ-моделей. В рамках сотрудничества Аргоннская национальная лаборатория и Groq работают над лекарствами от коронавируса, спровоцировавшего пандемию COVID-19: говорится, что время получения результатов сократилось с дней до минут. Создавая модели вируса и помогая исследователям быстро сравнивать их с базой данных, содержащей миллиарды молекул препаратов, модели ИИ позволяют идентифицировать перспективные соединения, которые будут использоваться в клинических терапевтических испытаниях.
21.10.2023 [15:52], Сергей Карасёв
Китайский разработчик больших языковых моделей Zhipu получил на развитие более $340 млнИИ-стартап Zhipu из Китая, по сообщению ресурса SiliconAngle, осуществил крупную программу финансирования, в ходе которой на развитие привлечено ¥2,5 млрд, или приблизительно $342 млн. Эти средства будут направлены на ускорение разработки решений в области ИИ и машинного обучения. Финансовую поддержку Zhipu оказали две крупнейшие технологические компании Китая — Alibaba Group Holding Ltd. и Tencent Holdings Ltd. К ним присоединились Xiaomi, оператор платформы доставки еды Meituan и некоторые другие инвесторы. Zhipu была основана в 2019 году специалистами Университета Цинхуа. Компанию возглавляет Тан Цзе (Tang Jie), профессор кафедры компьютерных наук названного вуза. Стартап специализируется на разработке больших языковых моделей (LLM), аналогичных GPT-4. В частности, Zhipu создала две LLM с открытым исходным кодом, GLM-130B и ChatGLM-6B, которые содержат 130 млрд и 6 млрд параметров соответственно. Причём вторая, как утверждается, может работать на GPU потребительского уровня. Компания также предлагает собственного чат-бота под названием Qingyan на базе ИИ. ![]() Источник изображения: pixabay.com Буквально на днях сообщалось, что Alibaba, Tencent и Xiaomi приняли участие в раунде финансирования другого китайского ИИ-стартапа — фирмы Baichuan, которая также фокусируется на разработке LLM. Эта компания получила на развитие $300 млн в дополнение к $50 млн, привлечённым ранее. Стартап уже занимается коммерческим внедрением модели Baichuan2-53B, которая содержит 53 млрд параметров.
21.10.2023 [15:51], Сергей Карасёв
Мини-кластер Mixtile Cluster Box с четырьмя одноплатными компьютерами рассчитан на edge-приложенияДля заказа, по сообщению ресурса CNX Software, доступен кластер небольшого форм-фактора Mixtile Cluster Box, предназначенный для решения задач в сфере периферийных вычислений или малого бизнеса. По сути, новинка представляет собой корпус со встроенным коммутатором PCIe, предназначенный для размещения четырёх одноплатных компьютеров Mixtile Blade 3. Каждая из плат Mixtile Blade 3 несёт на борту процессор Rockchip RK3588, который объединяет квартеты ядер Cortex-A76 и Cortex-A55, ускоритель Arm Mali G610MC4 и NPU-блок производительностью до 6 TOPS. Объём оперативной памяти LPDDR4 достигает 32 Гбайт, вместимость флеш-чипа eMMC — 256 Гбайт. ![]() Источник изображения: Mixtile Управляющая плата использует MIPS-процессор MediaTek MT7620A с частотой 580 МГц. Есть 256 Мбайт памяти DDR2 и 16 Мбайт памяти SPI Flash. Задействован PCIe-коммутатор ASMedia ASM2824 с четырьмя разъёмами PCIe 3.0 х4. Система работает под управлением OpenWrt 22.03 Для накопителей доступны четыре слота M.2 M-Key (NVMe; PCIe 3.0 x2) и четыре порта SATA-3 (все подключены к Mixtile Blade 3). Для каждого из узлов на базе Mixtile Blade 3 предусмотрены по два сетевых порта RJ-45, по два интерфейса HDMI и по два порта USB 3.2 Gen1 Type-C. Собственно кластер оснащён двумя портами SFF-8643 и гнездом RJ-45. В системе охлаждения применены два вентилятора диаметром 60 мм. Габариты составляют 213 × 190 × 129 мм. Питание подаётся через DC-разъём. Диапазон рабочих температур простирается от 0 до +80 °C. Приобрести Mixtile Cluster Box можно за $339 (без одноплатных компьютеров в комплекте).
21.10.2023 [15:26], Сергей Карасёв
Samsung представила чипы памяти HBM3E с пропускной способностью более 1,2 Тбайт/сКомпания Samsung Electronics в ходе ежегодного мероприятия Memory Tech Day сообщила о начале поставок образцов микросхем памяти HBM3E нового поколения с кодовым названием Shinebolt. Утверждается, что изделия Shinebolt обеспечивают прирост производительности примерно на 50 % по сравнению с чипами HBM3E предыдущего поколения (Icebolt). Пропускная способность в расчёте на контакт достигает 9,8 Гбит/с против 6,4 Гбит/с у Icebolt. ![]() Источник изображения: Samsung Таким образом, общая пропускная способность микросхем Shinebolt составляет до 1,228 Тбайт/с. Это позволяет использовать память в высоконагруженных системах, обрабатывающих приложения генеративного ИИ и машинного обучения. С целью повышения плотности компоновки и улучшения тепловых характеристик Samsung оптимизировала свою технологию непроводящей пленки (NCF): это позволило минимизировать зазоры между слоями чипа и максимизировать теплопроводность. Samsung планирует производить 12-ярусные чипы Shinebolt с максимальной ёмкостью 36 Гбайт. Среди других продуктов, представленных компанией Samsung на мероприятии Memory Tech Day, — 32-гигабитные чипы DDR5 DRAM, первая в отрасли память GDDR7 с пропускной способностью 32 Гбит/с и архитектура PBSSD для создания решений «петабайтного класса».
21.10.2023 [01:01], Алексей Степин
Собери сам: Arm открывает эру кастомных серверных процессоров инициативой Total DesignСегодня на наших глазах в мире процессоростроения происходит серьёзная смена парадигм: от унифицированных архитектур общего назначения и монолитных решений разработчики уходят в сторону модульности и активного использования специфических аппаратных ускорителей. Разумеется Arm не осталась в стороне — на мероприятии 2023 OCP Global Summit компания рассказала о новой инициативе Arm Total Design. Эта инициатива должна помочь как создателям новых процессоров за счёт ускорения процесса разработки и снижения его стоимости, так и владельцам крупных вычислительных инфраструктур. Последние всё больше склоняются к специализации и дифференциации в процессорных архитектурах новых поколений, но ожидают также энергоэффективности, дружественности к экологии и как можно более низкой совокупной стоимости владения. В основе инициативы Arm лежит анонсированная ещё в августе на HotChips 2023 процессорная платформа Arm Neoverse Compute Subsystem (CSS). Neoverse CSS N2 (Genesis) представляет собой готовый набор IP-решений Arm, включающий в себя процессорные ядра, внутреннюю систему интерконнекта, подсистемы памяти, ввода-вывода, управлениям питанием, но оставляющий место для интеграции партнёрских разработок — различных движков, ускорителей и т.п. По сути, речь идёт о почти готовых процессорах, не требующих длительной разработки процессорной части с нуля и всех связанных с этим процессом действий — верификации, тестирования на FPGA, валидации дизайна и многого другого. По словам Arm такой подход позволяет сэкономить разработчикам до 80 человеко-лет труда инженеров. Дизайн Neoverse CSS N2 довольно гибок: финальный процессор может включать в себя от 24 до 64 ядер Arm, работающих в частотном диапазоне 2,1–3,6 ГГц. Предусмотрено по 64 Кбайт кеша инструкций и данных, а вот объёмы кешей L2 и L3 настраиваются и могут достигать 1 и 64 Мбайт соответственно. Ядра реализуют набор инструкций Arm v9 и содержат по два 128-битных векторных блока SVE2. Имеется поддержка инструкций, характерных для ИИ-задач и криптографиии. Подсистема памяти может иметь до 8 каналов DDR5, а возможности ввода-вывода включают в себя 4 блока по 16 линий PCIe или CXL. Также возможно объединение двух чипов CSS N2 в едином корпусе, что даёт до 128 ядер на чип. В качестве внутреннего интерконнекта используется меш-сеть Neoverse CMN-700. В дизайне Neoverse CSS N2 имеются и вспомогательные ядра Cortex-M7. Они работают в составе блоков System Control Processor (SCP) и Management Control Processor (MCP), то есть управляют работой основного вычислительного массива, в том числе отвечая за его питание и тактовые частоты. Инициатива Arm Total Design расширяет рамки Neoverse Compute Subsystem: речь идёт о создании полноценной экосистемы, обеспечивающей эффективную коммуникацию между партнёрами программы Neoverse CSS и предоставление им полноценного IP-инструментария и EDA, созданных при участии Cadence, Rambus, Synopsys и др. Также подразумевается поддержка ведущих производителей «кремния» и разработчиков прошивок, в частности, AMI. В число участников проекта уже вошли такие компании, как ADTechnology, Alphawave Semi, Broadcom, Capgemini, Faraday, Socionext и Sondrel. Ожидается поддержка от Intel Foundry Services и TSMC, позволяющая говорить об эффективной реализации необходимых для мультичиповых решений технологий AMBA CHI C2C и UCIe. Будучи объединённым под одной крышей инициативы Arm Total Design, такой конгломерат ведущих разработчиков и производителей микроэлектроники и системного ПО для него, сможет в кратчайшие сроки не просто создавать новые процессоры, но и гибко отвечать на вызовы рынка ЦОД и HPC, наделяя чипы поддержкой востребованных технологий и ускорителей. В качестве примера можно привести совместный проект Arm, Socionext и TSMC, в рамках которого ведётся разработка универсального чиплетного процессора, который в различных вариантах компоновки будет востребован гиперскейлерами, поставщиками инфраструктуры 5G/6G и разработчиками периферийных ИИ-систем.
20.10.2023 [22:33], Владимир Мироненко
Переделан, но не сломлен: как уход иностранных компаний изменил российский IT-рынокСогласно исследованию РУССОФТ, объём российского рынка ПО почти не изменился в 2022 году, увеличившись в рублёвом выражении год к году на 1 % до 1,133 трлн руб., а в долларовом — на 8,8 % до $16,56 млрд (связано с укреплением рубля). Согласно методике РУССОФТ, рынок ПО включает импорт услуг ($3,358 млрд. или 218 млрд руб. в 2022 году по данным ЦБ РФ), продажи российского ПО в стране (640 млрд руб. или $9,35 млрд по оценке РУССОФТ) и продажи услуг по заказной разработке (264 млрд руб. или $3,86 млрд). В связи с ростом продаж российского ПО на внутреннем рынке на 37,1 % и сокращением импорта компьютерных услуг, по данным ЦБ РФ, на 40 % (в пересчёте на рубли), доля зарубежного ПО сократилась с 34 % до почти 20 %, а доля отечественного выросла с 66 % до почти 80 %. Объём продаж услуг по заказной разработке ПО на внутреннем рынке почти не изменился — 23 % рынка ПО (+0,5 % к 2021 году). Вместе с тем значительно возросла доля отечественного ПО — с 42,5 до почти 57 %. Эксперты отмечают, что уход зарубежных вендоров в 2022 году привёл к тому, что планы по цифровой трансформации пришлось отложить на год-два, а российские компании потянулись в облака. В связи с разной методикой расчётов, оценки рынка РУССОФТ отличаются от IDC, пророчившей в 2022 году падение российского ИТ-рынка на 39 %, чего в действительности не произошло. РУССОФТ отметил отсутствие большой разницы в основных изменениях на мировом и российском рынках. Глобальные расходы на ИТ и аналогичные затраты в России сократились почти одинаково при оценке в долларах — в России примерно на 2,5 %, а в мире на 0,2 % (по данным Gartner). В России и во всем мире снизились расходы на аппаратное обеспечение, а увеличились на ИТ-услуги и ПО. ![]() Источник изображения: РУССОФТ Также нет большой разницы на рынке корпоративного ПО. По данным Gartner, мировой рынок увеличился на 7,1 %, а российский, по данным «СТРИМ Консалтинг» — на 4,5 %, а по оценке РУССОФТ — не менее чем на 8 % (подсчёт в долларах). Как в России, так и в мире опережающими темпами растут облака, IoT, кибербезопасность, ИИ, а вот VR/AR так и не стали одним из драйверов ИТ-рынка. В России отмечено значительное сокращение венчурного рынка на не менее чем на 50 %, но и на мировом рынке произошло сокращение рынка, хотя и не такое значительное. Однако при более детальном анализе можно увидеть кардинальные различия. Рост выручки от предоставления ИТ-услуг вызван в России, прежде всего, необходимостью адаптировать информационные системы под новые условия в связи с уходом зарубежных вендоров, чего нет на глобальном рынке. Кроме того, рост продаж ПО в России в долларовом выражении был связан преимущественно с массовым замещением продуктов западных компаний, чего также не было в глобальном масштабе. В 2022 году также усилилось различие российского и мирового ИТ-рынков по степени влияния на них государства, которое в России значительно выросло после введения беспрецедентных антироссийских санкций. Согласно данным Gartner, по всему миру расходы государственных ведомств на ИТ в 2022 г. увеличились на 5 %, а весь мировой рынок сократился на 0, 2%. В России эти показатели изменились на +25 % и -2,5–3 % соответственно.
20.10.2023 [21:59], Руслан Авдеев
Азиатский интернет-регистратор APNIC заканчивает делегировать IPv4-адреса своего последнего /8-блокаРегиональный интернет-регистратор Asia-Pacific Network Information Centre (APNIC) объявил о том, что скоро выдаст последний свободный /8-блок, передаёт The Register. Не секрет, что глобальные запасы IPv4-адресов истощаются. В каждой подсети /8 (максимум, выдаваемый IANA) насчитывает 16 777 216 адресов. Делегация ресурсов последнего такого блока APNIC (103/8) началась в апреле 2011 года. На тот момент APNIC пришлось прибегнуть к ограничительной политике, в рамках которой выдавал более мелкие подсети каждому участнику — /22 (1024 IPv4-адреса), а потом /23 (512 адресов). Впрочем, ещё в 2020 году сообщалось, что APNIC выявила в своём реестре 50 млн фактически незадействованных адресов IPv4. В минувший понедельник представитель APNIC сообщил, что в блоке 103/8 осталось всего 30 976 адресов и что они закончатся до конца недели. Тем не менее, у заинтересованных сторон есть повод для оптимизма — в распоряжении регистратора всё ещё имеется 5 071 616 адресов из числа резервных или «восстановленных» из других блоков. В APNIC сообщают, что «запасных» адресов хватит лет на пять, но истощение блока 103/8 является недвусмысленным напоминанием — время переходить на IPv6. |
|