Материалы по тегу: cpu
16.05.2023 [09:23], Сергей Карасёв
Индия представила свой первый серверный процессор AUM: 96 ядер и 96 Гбайт памяти HBM3Центр развития передовых вычислений (C-DAC) Департамента электроники и информационных технологий Министерства коммуникаций и информационных технологий Индии представил первый в стране процессор для серверов и НРС-систем. Изделие под названием AUM выйдет на коммерческий рынок в текущем или следующем году. Решение имеет чиплетную компоновку на базе двух модулей A48Z, каждый из которых насчитывает 48 вычислительных ядер Zeus с архитектурой Arm. Таким образом, суммарное количество ядер достигает 96. Тактовая частота составляет 3,0 ГГц (до 3,5 ГГц в турбо-режиме); показатель TDP варьируется от 280 до 320 Вт. Новинка будет изготавливаться на предприятии TSMC по 5-нм технологии. Чип содержит 96 Мбайт кеша L2 и 96 Мбайт системного кеша. Изделие получило 96 Гбайт памяти HBM3 и 8-канальный контроллер DDR5-5200; кроме того, имеется доступ к 64 Гбайт памяти HBM3-5600. Таким образом, задействована трёхуровневая подсистема памяти. Упомянуты до 128 линий PCIe 5.0 с поддержкой CXL. Процессор AUM может применяться в двухсокетных серверах. Заявленная производительность превышает 4,6 Тфлопс в расчёте на разъём. Реализованы различные средства обеспечения безопасности, в том числе функция Secure Boot и криптографические алгоритмы.
13.05.2023 [20:50], Сергей Карасёв
Российский разработчик RISC-V решений CloudBEAR увеличил годовую прибыль в 15 разРоссийская компания Cloudbear, по сообщению CNews, в 2022 году значительно улучшила финансовые показатели. В частности, чистая прибыль взлетела на 1451 %, или более чем в 15 раз: если в 2021-м она составляла приблизительно 11,5 млн руб., то по итогам прошлого года достигла 178,5 млн руб. Cloudbear специализируется на разработке IP-решений на архитектуре RISC-V, которые применяются в «системах на кристалле» российских и международных дизайн-центров. Кроме того, компания создаёт целый ряд средств проектирования, разработки и отладки, а также системное ПО. Два года назад владелец «Байкал электроникс» купил долю в Cloudbear. Syntacore, ещё один российский разработчик RISC-V решений, в 2019 году попал под контроль YADRO. По данным Федеральной налоговой службы РФ, на которые ссылается CNews, в 2022 году Cloudbear получила выручку в размере 224 млн руб. Это на 540 % больше по сравнению с результатом за предыдущий год, когда показатель равнялся 35 млн руб. Баланс компании в годовом исчислении увеличился с 15,6 млн руб. до 194,7 млн руб., то есть, вырос почти в 12,5 раза. Генеральный директор Cloudbear сообщил изданию, что в 2022 году компания смогла закрыть несколько крупных сделок по лицензированию своих продуктов. Вероятно, интерес к отечественным решениям на основе RISC-V также увеличился на фоне сложившейся геополитической обстановки, спровоцировавшей уход из РФ крупных зарубежных поставщиков чипов.
12.05.2023 [16:41], Сергей Карасёв
Стоимость российских процессоров взлетела вдвое с начала 2023 годаНа фоне сложившейся геополитической обстановки, по сообщению газеты «Коммерсантъ», в России резко увеличились цены на процессоры отечественных разработчиков. Так, только с начала 2023 года некоторые чипы МЦСТ и «Байкал Электроникс» подорожали приблизительно в два раза. По мнению участников рынка, стоимость российских процессоров растёт по нескольким причинам. Из-за ухода из РФ ряда зарубежных компаний и введённых санкций значительно увеличился спрос на отечественную продукцию среди российских производителей серверов, СХД и компьютеров. Кроме того, от изготовления разработанных в России чипов отказался тайваньский контрактный производитель TSMC. Поэтому компании из РФ вынуждены искать новые площадки для выпуска своей продукции, а это создаёт дополнительные логистические сложности и приводит к повышению затрат. В такой ситуации поставщики электроники также начинают поднимать цены. Отмечается, что из-за высокой стоимости и недостаточных объёмов поставок российских процессоров и других компонентов отечественные производители вычислительной техники вынуждены искать зарубежные альтернативы. Зачастую такие элементы гораздо проще получить, несмотря на санкции. «Российские производители электроники на отечественных процессорах анонсируют и демонстрируют в основном опытные образцы изделий, без массового выпуска, именно потому, что компаниям не хватает российских компонентов», — пишет «Коммерсантъ».
09.05.2023 [15:23], Сергей Карасёв
Космический RISC-V: 432-ядерный европейский чип Occamy готов к выходуЕвропейское космическое агентство (ESA), по сообщению HPC Wire, близко к выпуску специализированного процессора под названием Occamy, спроектированного для использования в космической технике. В основу решения с чиплетной компоновкой положена архитектура RISC-V. Сообщается, что в составе изделия соседствуют современные и неновые технологии. Чип ориентирован прежде всего на задачи ИИ и НРС. Процессор создан по программе EuPilot, цель которой заключается в снижении зависимости от проприетарных платформ х86 и Arm. В разработке Occamy приняли участие специалисты Швейцарской высшей технической школы Цюриха (ETH Zürich) и Болонского университета (Италия). В состав Occamy входят два вычислительных модуля, каждый из которых содержит 216 ядер RISC-V. Таким образом, суммарное количество ядер достигает 432. Задействованы два блока памяти HBM2e ёмкостью 16 Гбайт. Кроме того, процессор содержит 64-бит блоки для FP-вычислений. Соединения размещены в кремниевом слое-интерпозере (interposer). Occamy насчитывает в общей сложности приблизительно 1 млрд транзисторов. Заявленная производительность FP64 достигает 0,75 Тфлопс, FP8 — 6 Тфлопс. Изделию не требуется активное охлаждения. Общие размеры составляют 73 × 73 мм. Новинка также включает «лёгкое» 32-битное ядро, выполняющее функции управления. Применена память HBM2e разработки Micron, а само решение Occamy изготавливается на предприятии Globalfoundries с применением техпроцесса 12LPP. Процессор Occamy можно эмулировать на базе FPGA. Реализация, в частности, была протестирована на FPGA AMD Xilinx Virtex UltraScale+ HBM и FPGA Virtex UltraScale+ VCU1525.
21.04.2023 [14:48], Алексей Степин
AMD представила процессоры Ryzen Embedded 5000 для сетевых и edge-платформAMD продолжает активно расширять портфолио x86-совместимых процессоров. Вчера компания представила новые чипы Ryzen Embedded 5000 на базе отлично зарекомендовавшей себя архитектуры Zen 3. Новые 7-нм чипы созданы с упором на высокую энергоэффективность и предназначены для сетевых платформ различного рода — маршрутизаторов, межсетевых экранов и тому подобного оборудования. На момент анонса модельный ряд включает в себя четыре варианта CPU с количеством ядер от 6 до 16 и теплопакетом от 65 до 105 Вт. Объём кеша у 6- и 8-ядерных вариантов составляет 32 Мбайт, у старших 12- и 16-ядерных версий — 64 Мбайт. Все процессоры рассчитаны на работу с двумя каналами DDR4-3200 (ECC). Количество доступных процессорных линий PCI Express 4.0 — 24. При использовании чипсета X570 — 36 линий. Процессоры используют широко распространённый разъём AM4 и совместимы с теми же наборами системной логики, что и обычные Ryzen 5000. Отдельно AMD отмечает, что Ryzen Embedded 5000 отвечают строгим промышленным стандартам надёжности и обслуживаемости (RAS) и рассчитаны на работу под нагрузкой в режиме 24/7. Эти новинки должны заполнить некоторый вакуум между экономичными Ryzen Embedded V3000 в BGA-упаковке и мощными, но дорогими процессорами EPYC Embedded 9004. Новые решения найдут своё место в компактных, но при этом достаточно производительных сетевых решениях и системах хранения данных для малого и среднего бизнеса, а также везде, где требуется достаточно высокая производительность при умеренном тепловыделении. Сюда относятся, к примеру, компактные edge-серверы и другие системы подобного рода.
10.04.2023 [20:45], Сергей Карасёв
Дебютировал 32-ядерный серверный процессор Loongson 3D5000 на базе китайской архитектуры LoongArchКитайская компания Loongson анонсировала свой флагманский процессор 3D5000, первая информация о котором появилась в конце прошлого года. Чип ориентирован на ЦОД и облачные платформы. Поначалу изделие будет поставляться в интересах государственных компаний КНР. Кроме того, компания запустила собственную облачную платформу на базе новинок. Loongson 3D5000 имеет чиплетную компоновку и упаковке LGA 4129 с размерами 75,4 × 58,5 × 7,1 мм. Новинка содержит два чипа 3C5000, каждый из которых имеет 16 ядер на базе микроархитектуры LoongArch (есть защита от уязвимостей класса Meltdown/Spectre) с частотой 2,0 ГГц. 3D5000 имеет 64 Мбайт кеш-памяти, восемь каналов DDR4-3200 ECC (50+ Гбайт/с в Stream) и пять линий интерфейса HT 3.0. TDP равен 300 Вт, однако, как утверждает разработчик, обычно значение составляет около 150 Вт. Для 3D5000 заявлена возможность использования в составе двух- и четырёхсокетных серверов. В таких конфигурациях для обеспечения взаимодействия между CPU и другими компонентами служит специализированный мост 7A2000. Утверждается, что по сравнению с изделием предыдущего поколения модуль 7A2000 обеспечивает повышение производительности на 400 %. Для связи моста с CPU используются 16 линий интерфейса HT3.0 (6,4 Гбит/с), детальные характеристики которого не раскрываются. Кроме того, мост включает видеоадаптер (пара HDMI, один VGA) и предоставляет 32 линии PCI 3.0, четыре порта SATA-3, восемь интерфейсов USB 2.0 и четыре — USB 3.0. Присутствует и ряд служебных шин: SPI, LPC, I2C, CAN, UART, а также выводы GPIO. Согласно предоставленным компанией Loongson цифрам, чип набирает более 425 баллов в тесте SPEC CPU2006. Процессор, как утверждается, имеет более 1 Тфлопс производительности (FP64), что обеспечивается двум 256-бит векторными блоками. В двух- и четырёхпроцессорных системах можно получить 800 и 1500 баллов в SPEC CPU2006, а FP64-производительность может достигать 2 и 4 Тфлопс соответственно. Чип имеет встроенный модуль безопасности и поддерживает национальный алгоритм шифрования (5+ Гбит/с). Помимо 3D5000 и 7A2000, компания Loongson также анонсировала BMC-чип 2K050. Он оснащён ядрами LA264 с частотой 500 МГц, поддерживает память DDR3 и обеспечивает видеовывод 1080p@60. Данные чип предлагает по паре линий PCI 2.0 и SATA-2, один порт USB 3.0, четыре порта USB 2.0, а также целый ряд служебных интерфейсов: DVO, PCI, GMAC, SPI, LPC, LIO, I2C, AC97/HDA, UART, SDIO, CAN, PS/2, PWM, GPIO.
05.04.2023 [23:41], Владимир Мироненко
SiPearl привлекла €90 млн на выпуск первого европейского Arm-процессора Rhea для суперкомпьютеровФранцузская компания SiPearl, занимающаяся разработкой энергоэффективного высокопроизводительного Arm-процессора Rhea для европейских суперкомпьютеров, сообщила о завершении раунда финансирования серии А, в ходе которого она привлекла €90 млн. С учётом новых инвестиций объём финансирования SiPearl достиг €110,5 млн. Ожидается, что к концу года компании удастся привлечь ещё больше инвестиций. Сюда входят гранты Евросоюза и Франции на сумму €20,5 млн евро, предоставленные консорциумом European Processor Initiative (EPI), программой EIC Accelerator и регионом Иль-де-Франс. В раунде A приняли участие Arm, Atos Group (через Eviden), Фонд Европейского инновационного совета (€15 млн евро) и правительство Франции через French Tech Souveraineté. Финансирование включает конвертируемые долговые обязательства Европейского инвестиционного банка (ЕИБ) на сумму до €25 млн евро. Rhea на базе Arm Neoverse V1 является специализированным энергоэффективным процессором для высокопроизводительных вычислений (HPC), предназначенным для работы с любыми ускорителями сторонних производителей, в том числе для ИИ и квантовых вычислений. Уже объявлено о заключении соглашений о сотрудничестве с AMD, Intel, NVIDIA и Graphcore. Выпуском Rhea займётся TSMC, а начало коммерческих поставок запланировано на начало 2024 года. «Исторически отставая от США и Китая, Европа стала мировым лидером в области высокопроизводительных вычислений благодаря инициативе EuroHPC, впервые включив две системы в четвёрку самых мощных суперкомпьютеров мира: LUMI в Финляндии и Leonardo в Италии. Появление на рынке микропроцессора SiPearl Rhea <…> станет ещё одним решающим шагом на пути к технологической независимости и суверенитету Европы», — заявил Филипп Ноттон (Philippe Notton), генеральный директор и основатель SiPearl, выразив благодарность инвесторам.
30.03.2023 [19:45], Владимир Мироненко
В 2023 году Intel выпустит Xeon Emerald Rapids и подготовит полтора десятка FPGA, а чипы Sierra Forest и Granite Rapids появятся уже в 2024 годуВ ходе мероприятия для инвесторов Intel подтвердила свои планы по противодействию процессорам AMD EPYC Bergamo, в которых будет использоваться архитектура с высокой плотностью ядер Zen4c, а также всё нарастающему давлению Arm. Intel придерживается планов по созданию собственных архитектур с производительными и энергоэффективными ядрами для чипов Xeon. Intel объявила, что рассчитывает выпустить следующее, пятое по счёту поколение процессоров Xeon Scalable под кодовым названием Emerald Rapids (EMR), преемников Sapphire Rapids (SPR), в IV квартале 2023 года. Компания также продемонстрировала чип Emeralds Rapids, состоящий из двух чиплетов (тайлов в терминологии Intel). Sapphire Rapids, напомним, имеется четыре тайла меньших размеров. Сообщается, что образцы Emerald Rapids уже доступны избранным заказчикам. Не вдаваясь особо в технические подробности, компания рассказала, что Emerald Rapids будет работать в том же диапазоне TDP, что и Sapphire Rapids, что повысит общую производительность платформы в пересчёте на Вт. Учитывая то, что Emerald Rapids будет использовать ту же платформу LGA 4677, что и Sapphire, заказчики смогут заменить Sapphire на Emerald в существующих решениях. Такой подход позволит легко модернизировать уже внедрённые системы, а в случае производителей оборудования — ускорить вывод Emerald Rapids на рынок. Emerald Rapids будет построен на том же техпроцессе Intel 7. Это означает, что прирост производительности должен быть обеспечен за счёт архитектурных улучшений. Intel сообщила о «повышенной плотности ядер», поэтому можно предположить, что у Emerald Rapids будет больше ядер в сравнении с Sapphire Rapids. Вслед за Emerald Rapids компания планирует начать в 2024 году поставки чипов следующего поколения Granite Rapids (GNR) на базе производительных P-ядер. Сообщается, что вычислительные тайлы Granite Rapids будут выпускаться с использованием техпроцесса Intel 3. Intel также впервые сообщила, что Granite Rapids будут поддерживать MCR DIMM (DDR5-8800+) и обеспечат ПСП в пределах 1,5 Тбайт/с (12 каналов памяти). Ещё одной особенностью станет полный переход на чиплетную компоновоку с независимым IO-тайлом. Первые образцы Granite Rapids уже тестируются некоторыми заказчиками. В первой половине 2024 года должен выйти и процессор Sierra Forest (SRF), первый Intel Xeon с энергоэффективными E-ядрами (следующее за Gracemont поколение) общим числом до 144 единиц. Сообщается, что Sierra Forest и Granite Rapids будут использовать одну и ту же платформу Birch Stream. Следует отметить, что чипы Sierra Forest появятся несколько раньше, чем Granite Rapids, и тоже будут использовать техпроцесс Intel 3, а также IO-тайлы. Отмечается, что Sierra Forest даже в текущем виде оказались на удивление стабильно работающими. Более того, их уже тестирует как минимум один заказчик Intel. На смену Sierra Forest придут в 2025 году чипы Clearwater Forest (CWF), которые станут первыми в семействе Intel Xeon, основанными на техпроцессе Intel 18A. По словам Intel, её заказчики не хотят серверные процессоры смешанной архитектуры, то есть требуют чипы либо только с P-ядрами, либо только с E-ядрами. Sierra Forest сейчас является, пожалуй, наиболее важным продуктом для Intel и для демонстрации производственных возможностей, и для сохранения заказчиков среди гиперскейлеров. Что касается ускорителей, то компания в этом году планирует подготовить сразу 15 различных FPGA в сериях Agilex и Stratix, а также eASIC. Intel, как уже говорилось ранее, не забрасывает работу над специализированными ускорителями Habana, но грядущие Gaudi3 от нынешних Gaudi2 будут отличаться переходом с 7-нм на 5-нм техпроцесс. Отменённых Rialto Bridge в планах более нет, да и Falcon Shores тоже не упоминаются. При этом Intel считает, что к 2027 году в области ИИ-чипов соотношение между CPU и GPU будет на уровне 60/40.
22.03.2023 [00:09], Алексей Степин
NVIDIA показала сдвоенный серверный суперпроцессор Grace SuperchipПроект NVIDIA Grace весьма амбициозен: компания всерьёз намерена ворваться с его помощью на рынок высокопроизводительных серверных процессоров, где всё ещё доминируют решения Intel и AMD. Об этом чипе было объявлено ещё на конференции GTC 2022, а на GTC 2023 глава компании, наконец, показал его вживую. В рамках продолжающегося роста плотности упаковки вычислительных мощностей в современных ЦОД на первый план выдвинулась не голая производительность, а соотношение производительности к уровню энергопотребления и тепловыделения. По сочетанию этих параметров x86 далеко не оптимальна, и тут у NVIDIA есть все шансы. С анонсом Grace Superchip NVIDIA провозглашает (впрочем, уже не в первый раз) смерть «закона Мура» — пришло время оптимизации и отказа от устаревших, по мнению компании, вычислительных архитектур. Процессор NVIDIA Grace воплощает в себе все современные тенденции, начиная с отказа от монолитного кристалла. Сборка Grace Superchip состоит из двух кристаллов, каждый из которых включает в себя 72 ядра Arm Neoverse V2 (Arm v9), поддерживающих векторные расширения SVE2 и оптимизированные для ИИ форматы BF16/INT8. Кристаллы соединены между собой шиной NVLink-C2C, обеспечивающей пропускную способность 900 Гбайт/с. В сборку интегрированы чипы памяти LPDDR5x общим объёмом до 960 Гбайт, причём каждый кристалл имеет свою шину доступа к памяти с производительностью 500 Гбайт/с. При этом с точки зрения ПО Grace Superchip представляется единым 144-ядерным процессором с ПСП на уровне 1 Тбайт/с. Для достижения схожих параметров в мире x86 требуется двухпроцессорная платформа AMD Genoa, куда более сложная технически и гораздо менее энергоэффективная, но при этом обладающая всеми недостатками NUMA-систем. Достаточно сравнить энергопотребление: 900 Вт против 500 у нового решения NVIDIA. NVIDIA есть чем гордиться: при сопоставимом уровне энергопотребления Grace Superchip превосходит своих конкурентов из мира x86 в 2,3 раза при запуске микросервисов, вдвое опережает их в приложениях с интенсивным обменом данными с памятью и почти вдвое — в задачах симуляции вычислительной гидродинамики. В ряде других научно-технических задач преимущество может быть и более чем двукратным. Это достигнуто в том числе благодаря изначальной оптимизации дизайна процессора с упором на максимальную производительность передачи данных. Внутренне Grace организован по принципу меш-сети с распределённой системой кеширования на базе специальных узлов коммутации CSN (Cache Switch Nodes). Называется эта сеть Scalable Coherency Fabric, она имеет пропускную способность 3,2 Тбайт/с, а объём кеша L3 составляет 117 Мбайт на кристалл и 234 Мбайт совокупно. Сервер на базе NVIDIA Grace не только может потреблять меньше энергии, но и будет существенно проще конструктивно, поскольку модуль Grace Superchip содержит не только процессорные ядра и память, но также и регуляторы напряжения. От платформы на базе нового процессора требуется только PCIe 5.0 — у нового чипа есть два набора по 64 линии. Причём линии с поддержкой CXL 2.0, так что проблем с расширением доступного объёма памяти новинка испытывать не будет. Даже компактные серверы высотой 1U смогут вместить две сборки Grace Superchip, что даст 288 ядер и почти 2 Тбайт оперативной памяти — труднодостижимый в таких габаритах показтель для более традиционных конструктивов процессоров и системных плат. Сравнительно невысокий теплопакет позволит таким решениям обходиться традиционным воздушным охлаждением. При этом есть и вариант Grace Hopper, сочетающий в одном модуле кристалл Grace и новейший GPU H100, причём параметрами PCI Express последний ограничен не будет благодаря NVLink-C2C. NVIDIA уже начала первичные поставки Grace, а начало полномасштабного производства ожидается во второй половине года. Новыми процессорами заинтересовались крупные производители оборудования, включая ASUS, Atos, GIGABYTE, HPE, QCT, Supermicro, Wistron и ZT Systems. Лос-Аламосская национальная лаборатория объявила, что использует NVIDIA Grace в новом суперкомпьютере Venado, который поможет учёным в исследованиях новых материалов и возобновляемых источников энергии. Ряд крупных европейских и азиатских ЦОД также рассматривает перспективы применения новых процессоров NVIDIA. В частности, одной из систем на базе Grace станет кластер Alps в Швейцарском национальном компьютерном центре.
20.03.2023 [18:51], Сергей Карасёв
Референсная плата Venue City для будущих Intel Xeon обеспечит поддержку процессоров с TDP до 500 ВтВ интернете, как сообщает ресурс VideoCardz, появилась информация о решении для валидации будущих Intel Xeon — плате с кодовым названием Avenue City. Предполагается, что речь идёт о платформах Birch Stream и Mountain Stream для процессоров Sierra Firest-AP и Granite Rapids-AP, поскольку для Avenue City, судя по габаритам сокета, предусмотрено использование разъёма LGA-7529. Показатель TDP будущих чипов теоретически сможет достигать 500 Вт. Говорится о поддержке 12 каналов оперативной памяти DDR5-6400, а также MCR-модулей (DDR5-8000). Эталонная платформа Avenue City RP включает 20-слойную печатную плату с размерами приблизительно 424,2 × 508,0 мм. Она содержит два процессорных разъёма и 24 слота для модулей ОЗУ. Новая плата, вероятно, ориентирована на гиперскейлеров, на что, в частности, указывает наличие слота для модуля DC-SCM с RunBMC. Процессоры Granite Rapids, по предварительной информации, получат до 128 вычислительных ядер (256 потоков инструкций). Изделия Sierra Forest, в свою очередь, будут насчитывать до 334 ядер (столько же потоков инструкций). В дальнейшие планы Intel входит выпуск платформы с процессорами Diamond Rapids и Clearwater Forest. Эти чипы увидят свет не ранее середины текущего десятилетия. |
|