Материалы по тегу: cpu

19.12.2025 [15:35], Игорь Осколков

Ишь какой «Иртыш»: анонсированы российские 64-ядерные серверные процессоры C664 на китайской архитектуре LoongArch

Российская компания «Трамплин Электроникс» готовит отечественные 12-нм серверные процессоры «Иртыш» C616, C632 и C664 с 16, 32 и 64 ядрами LAA64 на китайской архитектуре LoongArch. Это последнее поколение ядер Loongson, которые используются в похожих по характеристикам процессорах серии 3C6000. Название CPU выбрано, по-видимому, неспроста, поскольку р. Иртыш берёт своё начало в Китае, а заканчивает свой путь в России.

В данном случае ядра лицензированы, топология чипов собственная, имеется конструкторская и прочая документация, что вкупе позволяет записать «Иртыш» в отечественные микросхемы второго уровня. Кроме того, несмотря на уже имеющуюся относительно широкую поддержку LoongArch в популярных открытых проектах, включая ядро Linux и GCC, — в том числе благодаря стараниями и намерением Loongson сделать свою архитектуру третьей по популярности после x86 и Arm, — «Трамплин Электроникс» хочет развивать российское сообщество вокруг LoongArch и всячески популяризировать её, предоставляя техническую и методическую поддержку процессора на русском языке. Компания готовит технологическую ОС и SDK, весь базовый набор для разработки системного ПО, в том числе окружение для кросс-компиляции.

 Источник изображений: «Трамплин Электроникс»

Источник изображений: «Трамплин Электроникс»

На данный момент «Трамплин Электроникс» разработала топологию и низкоскоростные ядра. В разработке находится модуль безопасности, а уже в I квартале следующего года компания намерена передать партнёрам первую партию инженерных образцов новых чипов. Процессоры будут выпускаться на «дружественной фабрике, которая не попадает под санкции», а их корпусировка пока будет производиться в Китае, но со временем этот этап может быть перенесён на территорию РФ. Параллельно компания занимается референсным дизайном плат, в первую очередь для серверов, СХД и т.п., на которые и ориентированы первые чипы.

Собственно LA664 являются 64-бит суперскалярными двухпоточными (SMT2) ядрами с внеочередным исполнением и возможностью обработки до шести инструкций за такт. Каждое ядро содержит четыре целочисленных блока, четыре блока векторных операций (128/256 бит), четыре модуля генерации адресов для доступа к памяти и аппаратный ускоритель фирменных китайских алгоритмов шифрования SM2/3/4. Объём L1i- и L1d-кеша составляет 64 Кбайт, L2-кеша — 256 Кбайт. L3-кеш общий для всех ядер и размер его неизменно составляет 32 Мбайт на чиплет. В UEFI Tianocore EDK2 имеется поддержка Loongarch, так что именно «Трамплин Электроникс» и будет дорабатывать.

Самый младший процессор «Иртыш» C616 (К1902ВМ1Я) как раз и состоит из одного чиплета с 16 ядрами (16C/32T) на борту и четырьмя каналами памяти DDR4-3200 ECC (до 256 Гбайт), дополненных сопроцессором безопасности на ядре LA264 (Loongson SE). Высокоскоростные интерфейсы включают межпроцессорную когерентную шину DragonChain и 64 линии PCIe 4.0 (четыре x16), низкоскоростные интерфейсы представлены традиционными SPI, UART, S2C, GPIO. При TDP на уровне 100–120 Вт и пиковой частотой 2,2 ГГц (есть динамическое управление питанием и частотой) заявленный уровень FP64-производительности составляет 844,8 Гфлопс.

«Иртыш» C632 (К1902ВМ2Я) состоит из двух чиплетов, включает 32 ядра (32C/64T), 128 линий PCIe 4.0, восемь каналов DDR4-3200 ECC (до 1 Тбайт) и имеет TDP 180–200 Вт. При пиковой частоте 2,1 ГГц его быстродействие составляет до 1612,8 Гфлопс. Наконец, «Иртыш» C664 (К1902ВМ3Я) состоит из четырёх чиплетов, включает 64 ядра (64C/128T), имеет TDP 250–300 Вт, а при пиковой частоте 2 ГГц он «выдаёт» до 3072 Гфлопс. Количество каналов памяти и PCIe-линий у него такое же, как у C632. С C616 и C632 возможно формирование 1S, 2S- и 4S-систем, с C664 — только 1S и 2S.

Приведённые характеристики являются предварительными и фактически совпадают с таковыми у Loongson 3C6000 серий S, D и Q соответственно, хотя NoC, связывающая компоненты заявляется как собственная разработка «Трамплин Электроникс». Также утверждается, что «Иртыш» C616, C632 и C664 сравнимы с Intel Xeon Ice Lake-SP Silver 4314, Gold 6338 и Platinum 8380 соответственно (или с их аналогами поколения AMD EPYC Milan).

В ноябре «Трамплин Электроникс» совместно с «АСКОН» анонсировали создание первого отечественного ПАК на базе CPU «Иртыш» при участии «Норси-Транс». Ранее «АСКОН» уже портировала свою систему проектирования КОМПАС-3D на процессоры Loongson, а «Базальт СПО» адаптировала ОС «Альт» под архитектуру LoongArch64. Также для LoongArch были сборки ОС «РОСА».

Постоянный URL: http://servernews.ru/1134153
19.12.2025 [13:24], Сергей Карасёв

«Трамплин Электроникс» представила российскую SoC «Иртыш A68SV» с китайской архитектурой LoongArch

Российская компания «Трамплин Электроникс» представила отечественную «систему на кристалле» (SoC) под названием «Иртыш A68SV». Изделие может применяться для создания систем промышленного управления, коммуникационного оборудования, устройств интернета вещей (IoT) и пр.

Новинка выполнена на китайской архитектуре LoongArch (LA364). Задействованы два вычислительных ядра с максимальной тактовой частотой 2 ГГц. Каждое ядро содержит по 64 Кбайт кеша инструкций и данных L1 и 2 Мбайт кеша L2. Поддерживается оперативная память DDR4-2400 ECC. Упомянуты интерфейсы USB 3.0/2.0, HDMI, DVO, Gnet, GMAC, SDIO, EMMC, САМ, PCIe 3.0 и SATA 3.0. Типовое энергопотребление находится в диапазоне от 3 до 9 Вт.

Кроме того, «Трамплин Электроникс» анонсировала плату для разработчиков Devboard на базе архитектуры LoongArch LA364E. Используются восемь ядер с частотой до 2 ГГц и поддержкой 128-битных операций с плавающей точкой. Объём памяти DDR4 может достигать 64 Гбайт. Имеется интегрированное графическое ядро с поддержкой OpenGL 3.3, OpenGL ES 3.1 и OpenCL 1.1. Возможна обработка видео в формате 4K с частотой до 60 к/с. В число доступных интерфейсов входят PCIe 3.0, SATA 3.0, USB 3.1, RapidIO 2.0, USB 2.0, GMAC, SDIO, eMMC, CANFD и аудио.

 Источник изображений: «Трамплин Электроникс»

Источник изображений: «Трамплин Электроникс»

Плата Devboard соответствует стандарту COM Express. Среди её сфер использования названы контроллеры для промышленной автоматизации и IoT-оборудования, бортовые вычислители для транспортных средств и беспилотных летательных аппаратов, измерительная техника и др. Плата позволит упростить знакомство с возможностями архитектуры LoongArch.

Как отмечается, на текущий момент LoongArch является третьей по популярности CPU-архитектурой в мире после x86 и Arm. LoongArch поддерживается крупными open source проектами, включая ядро Linux, GCC, LLVM. Эта архитектура не подвержена первичным и вторичным санкциям, а поэтому в сформировавшейся геополитической обстановке является единственной альтернативой популярным зарубежным решениям, которую возможно произвести в «кремнии» для использования в России.

Постоянный URL: http://servernews.ru/1134159
17.12.2025 [17:38], Сергей Карасёв

Два ядра и 1 ГГц: Индия создала собственный процессор DHRUV64 с архитектурой RISC-V

Центр развития передовых вычислений (C-DAC), ведущая научно-исследовательская организация Индии, представил процессор собственной разработки DHRUV64 (Vega AS2161). Утверждается, что на сегодняшний день это самый совершенный чип, полностью спроектированный внутри страны.

Изделие объединяет два вычислительных ядра с архитектурой RISC-V (набор инструкций RV64IMAFD). Максимальная тактовая частота составляет 1 ГГц. Конструкция включает кеш L1 и L2 (с возможностью конфигурирования), блок управления памятью (MMU), контроллер прерываний на уровне платформы (до 127 прерываний), внешний интерфейс, совместимый с AXI4/ACE, и пр.

Процессор использует Гарвардскую архитектуру с отдельной памятью для команд (инструкций) и данных. Упомянута поддержка расширенного алгоритма прогнозирования ветвлений (BTB, BHT, RAS) и векторных прерываний. Изделие изготавливается по 28-нм технологии; показатель TDP не раскрывается. Говорится о совместимости с Linux. В качестве возможных сфер применения названы инфраструктура 5G, автомобильные системы, бытовая электроника, платформы промышленной автоматизации и интернет вещей (IoT).

 Источник изображения: CNX Software

Источник изображения: CNX Software

«Выпуск DHRUV64 знаменует собой важную веху в развитии самодостаточной экосистемы процессоров в Индии. Благодаря использованию открытой архитектуры исключаются затраты на лицензирование. Это способствует долгосрочному внедрению процессора в различных областях», — отмечается в заявлении местных властей.

Кроме того, C-DAC раскрыл планы по дальнейшей разработке процессоров на базе RISC-V. В частности, готовятся решения DHANUSH64 и DHANUSH64+ в виде «систем на кристалле» (SoC). Они получат четыре вычислительных ядра с максимальной частотой 1,2 ГГц и 2,0 ГГц соответственно. Для первого из этих чипов предусмотрен 28-нм техпроцесс, для второго — 14- или 16-нм.

Постоянный URL: http://servernews.ru/1134060
16.12.2025 [17:50], Владимир Мироненко

Универсальный ИИ-процессор Electron E1 в 100 раз энергоэффективнее традиционных CPU

Стартап из Питтсбурга (Pittsburgh) Efficient Computer выпустил оценочный набор универсального процессора Electron E1 (EVK). Как сообщает компания, Electron E1 представляет собой настоящую альтернативу чипам с использованием традиционной архитектуры фон Неймана, способную обеспечить значительно более высокую энергоэффективность, в 100 раз превышающую показатели обычных маломощных процессоров, таких как Arm Cortex-M33 и Cortex-M85.

Electron E1 предназначен для выполнения сложных задач обработки сигналов и инференса. Он основан на т.н. Efficient Fabric, разработанной компанией запатентованной архитектуре пространственного потока данных, которая позволяет снизить «чрезмерное» энергопотребление, связанное с перемещением данных между памятью и вычислительными ядрами, характерное для традиционных систем фон Неймана. При этом «разработчики по-прежнему получают привычный опыт программирования, но с существенно более высокой энергоэффективностью».

Генеральный директор Efficient Брэндон Лючия (Brandon Lucia) в интервью EE Times заявил, что предыдущие попытки отойти от подхода фон Неймана так и не были полностью реализованы: «Были мимолётные альтернативы, которые появлялись и исчезали». Он отметил, что одним из ограничений во многих альтернативах был отказ от универсальности вычислений: «Это действительно критически важно». Нечто похожее предлагает и NextSilicon Maverick.

 Источник изображения: Efficient Computer

Источник изображения: Efficient Computer

Процессор включает 128 Кбайт сверхэкономичной кеш-памяти, 3 Мбайт SRAM и 4 Мбайт энергонезависимой MRAM, а его производительность может достигать 21,6 GOPS (млрд операций в секунду) при 200 МГц в высоковольтном режиме и 5,4 GOPS при 50 МГц в низковольтном режиме.

Архитектура Fabric коренным образом переосмысливает способ выполнения вычислений, уменьшая необходимость в перераспределении данных между памятью и процессорами, говорит Лючия. Это достигается за счёт пространственного отображения операций по сетке вычислительных элементов, каждый из которых активируется только тогда, когда доступны его входные данные в отличие от непрерывного цикла инструкций и косвенной адресации данных, которые доминируют в традиционных конвейерах CPU.

Лючия отметил, что универсальный процессор важен для ИИ-технологий, поскольку он представляет собой нечто гораздо большее, чем просто алгоритмы в физическом мире — он обеспечивает, в том числе, интеграцию данных с датчиков, цифровую обработку сигналов, шифрование и преобразование: «Если ваша архитектура специализируется только на одном типе вычислений, все остальные функции остаются невостребованными».

 Источник изображения: Efficient Computer

Источник изображения: Efficient Computer

По словам главы Efficient, Electron E1 разработан для поддержки всего кода, необходимого для работы приложения, что делает его идеальным для периферийных вычислений, встроенных систем и ИИ-приложений: «Разработчики могут использовать уже имеющийся у них код». Лючия отметил, что процессор лучше всего подходит для устройств, требующих длительного времени автономной работы, а также условий ограниченного энергопотребления, например, для использования в дронах и промышленных датчиках.

Чип уже используется в устройствах партнёра Efficient, компании BrightAI, позволяя обрабатывать ИИ-нагрузки в реальном времени на периферии и снижая потребность в энергоемких облачных вычислениях для таких задач, как обработка сигналов и инференс. Лючия сообщил, что компания видит большие перспективы для использования чипа в робототехнике, автомобилестроении, космосе и оборонных приложениях, которые имеют ограничения по размерам и мощности.

Что касается E1 EVK, то он, по словам компании, разработан для того, чтобы максимально упростить изучение потенциала нового процессора. Независимо от того, разрабатываете ли вы новое ПО, проводите анализ энергопотребления или портируете существующее ПО, EVK предоставляет:

  • процесс разработки по принципу «подключи и работай»;
  • встроенные инструменты измерения энергопотребления;
  • совместимость с Arduino;
  • множество вариантов питания для реальных сценариев;
  • полный SDK и документация для быстрого запуска.

В случае отсутствия оборудования можно использовать решение Electron E1 Cloud EVK, которое предоставляет размещённую среду со всеми возможностями физической платы. Как физический EVK, так и облачный EVK доступны в рамках программы раннего доступа Efficient Computer.

Постоянный URL: http://servernews.ru/1133974
16.12.2025 [11:30], Сергей Карасёв

192-ядерные Arm-процессоры AmpereOne M появились в облаке Oracle

Компании Ampere и Oracle объявили о том, что в облачной инфраструктуре OCI (Oracle Cloud Infrastructure) стали доступны инстансы A4 Standard на основе процессоров AmpereOne M. Эти экземпляры, как утверждается, подходят для широкого спектра рабочих нагрузок — от традиционных корпоративных приложений до ресурсоёмких задач ИИ-инференса.

Чипы AmpereOne M содержат от 96 до 192 кастомизированных 64-бит ядер на базе Arm v8.6+. Используются 12 каналов DDR5-5600 с возможностью установки до 3 Тбайт памяти и 96 линий PCIe 5.0. Тактовая частота варьируется от 2,6 до 3,6 ГГц, показатель TDP — от 239 до 348 Вт.

Инстансы A4 Standard обеспечивают более высокую производительность на ядро и большую пропускную способность памяти, чем экземпляры предыдущих поколений OCI A1 и A2 с чипами Ampere. Клиентам доступны виртуальные машины VM.Standard.A4.Flex с 45 OCPU (каждый OCPU содержит два ядра AmpereOne M), 700 Гбайт памяти, блочным хранилищем и сетевым подключением с пропускной способностью 100 Гбит/с. Кроме того, предлагаются экземпляры BM.Standard.A4.48 класса Bare Metal с 48 OCPU, 768 Гбайт памяти, накопителем вместимостью 3,84 Тбайт в рамках блочного хранилища и сетевым подключением на 100 Гбит/с.

 Источник изображений: Oracle

Источник изображений: Oracle

Заказчики, переходящие с виртуальных машин OCI A2, могут рассчитывать на повышение производительности каждого ядра до 35 % — в зависимости от рабочей нагрузки. Для ресурсоёмких вычислительных задач заявлено улучшение показателей SPECint до 24 % и SPECfp до 34 %: это особенно важно для таких приложений, как аналитика данных, пакетная обработка и научные вычисления. В случае рабочих нагрузок, чувствительных к задержкам, обеспечивается улучшение производительности SPECjbb до 34 %.

Oracle подчёркивает, что для инстансов A4 Standard действуют выгодные цены: $0,0138 в расчёте на OCPU в час и $0,0027 за 1 Гбайт в час. В целом, на сегодняшний день более 110 сервисов OCI работают на оборудовании с процессорами Ampere.

Постоянный URL: http://servernews.ru/1133966
11.12.2025 [01:30], Владимир Мироненко

Qualcomm купила разработчика серверных RISC-V процессоров Ventana Micro Systems

Qualcomm объявила о приобретении стартапа Ventana Micro Systems, специализирующегося на разработке серверных процессоров на основе архитектуры RISC-V. Как пояснила компания, это свидетельствует о её приверженности развитию RISC-V, открытой альтернативы Arm и x86. По словам Qualcomm, сделка расширит её возможности в разработке чипов на базе RISC-V и кастомных процессоров Oryon за счёт интеграции имеющегося у Ventana опыта в этом направлении. Qualcomm делает ставку на Oryon в деле завоевания новых рынков, в том числе серверного, в рамках продолжающейся диверсификации бизнеса.

Компания получила ядра Oryon, совместимые с Arm, вместе с приобретением стартапа Nuvia за $1,4 млрд в 2021 году. Oryon уже прописались в процессорах Snapdragon X Series. Теперь же Qualcomm намерена предпринять ещё одну попытку разработки серверных процессоров. Прошлая попытка с процессорами Centriq 2400 завершилась неудачей. В этом году эти усилия были подкреплены наймом бывшего главного архитектора Intel Xeon и сделкой по приобретению Alphawave Semi за 2,4 млрд, пишет CRN.

Qualcomm, которая уже использует архитектуру RISC-V в некоторых продуктах за пределами рынков ПК и серверов, заявила, что вклад Ventana укрепит ее «технологическое лидерство в эпоху ИИ во всех сферах бизнеса», указывая на большие надежды, возлагаемые на это приобретение: «Мы считаем, что ISA RISC-V имеет потенциал для продвижения технологий процессоров, обеспечивая инновации во всех продуктах. Приобретение Ventana Micro Systems знаменует собой важный шаг на нашем пути к предоставлению передовых в отрасли технологий процессоров на базе RISC-V для всех продуктов».

 Источник изображения: Ventana Micro Systems

Источник изображения: Ventana Micro Systems

Ventana Micro Systems, базирующаяся в Купертино (Cupertino), была основана в 2018 году. Как сообщается на сайте компании, разработанная ею технология изготовления процессоров на базе RISC-V, обеспечивает «производительность, сопоставимую с новейшими процессорами на Arm и x86 для ЦОД». Эта технология доступна в виде многоядерных UCIe-чиплетов, а также может быть интегрирована другими компаниями в собственные SoC. И первое, и второе поколение процессоров Ventana Veyron предлагало до 192 ядер RISC-V.

Свои разработки Ventana рассчитывает использовать в различных сферах, включая облачные вычисления, корпоративные ЦОД, системы гиперскейлеров, 5G, периферийные вычисления, ИИ и машинное обучение, а также автомобильную промышленность. По некоторым оценкам, годовая выручка Ventana составляет $37,4 млн. Так что ей в каком-то смысле повезло, поскольку даже достаточно заметные разработчики решений на базе RISC-V часто не могут конкурировать с крупными игроками и готовы или продаться кому-нибудь, или вынуждены сокращать штат, или закрываться целиком.

Сообщение о покупке Ventana последовало после того, как Qualcomm в сентябре заявила о «полной победе» в судебном споре с Arm, которая добивалась прекращения продаж и уничтожения всех чипов Qualcomm, содержащих ядра Oryon, из-за предполагаемых нарушений лицензий на архитектуру Arm со стороны Qualcomm и Nuvia. Любопытно, что в 2022 году Ventana объявила о стратегическом партнёрстве с Intel в рамках IFS. Последняя годом позже закрыла программу Pathfinder for RISC-V.

Постоянный URL: http://servernews.ru/1133726
09.12.2025 [22:48], Владимир Мироненко

AMD представила процессоры EPYC Embedded 2005: до 16 ядер Zen5 в BGA-формате

AMD представила серию процессоров AMD EPYC Embedded 2005 — следующее поколение встраиваемых процессоров, обеспечивающих высокую производительность, энергоэффективность, повышенную надёжность и безопасность в компактном корпусе BGA (FL1) для сетевых систем, СХД и индустриальных платформ, требующих круглосуточной работы. Новая серия дополняет существующую линейку встраиваемых процессоров AMD, включающую серию EPYC Embedded 9005.

AMD выпустит три чипа EPYC Embedded 2005, которые станут доступны в I квартале 2026 года: 2435, 2655 и 2875 с 8, 12 и 16 ядрами Zen 5 (все с SMT) и TDP в размере 45, 55 и 75 Вт соответственно. Модели EPYC Embedded 2875 и EPYC Embedded 2655 имеют кеш-память L3 объёмом 64 Мбайт, а EPYC Embedded 2435 — 32 Мбайт. Поддерживается точная настройка профилей тепловыделения и энергопотребления.

 Источник изображений: AMD/ServeTheHome

Источник изображений: AMD/ServeTheHome

Поскольку эти компоненты выпускаются под брендом EPYC, они обладают всеми необходимыми функциями процессоров текущего поколения, включая поддержку ECC и полный набор функций AMD RAS. Также примечательно то, что это первая за много лет платформа EPYC Embedded в форм-факторе BGA. В последний BGA-чипы на платформе Snowy Owl были представлены ещё в 2018 году и использовали ядра Zen 1.

По словам AMD, BGA-корпус (40 × 40 мм) примерно в 2,4 раза меньше по площади, чем аналогичные решения Intel Xeon 6500P‑B (Granite Rapids-D), Меньший размер корпуса обеспечивает более высокую плотность компонентов на платах с ограниченными возможностями и упрощает теплоотвод системы, приближая высокоскоростные интерфейсы к сетевым картам, ускорителям и другим периферийным устройствам, говорит AMD.

По оценкам компании, 12-ядерный EPYC Embedded 2655 обеспечивает на 28 % более высокую частоту в режиме Boost и на 35 % более высокую базовую частоту, чем Xeon 6503P‑B, с вдвое меньшим при этом показателем TDP, тактично умалчивая, что данный чип Intel, самый младший в своём семействе, имеет интегрированный 100GbE-контроллер, поддержку QAT и четыре канала памяти DDR4-4800 (у более старших вплоть до DDR5-5600), тогда как все EPYC Embedded 2005 ограничены двумя каналами памяти — DDR5-3600 в случае 2DPC и DDR5-5600 в случае 1DPC.

Чипы EPYC Embedded 2005 предоставляет 28 линий PCIe 5.0 с 11 root-портами и возможностью формирования x16-подключений, а также четыре порта USB 3.1 и один порт USB 2.0. Процессоры включают функции обеспечения повышенной надёжности RAS (Reliability, Availability and Serviceability), расширенное обнаружение и исправление ошибок (EDAC), защиту памяти, горячее подключение PCIe, Multi-SPI ROM, а также функции защиты AMD Infinity Guard, включая Secure Processor3, Platform Secure Boot и Memory Guard.

Благодаря балансу вычислительной мощности и энергоэффективности процессоры AMD EPYC Embedded 2005 идеально подходят для сетевых, хранилищ и промышленных систем с ограниченными возможностями, где каждый ватт и миллиметр имеют значение, отметила компания. EPYC Embedded 2005 рассчитаны на круглосуточную работу и длительный срок эксплуатации. AMD гарантирует поддержку до 10 лет непрерывной работы, сочетая это с долгосрочной доступностью и поддержкой: до 10 лет заказа компонентов и технической поддержки, а также 15 лет сопровождения ПО. Заявлена поддержка Yocto и EDK II (Extended Development Kit).

Постоянный URL: http://servernews.ru/1133653
04.12.2025 [22:18], Владимир Мироненко

AWS анонсировала 192-ядерные серверные Arm-процессоры Graviton5

AWS анонсировала свой самый мощный на сегодняшний день серверный Arm-процессор — 3-нм 192-ядерный Graviton5. Новые инстансы M9g на базе Graviton5 отличаются более высокой производительностью благодаря впятеро большему общему L3-кешу и в 2,6 раза большему объёму кеша на ядро по сравнению с Graviton4, более высокой скорости памяти и повышенной пропускной способности сетевого подключения. Также компания снизила задержку передачи данных между ядрами на треть.

В Graviton5 появилась функция Nitro Isolation Engine с формальной верификацией изоляции исполняемых рабочих нагрузок друг от друга и от самой AWS. Процессоры предлагают полное шифрование памяти, расширенный предсказатель ветвлений, улучшенную подсистему предвыборки выделенные кеши для каждого vCPU и аутентификацию указателей (PAC). Кроме того, Graviton5 получили систему охлаждения на кристалле. Процессор содержит 172 млрд транзисторов.

 Источник изображений: AWS

Источник изображений: AWS

Процессор использует ядра Neoverse V3 (Poseidon) с ISA Armv9.2-A. Хотя сам чип монолитный, он разделён на два NUMA-домена для снижения задержек обращений к памяти. Каждому ядру полагается 2 Мбайт L2-кеша, а общий объём L3-кеша составляет 192 Мбайт — суммарно 576 Мбайт. Процессор имеет 12 каналов DDR5-8800, причём AWS работает с поставщиками памяти для валидации их DIMM. Также отмечено снижение задержки доступа до менее чем 100 нс. Для связи с внешним миром есть восемь контроллеров PCIe 6.0.

Как сообщается, клиенты AWS уже провели первые тесты Graviton5, показавшие прирост производительности от 25 до 60 % в зависимости от типа рабочей нагрузки. Помимо инстансов M9g в 2026 году также появятся инстансы C9g для ресурсоёмких вычислений и R9g с оптимизацией по памяти. Новые инстансы имеют в среднем на 15 % более высокую скорость сетевого подключения и на 30 % более высокую скорость доступа к EBS-томам (в том числе с шифрованием). Кроме того, они получили чипы Nitro 6, ответственные за виртуализацию, защиту и разгрузку сетевых функций и функция хранения.

Процессоры Graviton теперь обеспечивают более половины всех новых вычислительных мощностей, добавляемых в AWS третий год подряд, причем 98 % из 1000 ведущих клиентов EC2 уже используют эту архитектуру. Постепенно осваивают Arm и прямые конкуренты Amazon — Google активно портирует своё ПО на CPU Axion, у Microsoft недавно представила уже второе поколение процессоров Cobalt.

Постоянный URL: http://servernews.ru/1133293
19.11.2025 [15:39], Сергей Карасёв

132 «динамических» Arm-ядра и 12 каналов памяти: Microsoft представила процессоры Cobalt 200 для облака Azure

Корпорация Microsoft анонсировала процессоры Cobalt 200 на архитектуре Arm, спроектированные специально для облачных платформ. Изделия, в частности, будут применяться в составе инстансов Azure следующего поколения. Первые серверы на базе Cobalt 200 уже запущены в дата-центрах Microsoft, а более широкое внедрение намечено на 2026 год.

Оригинальные чипы Cobalt 100 дебютировали в ноябре 2023 года. Они объединяют 128 ядер Armv9 Neoverse N2 (Perseus). Они развёрнуты уже в 32 регионах Azure. И Microsoft, и её клиенты успешно переносят на новые чипы часть своих нагрузок. В частности, после миграции производительность Microsoft Teams выросла на 45 %, теперь сервису требуется на 35 % меньше вычислительных ядер при обработке видео- и аудиостриминга. Среди крупных пользователей Cobalt 100 компания также называет Databricks и Snowflake.

 Источник изображений: Microsoft

Источник изображений: Microsoft

При разработке Cobalt 200, как заявляет Microsoft, были оценены более 350 тыс. вариантов конфигурации. С помощью моделирования и ИИ были оценены различные комбинации компонентов — от ядер, кешей и памяти до питания, архитектуры отдельных узлов и целых стоек. Созданное в результате изделие по производительности более чем на 50 % превосходит решения первого поколения в реальных нагрузках Azure, данные о которых были собраны с помощью телеметрии, при сохранении энергоэффективности, говорит компания.

Cobalt 200 представляет собой SoC, состоящую из двух чиплетов. Каждый из них насчитывает 66 ядер с архитектурой Armv9.2 (Neoverse V3) и шесть каналов DDR. Таким образом, в общей сложности используются 132 ядра и 12 каналов памяти. Чипы получили 3 Мбайт L2-кеша в расчёте на ядро ​​и 192 Мбайт общего L3-кеша. Количество и тип линий PCIe/CXL не уточняется.

Одной из уникальных особенностей процессоров является индивидуальное динамическое регулирование напряжения и частоты (DVFS) для каждого ядра. Это означает, что каждое из 132 ядер может работать с разным уровнем производительности, обеспечивая оптимальное энергопотребление независимо от нагрузки. Изделия производятся по 3-нм техпроцессу TSMC.

При разработке Cobalt 200 особое внимание уделено безопасности. Применён специальный контроллер памяти с активированным по умолчанию шифрованием, которое практически не влияет на производительность. Кроме того, реализована архитектура Arm CCA (Confidential Compute Architecture) с поддержкой аппаратной изоляции памяти виртуальной машины от гипервизора и операционной системы хоста. Кроме того, компания внедрила в чипы блоки аппаратного ускорения компрессии и шифрования данных собственной разработки. Узлы с новыми чипами получили DPU Azure Boost и аппаратный HSM-модуль.

Постоянный URL: http://servernews.ru/1132618
16.11.2025 [23:30], Игорь Осколков

Intel отказалась от массовых Xeon Diamond Rapids с восемью каналами памяти — останутся только 16-канальные процессоры

Intel, по сообщению ServeTheHome, решила отказаться в следующем поколении серверных процессоров Xeon Diamond Rapids на платформе Oak Stream от чипов с поддержкой восьми каналов памяти, оставив только модели с 16 каналами DRAM и поддержкой MRDIMM. Иными словами, в новом поколении компания, по-видимому, будет ориентироваться на топовый сегмент, оставив недорогие массовые платформы за бортом.

Компания дала официальный комментарий ServeTheHome: «Мы исключили 8-канальные Diamond Rapids из наших планов. Мы упрощаем платформу Diamond Rapids, уделяя особое внимание 16-канальным процессорам и расширяя её преимущества для всех остальных, чтобы удовлетворить потребности различных клиентов». Грядущие AMD EPYC Venice также получат 16-канальный контроллер памяти.

 Источник изображения: Intel

Источник изображения: Intel

Пока что и у AMD, и у Intel максимальное количество поддерживаемых каналов памяти составляет 12. Однако в случае Intel реально доступными являются только Xeon Granite Rapids-AP (6900P), тогда как Sierra Forest-AP (6900E) так и остались нишевым продуктом. Грядущие Xeon 6+ Clearwater Forest также останутся при 12 каналах. При этом у EPYC поколения Turin (9005) во всех вариантах доступны 12 каналов.

Наиболее массовые Granite Rapids-SP (6500P/6700P) и Sierra Forest-SP (6700E) на платформе Birch Stream ограничены восемью каналами памяти, но… это может быть не так уж и плохо. Платформы для них дешевле, чем для AP-версий, а относительно небольшое количество каналов памяти даёт определённую гибкость в выборе компонентов. Речь в том числе про физические характеристики серверных платформ — платы с 32 или 48 слотами DIMM вынужденно переходят к «двухярусной» компоновке, когда один процессор сдвинут вглубь шасси из-за невозможности комфортно разместить все слоты и оба сокета в один ряд в рамках стандартного 19” корпуса.

 В многоузловых системах компоновка ещё более экзотическая

В многоузловых системах компоновка ещё более экзотическая

При этом типовые восьмиканальные решения позволяют легко набрать нужный объём RAM в 2DPC-режиме более дешёвыми модулями памяти (пусть и с потерей производительности), чем в случае 12-канальных платформ с 1DPC. Поэтому 2S-системы с восьмиканальными CPU всё ещё остаются крайне популярными. Однако Intel в Diamond Rapids решила отказаться от массовых платформ.

Постоянный URL: http://servernews.ru/1132475