Материалы по тегу: cpu
01.08.2023 [10:02], Сергей Карасёв
Esperanto готовит универсальный чип ET-SoC-2 на базе RISC-V для задач НРС и ИИСтартап Esperanto Technologies, по сообщению ресурса HPC Wire, готовит новый чип с архитектурой RISC-V, ориентированный на системы высокопроизводительных вычислений (НРС) и задачи ИИ. Изделие получит обозначение ET-SoC-2. Нынешний чип ET-SoC-1 объединяет 1088 энергоэффективных ядер ET-Minion и четыре высокопроизводительных ядра ET-Maxion. Решение предназначено для инференса рекомендательных систем, в том числе на периферии. Чип ET-SoC-2 будет включать в себя новые высокопроизводительные ядра CPU на базе RISC-V с векторными расширениями. Точные данные о производительности не раскрываются, но говорится, что изделие обеспечит быстродействие с двойной точностью более 10 Тфлопс. Архитектура ET-SoC-2 предполагает совместную работу сотен и тысяч чипов для организации платформ НРС. При этом Esperanto делает упор на энергетической эффективности своих решений. По словам Дейва Дитцеля (Dave Ditzel), генерального директора Esperanto, чипы RISC-V смогут взять на себя функции и CPU, и GPU при обработке ресурсоёмких приложений, в частности, машинного обучения. Процессоры RISC-V отстают по производительности от чипов x86 и Arm, хотя разрыв постепенно сокращается. Дитцель сказал, что стойки с чипами ET-SoC-1 могут обеспечить производительность в петафлопсы. Однако проблема с внедрением RISC-V заключается в слабо развитой экосистеме ПО.
31.07.2023 [16:12], Алексей Степин
AVX-512 вдвое ускоряет AMD EPYC Bergamo, а Genoa-X выигрывают от большого кешаХотя реализация AVX-512 в процессорах AMD на базе микроархитектуры Zen 4 сомнительна — настоящих 512-битных регистров у этих процессоров нет и для этого в два этапа задействуются имеющиеся 256-битные, сама ситуация на рынке делает эти решения уникальными. Популярный ресурс Phoronix опубликовал новые тесты, в которых рассматривается выгода от включения поддержки AVX-512 в системах на базе AMD Bergamo. Также внимательно рассмотрен вопрос влияния на производительность большого кеша 3D V-Cache у новых EPYC Genoa-X. Несмотря на то, что AVX-512 является детищем Intel, ситуация складывается довольно абсурдная: текущая серия Sapphire Rapids сильно отстаёт по количеству ядер от AMD Bergamo, а многоядерные (до 144 ядер) Xeon серии Sierra Forest, скорее всего, поддержки AVX-512/AVX10 не получат. Таким образом, AMD Bergamo с ядрами Zen 4c являются единственными в мире 128-ядерными процессорами с поддержкой 512-битных расширений. На примере AMD EPYC 9754 видно, что несмотря на отсутствие полноценных регистров такой ширины, выгода от активации AVX-512 может быть весьма существенной, в некоторых случаях практически двукратной, а в TensorFlow — даже шести- или десятикратной. По сводному результату видно, что активация AVX-512 даёт Bergamo двукратный прирост производительности, хотя, разумеется, в конечном итоге всё зависит от конкретной нагрузки. Что интересно, задействование 512-битных расширений практически не влияет на частотные характеристики процессора — в среднем, этот показатель оставался равен все тем же 2,9 ГГц, что и без AVX-512. А вот энергопотребление и тепловыделение в таком режиме заметно возрастают, однако не настолько, чтобы вызвать какие-либо проблемы с перегревом или активацию режима троттлинга, как в некоторых ранних моделях Intel Xeon с поддержкой AVX-512. А теперь перейдём к EPYC 9684X (Genoa-X) — также достаточно уникальному процессору, сочетающему в себе 96 ядер, AVX-512 и 3D V-Cache, доводящий общий объём кеша L3 до гигантского значения 1,1 Гбайт. В данном случае разница также сильно варьируется в зависимости от характера нагрузки, но в некоторых случаях может быть и двукратной. В среднем эффект выражается в 12 % приросте производительности, что также весьма неплохо. На тактовую частоту и уровень энергопотребления отключение 3D V-Cache влияния не оказывает. Таким образом становится очевидно, что AMD EPYC 9684X — процессор специфический, уступающий по количеству ядер Bergamo и заточенный исключительно под нагрузки, могущие эффективно использовать огромный объём кеша, такие, как OpenFOAM или OpenVINO.
25.07.2023 [17:12], Руслан Авдеев
RISC-V International стандартизирует серверные чипы на архитектуре RISC-VRISC-V International, включающая более 1000 компаний из разных стран мира и ставшая ключевым игроком в сфере разработки чипов на архитектуре RISC-V, готовит новый проект. Как сообщает HPC Wire, организация готовится сформировать спецификации для серверных чипов и систем. В частности, речь идёт об утверждении стандартных аппаратных и программных интерфейсов. Ожидается, что появление таких стандартов позволит применять серверы с решениями на основе RISC-V в облачных средах, где ПО часто виртуализировано. Пока разработка спецификаций касается преимущественно дополнительных компонентов вроде системных контроллеров, уровней виртуализации, систем загрузки, безопасности и т.п. Также спецификация определяет набор возможностей, доступных системному ПО вроде операционных систем и гипервизоров. Кроме того, в новых спецификациях будет прописана поддержка серверными решениями на такой архитектуре технологий вроде CXL. Многие компании уже разрабатывают серверные RISC-V чипы, например, Ventana и Esperanto. Они создают собственные решения, дополняя базовую архитектуру, но они также выразили готовность следовать новым стандартам RISC-V International. Впрочем, пока RISC-V всё ещё не рассматривается как равноценная альтернатива давно применяемым в серверных решениях вариантам x86 или Arm. Ставку на её развитие делают многие компании, включая AMD, Apple, Intel, NVIDIA и Qualcomm, а также российские и китайские компании, страдающие от санкционного давления.
24.07.2023 [15:28], Сергей Карасёв
Лиза Су: доля AMD на рынке серверных процессоров превысила 25 %Генеральный директор AMD Лиза Су (Lisa Su) рассказала об успехах компании на рынке процессоров для серверов. По её словам, позиции AMD продолжают укрепляться, а доля превысила 25 % в общемировом объёме отгрузок серверных чипов, передаёт DigiTimes. Заявленные Результаты превзошли ожидания аналитиков DigiTimes Research, которые прогнозировали, что доля компании по итогам 2023 года превысит 20 %, а доля Arm-изделий в серверном сегменте окажется на уровне 8 %. По оценкам Mercury Research, рыночная доля AMD в сегменте процессоров для серверов выросла с 10,7 % в начале 2022-го до 17,6 % в конце прошлого года, тогда как доля Intel упала с 89,3 % до 82,4 %. Общая доля AMD на мировом CPU-рынке (за исключением изделий IoT и кастомизированных решений) поднялась с 23,3 % в 2021 году до 29,6 % в 2022-м, в то время как доля Intel сократилась с 76,7 % до 70,4 %. AMD готовится вывести на рынок гибридное решение Instinct MI300 — самый крупный и сложный чип компании. «MI300 — самый сложный продукт в мире, мы не смогли бы сделать его без партнёрства с TSMC», — отметила госпожа Су, тем самым опровергнув слухи о том, что AMD может перенести производство ИИ-чипов исключительно на мощности Samsung Electronics.
19.07.2023 [22:03], Илья Коваль
Ядер много не бывает: первые тесты AMD EPYC Genoa-X и Bergamo показали почти безоговорочную победу над Intel Xeon Sapphire Rapids и Xeon MaxВ Сети появились первые тесты процессоров AMD EPYC Genoa-X и Bergamo, которые были представлены в конце мая. Первый из них является вариантом Genoa с 3D V-Cache объёмом 768 Мбайт в максимальной конфигурации с 96 ядрами, что в сумме даёт 1152 Мбайт L3-кеша на процессор. Второй же предлагает до 128 ядер Zen4c с пониженной частотой и урезанным кешем и оптимизирован для нужд гиперскейлеров. Так, согласно тестам Phoronix, в HPC- и ИИ-бенчмарках, на которые Genoa-X и ориентирован, 9684X в стандартном режиме в среднем обгоняет и обычные Genoa 9654 с «открученными» лимитами (cTDP 400 Вт), и Milan-X (7773X), и Xeon Sapphire Rapids (8490H), и Xeon Max (9480). Отдельно отмечается прирост производительности в сравнении с Milan-X, при этом разница между чипами составляет менее двух лет. Что касается Intel Xeon Max, которые благодаря набортной памяти HBM2e объёмом 64 Гбайт как раз должны составлять конкуренцию Genoa-X в «тяжёлых» задачах, из-за значительного меньшего количества ядер тягаться с EPYC могут далеко не всегда и показывают хорошие результаты в режиме HBM-only (без системной DDR5). Но это касается только задач, которым хватает набортной памяти, и отдельных (пока редких) нагрузок, которые заранее оптимизированы для актуальной платформы Intel и, например, умеют задействовать инструкции AMX для ИИ-вычислений. В этих же тестах был ещё один участник — EPYC 9754 (Bergamo). В нетипичных для него нагрузках он всё равно показал достойный результат, всё же 128 ядер — это 128 ядер. В ещё одном тестировании Phoronix он обогнал всех прочих участников, показав прирост на уровне 20 % в сравнении со старшим Genoa(-X) в нагрузках, которые хорошо распараллеливаются. При этом он оказался энергоэффективнее и своих собратьев с ядрами Zen4, и Intel Xeon. Так что этот чип действительно будет интересен облачным провайдерам, но не только им. Это отлично решение для рендера и некоторых расчётных нагрузок. Intel сейчас не в состоянии противопоставить что-либо Bergamo, но гораздо интереснее увидеть сравнение новинок с AmpereOne. Пока что ServeTheHome отмечает значительное превосходство Bergamo над процессорами Ampere Altra Max, которые тоже имеют 128 ядер, но Arm и без SMT.
09.07.2023 [00:23], Сергей Карасёв
Intel выпустит чипы Xeon D на базе Granite Rapids в 2025 годуКорпорация Intel, по сообщению ресурса Computer Base, организует поставки процессоров Xeon Granite Rapids для серверов в конце 2024 года: речь идёт об изделиях Granite Rapids-AP и Granite Rapids-SP. А несколько позднее выйдут чипы Xeon Granite Rapids-D, предназначенные для применения в периферийном оборудовании, а также в СХД. Выход новинок на коммерческий рынок ожидается в 2025 году. Решения Xeon Granite Rapids-D в исполнении BGA4368 придут на смену Xeon D-1700 и D-2700 семейства Ice Lake-D, которые дебютировали в феврале 2022 года. Для чипов нового поколения предусмотрено использование техпроцесса Intel 3. Обнародованные сведения говорит о том, что готовящиеся процессоры предложат повышенную плотность компоновки, а также инновации в области I/O. В частности, ожидается не только поддержка PCIe 5.0, но и CXL 2.0. Согласно утечке, в этом поколении Xeon D снова будут два семейства процессоров: HCC и XCC. Отличаться они будут не только числом ядер, но и количеством I/O-блоков и каналов памяти: один или два блока и четыре или восемь каналов соответственно. Обязательный в обоих вариантах I/O-блок предложит HSIO, Ethernet и акселераторы (видимо, речь о QAT). Второй I/O-блок в XCC-семействе предлагает только Ethernet и те же акселераторы. Несколько необычно то, в этих чипах появится поддержка инструкций AMX-COMPLEX для работы с матрицами комплексных чисел половинной точности. Подчёркивается, что для других изделий семейства, таких как Granite Rapids-AP и Granite Rapids-SP, использование AMX-COMPLEX, по всей видимости, не предусмотрено.
08.07.2023 [23:57], Сергей Карасёв
Intel возобновила поставки процессоров Xeon Sapphire Rapids, устранив баг путём обновления прошивкиКомпания Intel, по сообщению ресурса Tom's Hardware, возобновила отгрузки процессоров Xeon Sapphire Rapids после устранения выявленной ошибки. Клиенты, которые ранее закупили проблемные чипы, могут получить обновление микрокода, в котором баг отсутствует. Об обнаруженной ошибке стало известно в конце июня нынешнего года. Говорилось, что баг может провоцировать внезапную остановку работы системы. На тот момент способов решения проблемы известно не было. Чипы Sapphire Rapids доступны в двух конструктивных вариантах: XCC и MCC. В первом случае применяется сборка из четырёх кристаллов: число вычислительных ядер варьируется от 36 до 60. Вторая модификация имеет монолитную конструкцию с числом ядер до 32. И именно в MCC-изделиях обнаружилась недоработка. Intel заявила о приостановке поставок этих процессоров из соображений предосторожности, но не назвала конкретную дату возобновления отгрузок. Проблему удалось решить путём выпуска новой версии прошивки, так что компании не пришлось инициировать дорогостоящую программу отзыва и замены чипов. «Недавно мы сообщили о проблеме с подмножеством процессоров Intel Xeon со средним числом ядер (SPR-MCC), которая может прерывать работу системы при определённых условиях. Из соображений предосторожности мы временно приостановили поставки этих изделий. Теперь мы уверены, что новая микропрограмма решает проблему. Мы возобновили поставки всех версий SPR-MCC и работаем с клиентами над внедрением исправленной прошивки», — сказали в Intel.
30.06.2023 [21:39], Владимир Мироненко
Глава Oracle считает, что архитектура Intel x86 теряет актуальность для серверовВ 2023 году Oracle планирует потратить значительные средства на приобретение чипов AMD и Ampere Computing для новой инфраструктуры, отметив, что «старая архитектура Intel x86 достигает своего предела». «В этом году Oracle купит GPU и CPU у трёх компаний, — сообщил на прошедшем в среду мероприятии глава Oracle Ларри Эллисон (Larry Ellison). — Мы будем покупать GPU у NVIDIA, мы покупаем у неё на миллиарды долларов США. И потратим в три раза больше на центральные процессоры от Ampere и AMD. Мы по-прежнему тратим больше денег на традиционные чипы». Oracle сообщила, что впервые за 14 лет существования специализированных ПАК Exadata для СУБД она полностью отказалась от процессоров Intel в пользу чипов AMD. В платформе 12-го поколения Exadata X10M в рамках двух предложений Oracle Exadata Machine и управляемого решения Oracle Exadata Cloud@Customer будут использоваться AMD EPYC Genoa. Одной из причин такого перехода, пусть и далеко не самой важной, считается отказ Intel от Optane. С момента запуска Exadata в 2008 году Oracle полагалась на процессоры Intel Xeon. Но ситуация начала меняться c выходом X9M в 2021 году. Для Oracle Exadata Machine и Oracle Exadata Cloud@Customer компания выбрала чипы Intel Xeon Ice Lake-SP, а в начале 2022 года для облачного решения Oracle Exadata Cloud Infrastructure решила использовать чипы AMD. При этом EPYC Milan использовались в серверах для обеспечения работы баз данных, а Ice Lake-SP — для СХД. Кроме того, на днях Oracle сделала важный шаг — перенесла свою флагманскую СУБД Oracle Database на архитектуру Arm, т.е. на процессоры компании Ampere Computing, в которую в своё время инвестировала. Эллисон отметил, что чипы Ampere Altra намного энергоэффективнее решений AMD и NVIDIA, что поможет ЦОД Oracle соответствовать будущим регуляциям. «Мы перешли на новую архитектуру и к новому поставщику, — сообщил Эллисон. — Мы думаем, что это будущее. Старая архитектура Intel x86 после многих десятилетий на рынке подошла к своему пределу». Тем не менее, эксперты полагают, что ставка Oracle на архитектуру Arm не помешает её отношениям с AMD в ближайшее время, тем более что Intel и AMD планируют бороться с Arm-процессорами с помощью оптимизированных для облачных платформ чипов с высокой плотностью ядер и улучшенной энергоэффективностью: EPYC Bergamo и Xeon Sierra Forest. Кроме того, разработка, перенос и рефакторинг ПО для Arm требует времени и средств. В свою очередь, представитель Intel сообщил ресурсу CRN в четверг, что компания поставляет Oracle процессоры Xeon Sapphire Rapids «в течение многих месяцев и планирует продолжать поставки Xeon текущего и следующего поколения в будущем». Компании связывают долгие годы совместной работы над аппаратными и программными решениями для клиентов, а сейчас Intel поставляет чипы для облачной инфраструктуры Oracle OCI.
30.06.2023 [10:22], Сергей Карасёв
Самый мощный процессор AMD EPYC Bergamo со 128 ядрами появился в продаже в ЕвропеЕвропейские ретейлеры, по сообщению ресурса TechRadar, начали приём заказов на самый мощный в мире процессор с архитектурой x86 — чип AMD EPYC 9754 поколения Bergamo, который был официально представлен только около двух недель назад. Изделие объединяет 128 вычислительных ядер с возможностью одновременной обработки 256 потоков инструкций. Базовая тактовая частота составляет 2,25 ГГц, максимальная частота в турбо-режиме — 3,1 ГГц. Возможно использование до 6 Тбайт оперативной памяти DDR5. Реализована поддержка PCIe 5.0. Показатель TDP равен 360 Вт. Сообщается, что заказы на процессор EPYC 9754 с кодовым обозначением 100-000001234 начали принимать ретейлеры в Нидерландах, Финляндии, Польше, Швеции, Дании, Бельгии и Франции. Речь идёт об OEM-варианте, рассчитанном на отгрузки в больших партиях. Цена варьируется от $9500 до $11 200 за штуку. Правда, у большинства онлайновых продавцов на момент написания заметки чип значился «отсутствующим на складе». В интернете также появились результаты тестов, подтверждающие высочайшую производительность EPYC 9754. Так, например, бенчмарк V-Ray 5 говорит о том, что один такой процессор по быстродействию превосходит связку из двух чипов Intel Xeon Platinum 8490H (Sapphire Rapids) с 60 ядрами. А в тесте SPEC CPU 2017 система с двумя процессорами EPYC 9754 опередила четырёхпроцессорный сервер с Xeon Platinum 8490H при меньшем энергопотреблении.
29.06.2023 [18:46], Алексей Степин
Опубликованы результаты тестов Intel Xeon Max: набортная HBM-память даёт заметное преимущество в ИИ- и HPC-нагрузкахПроцессоры Intel серии Xeon Max отличаются от своих обычных, «не максимальных» собратьев наличием интегрированной памяти HBM2e объёмом 64 Гбайт. Что же это даёт им на практике? Этот вопрос исследовал ресурс Phoronix — им в руки новейшие двухсокетные системы Supermicro Hyper SuperServer SYS-221H-TNR с чипами Xeon Max 9468 и 9480. Напомним, Intel Xeon Max отличается от своих обычных собратьев серии Sapphire Rapids наличием 64 Гбайт HBM2e на борту, причём объём одинаков для всех моделей, хотя количество ядер может варьироваться от 32 до 56. Процессоры Xeon Max были протестированы в трёх режимах: только с памятью HBM (без DDR5), с HBM в качестве кеша для 512 Гбайт DDR5, а также в «плоском» режиме, но без отдачи HBM какому-либо процессу, то есть фактически только с DDR5. Тесты показали, что два первых режима действительно могут обеспечить преимущество в некоторых сценариях нагрузки. Результаты получились вполне закономерными: там, где сравнительно небольшого объёма HBM2e достаточно, режим HBM Only оказывается самым быстрым из-за высокой пропускной способности и отсутствия необходимости как-то синхронизировать работу с DDR5. Однако режим кеширования тоже обеспечивает выигрыш, хотя в ряде нагрузок, таких как OpenFOAM, он не такой большой. В ИИ-сценариях, в частности, в тестах OpenVINO, разница меньше, а иногда отключение HBM2e и вовсе позволяет добиться чуть лучшей производительности, особенно на системе с Xeon Max 9480, где на каждое ядро приходится меньше памяти. Но в других тестах, таких как PETSc и Stress-NG, использование HBM2e может дать огромный прирост производительности, который глупо было бы игнорировать. В целом, можно уверенно заявлять, что в среднем, прирост производительности при HBM-кешировании составляет 10–11 %, а при отказе от DDR5 к этому значению можно добавить ещё около 8 %. Также очевидно, что потребление системы в таком режиме заметно ниже, поскольку не требуется питание для модулей DDR5. В целом можно говорить о 18–20 % превосходства на широком спектре нагрузок, сообщает Phoronix. |
|