Материалы по тегу: ampere

12.01.2021 [22:44], Алексей Степин

Битва за королевство ARM: Ampere Altra против AWS Graviton2

Вторжение архитектуры ARM в мир современных высокоплотных центров обработки и хранения данных оказалось успешным: в настоящее время AWS активно использует процессоры Graviton2, а Ampere начала поставки чипов Altra, показавших себя не хуже AMD EPYC второго поколения. Обе реализации серверных ARM-процессоров показывают в среднем лучшую в сравнении с x86-64 энергоэффективность, но как они проявят себя в прямом столкновении между собой?

Вкратце напомним: платформа Ampere Altra является открытой: процессоры имеют свой разъём LGA 4926, тогда как AWS Graviton2 хотя и базируются на той же архитектуре ARM Neoverse N1, но сторонним заказчикам не поставляются — воспользоваться можно лишь облачными инстансами, запускаемыми на системах с этими ЦП.

Ядер больше у Altra (80 против 64), но оба процессора не имеют поддержки SMT. В тактовых частотах преимущество также у Altra: 64-ядерный инстанс AWS m6g.metal имеет фиксированную частоту 2,5 ГГц, а у процессоров Altra Quicksilver Q80-33 она может достигать 3,3 ГГц. Кроме того, доступны конфигурации с двумя процессорными разъёмами, обеспечивающими суммарно 160 ядер. Тем не менее, результаты тестов представляют существенный интерес: столь серьёзные реализации архитектуры ARM столкнулись друг с другом впервые.

Полностью с обзором можно ознакомиться на сайте Phoronix, мы же рискнём выделить отдельные, на наш взгляд, наиболее интересные результаты. Так, в тесте HPCG победу одержала реализация Ampere, но при равном активном количестве ядер превосходство над Graviton2 составило лишь около 5%, и это с учётом возможности ядер Quicksilver разгоняться до 3,3 ГГц. Зато эта же возможность очень помогла процессорам Ampere одержать убедительную победу в тестах на сжатие данных.

Тест Stream показал чуть более высокий результат на платформе Graviton2, но разница столь незначительна, что её можно не принимать во внимание. А вот в Coremark 1.0, наборе тестов, созданном специально для оценки вычислительных способностей процессоров, Altra Quicksilver одерживает безоговорочную победу. Даже при равном с Graviton2 количестве активных ядер разница довольно серьёзна, а в 80-ядерном режиме Altra Q80-33 не оставляет процессору AWS ни шанса. И это же можно сказать про тесты с трассировкой лучей.

Ampere Altra Quicksilver: лучшая серверная платформа с архитектурой ARM

Ampere Altra Quicksilver: лучшая серверная платформа с архитектурой ARM

В остальных тестах картина схожая, либо не столь зависящая от количества активных ядер у Altra. Но Graviton2 не удалось выиграть нигде. Впрочем, это не значит, что решение AWS хуже: оба процессора базируются на дизайне ядер ARM Neoverse N1, но Graviton2 работает на существенно более низкой частоте и, по всей видимости, его проигрыш на 9/10 объясняется этой причиной. В целом же, ARM-платформа Ampere выглядит интереснее: она доступна и в виде классических серверов, а не только как облачная услуга, кроме того, в двухпроцессорной конфигурации со 160 ядрами платформа Mount Jade обеспечивает великолепную производительность.

Постоянный URL: http://servernews.ru/1029866
25.12.2020 [22:21], Алексей Степин

Первые тесты 80-ядерных Arm-процессоров Ampere Altra: не хуже x86-64

Процессоры Ampere Altra были анонсированы весной 2020 года. На OCP Virtual Summit 2020 GIGABYTE представила системную плату MP32-AR0 с разъёмом для процессоров Ampere, а осенью она опубликовала сведения о новой серии серверов R272-P30 (Mount Snow). Теперь же Ampere разослала зарубежным обозревателям двухсокетные платформы Mount Jade, и первые результаты тестирования новых CPU внушают оптимизм.

Чипы Ampere Altra имеют до 80 ядер с архитектурой ARM v8.2+ (с некоторыми улучшениями из наборов v8.3 и 8.4), связанных между собой mesh-шиной Arm CoreLink CMN-600. Поддерживает эти ядра развитая система кешей: 64+64 Кбайт L2, 1 Мбайт L2 и до 32 Мбайт общего L3. Подсистема памяти имеет 8 каналов DDR4-3200 (72-бит, 2DPC, до 4 Тбайт суммарно).

Для подключения периферии есть контроллер PCIe 4.0 на 128 линий, но в двухсокетном варианте по 32 линии с каждой стороны отводится на связь между CPU, что в сумме даёт 192 линии. Причём для связи применяется CCIX. Отдельно стоит отметить, что Ampere идёт по пути AMD — стоимость CPU зависит только от числа ядер и их частоты, а в остальном функциональность более дешёвых моделей не отличается от таковой в старших версиях CPU.

В отличие от традиционных Intel Xeon, AMD EPYC и уж тем более IBM POWER9/10, многопоточности в Altra нет. Однако разработчики называют это преимуществом: отказ от SMT позволил им снизить уровень энергопотребления — показатель, чрезвычайно важный для рынка высокоплотных серверных систем. Кроме того, одной из причин была названа повышенная безопасность.

Рекомендованные цены на процессоры Ampere Altra Quicksilver. Данные AnandTech

Рекомендованные цены на процессоры Ampere Altra Quicksilver. Данные AnandTech

Образцы Mount Jade, разосланные зарубежным обозревателям, получили по два топовых 80-ядерных процессора Altra Q80-33, работающих на частоте 3,3 ГГц и имеющих теплопакет 250 Ватт, а также 512 Гбайт DDR4-3200. В отличие от однопроцессорного варианта, двухпроцессорный был разработан в сотрудничестве с Wiwynn, известным разработчиком и поставщиком OCP-платформ.

Процессорный разъём Ampere своего имени пока не имеет; по аналогии с решениями Intel его можно назвать LGA 4926. Это больше, чем у Xeon Scalable второго поколения, и даже больше, чем у Cooper Lake с его 4189 контактами. Механизм установки радиаторов, однако, больше напоминает AMD SP3: имеется привычная откидная рамка, она фиксируется пятью винтами. Сам процессор имеет внушительные габариты: 77 × 66,8 мм.

Сравнительные габариты серверных процессоров: Altra крупнее всех. Фото ServeTheHome

Сравнительные габариты серверных процессоров. Фото ServeTheHome

Любопытно, что эталонный дизайн Mount Jade использует радиаторы с довольно маленькой площадью контакта, порядка ¼ от площади крышки теплораспределителя на самом процессоре. Это позволяет примерно судить о реальной площади кристалла Altra Quicksilver. Он, напомним, монолитный и производится с использованием 7-нм норм. Впрочем, радиаторы снабжены испарительной камерой, так что должны работать достаточно эффективно и справляться с TDP 250 Ватт.

Соперниками для Ampere Altra Q80-33 естественным образом выступают AMD EPYC 7742 (64 ядра, SMT2, 225 Ватт, $6950) и Intel Xeon Platinum 8280 (28 ядер, SMT2, 205 Ватт, $10009). Решение Ampere, однако, заметно дешевле — оно оценено в $4050. Естественно, для крупных заказчиков цены варьируются, но всё-таки предложение Ampere выглядит весьма привлекательно с учётом характеристик.

Турборежим в понимании Ampere (слева) и в мире x86

Турборежим в понимании Ampere (слева) и в мире x86

Помимо этого, Ampere исповедует иной подход к «турборежиму»: если в мире x86 принята некая «минимальная базовая частота», которую процессор может превышать, то Altra Qicksilver практически всегда работает на максимальной заявленной для модели частоте, лишь изредка снижая её. А вот теплопакет новые процессоры пытаются поддерживать на как можно более низком уровне.

Нельзя сказать, что новые процессоры во всём выступили лидерами: в частности, AnandTech отметили довольно высокие задержки, как в пределах одного разъёма, так и межпроцессорные. Возможно, последнее вызвано необходимостью двойного преобразования между протоколами AMBA CHI и CCIX. Вообще межпроцессорная связь выглядит довольно слабым звеном Altra: у AMD ширина Infinity Fabric вдвое шире (64 линии PCIe 4.0 против 32), у Intel три интерфейса UPI хотя и обеспечивают меньшую пропускную способность, но не имеют «наценки» к латентности.

NAMD пока не имеет поддержки компиляторов, но даже так Ampere Altra проявляют себя неплохо

Популярный HPC-тест NAMD пока не имеет поддержки компиляторов, но даже так Ampere Altra проявляют себя неплохо

А вот в тестах на пропускную способность памяти Altra Q80-33 выступил явным лидером и явно показал преимущества своей более гибкой модели использования ресурсов DRAM. Аутсайдером здесь оказался Xeon, имеющий лишь шесть каналов против восьми более высокочастотных у AMD и Ampere.

Уже в однопоточных тестах SPECint2017 и SPECfp2017 новинка показала себя, как минимум, не хуже Xeon Platinum 8280, а в ряде случаев опередила и AMD EPYC 7742. В отдельных тестах 80 ядер ARM показали себя хуже 28 ядер Intel, особенно заметно это отставание в тестах на вычисления с плавающей запятой.

Однопоточная производительность: лидер всё ещё Xeon Scalable

Однопоточная производительность: лидер всё ещё Xeon Scalable

Возможным виновником называют сравнительно слабую подсистему предвыборки (prefetch), тем более что в аналогичном тесте (507.cactuBSSN) другой процессор на базе ARM, AWS Graviton2, показал себя лучше. Кроме того, Xeon способен разгоняться до 4 ГГц при двух активных ядрах, что не могло не повлиять на результаты.

Многопоточная производительность в SPEC2017: первое место

Многопоточная производительность в SPEC2017: первое место

В многопоточных тестах Xeon по понятной причине выступил аутсайдером, а вот Altra Q80-33 вышел в лидеры практически во всех тестах, за исключением вышеупомянутого 507.cactuBSSN. Это великолепный результат, ведь соперник в лице AMD EPYC 7742 может выполнять 128 потоков. По сути, в SPECint мы имеем нового абсолютного лидера в классе двухпроцессорных систем, да и в SPECfp новинка практически не уступает «красному» сопернику. Также стоит отметить, что один Altra Q80-33 явно быстрее Graviton2 (64 ядра).

В тестах Java повторить триумф не удалось. Сказалась незрелость программного обеспечения, а также отсутствие SMT. Возможно также, что тестовые сценарии привели к насыщению межъядерной mesh-сети и подсистем памяти Altra, однако в критических сценариях всё же главным недостатком нового процессора стало отсутствие мультитрединга.

JVM: ARM пока не лучший выбор

JVM: ARM пока не лучший выбор

Недаром IBM, остающаяся одним из главных поставщиков java-решений, активно использует SMT4 и даже SMT8: в таких условиях ПО на базе JVM чувствует себя великолепно. В эту же сферу, вероятно, метила и Marvell со своими ThunderX3, судьба которых так и не определена. В целом, однако, платформа Altra всё же смогла занять промежуточное положение между «красными» и «синими».

Компиляция LLVM: версия Phoronix

Компиляция LLVM: версия Phoronix

В тестах на компиляцию новинка показала себя хорошо: у ряда обозревателей компиляция LLVM Suite оказалась примерно столь же быстрой, как и на системе с двумя EPYC 7742; впрочем, у Phoronix отмечена аномалия — Altra уступила платформе Xeon. Но даже в этом случае платформа ARM продемонстрировала лучшую энергоэффективность. В тестах на сжатие, в основном, наблюдается паритет между Altra и AMD, в тестах MariaDB, nginx, а также файл-серверных сценариях картина аналогичная.

Но энергопотребление при компиляции у Ampere Altra всё равно самое низкое

Но энергопотребление при компиляции у Ampere Altra всё равно самое низкое

В целом, дебют платформы Ampere Altra можно считать многообещающим. Новые процессоры проявили себя великолепно: при более низком уровне энергопотребления они смогли продемонстрировать производительность примерно на уровне AMD EPYC 7742 или несколько ниже, и это в подавляющем большинстве тестов и при более низкой рекомендуемой цене. У новой платформы есть некоторые недостатки, в частности, не очень эффективная схема межпроцессорной связи и отсутствие поддержки SMT, но, к счастью, это не оказало фатального влияния на итоговую производительность.

Новые процессоры неплохо показывают себя в трассировке лучей

Новые процессоры неплохо показывают себя в трассировке лучей

Референсный вариант сервера Wiwynn Mount Jade выглядит очень привлекательно. Платформа проявила себя достаточно зрело: она обладает лучшим в своём классе уровнем энергопотребления и способна предоставить в распоряжение пользователей 160 эффективных процессорных ядер, а также пул оперативной памяти объёмом вплоть до 8 Тбайт. Основной проблемой пока, как и в случае нашего теста ARM-платформы TaiShan, отсутствие оптимизаций ПО и развитой экосистемы, но это лишь вопрос времени.

Полностью новые обзоры процессора Ampere Altra и платформы Mount Jade можно прочесть на AnandTech, ServeTheHome и Phoronix. Напоследок отметим, что NVIDIA, находящаяся в процессе поглощения Arm, только выиграет от подобных платформ и уже портирует своё ПО на Arm. В частности, та же Mount Jade в связке с NVIDIA T4 и DPU NVIDIA Mellanox BlueField-2 используется для облачного гейминга. Кроме того, заявлено о партнёрстве с GIGABYTE, Inspur и Wiwynn.

Постоянный URL: http://servernews.ru/1028799
18.11.2020 [16:02], Владимир Мироненко

NVIDIA отметила 26-кратный рост производительности HPC-платформ на базе Arm за полтора года

За последние 18 месяцев было отмечено значительное, 25,5-кратное повышение производительности платформ на базе Arm в высокопроизводительных вычислениях благодаря совместным усилиям экосистем Arm и NVIDIA, отметила компания NVIDIA.

По её оценкам, ядро Arm Neoverse N1 обеспечило системам на кристалле, таким как Altra от Ampere Computing, 2,3-кратное улучшение по сравнению с прошлогодними проектами. А графические процессоры NVIDIA A100 с тензорными ядрами продемонстрировали самый большой прирост производительности в истории за одно поколение.

Новейшие платформы перешли на большее количество более быстрых ядер, линий ввода/вывода и памяти. А разработчики приложений внесли в своё программное возможность множества новых оптимизаций. Как уже ранее сообщалось, NVIDIA в партнёрстве с Ampere Computing расширила свою серверную платформу Mt. Jade для облачных игр.

В результате референс-дизайн NVIDIA для высокопроизводительных вычислений на базе Arm с двумя SoC Ampere Altra и двумя графическими процессорами A100 показал в 25,5 раз большую производительность, чем серверы с двумя SoC, которые исследователи использовали в июне 2019 года. А её рефернс-платформа на базе архитектуры Arm и GPU-ускорителей в отдельности показала прирост производительности в 2,5 раза за 12 месяцев.

Результаты касаются приложений, в том числе GROMACS, LAMMPS, MILC, NAMD и Quantum Espresso, имеющих ключевое значение для таких видов деятельности, как разработки лекарств, что является главным приоритетом во время пандемии. Эти и многие другие приложения, адаптированные к запуску на Arm-системах, доступны в готовых к быстрому развёртыванию NGC-контейнерах NVIDIA. Компании и исследователи, работающие в таких областях, как молекулярная динамика и квантовая химия, могут использовать эти приложения не только в фундаментальной науке, но и в здравоохранении.

Еще одним признаком расширения экосистемы стало мероприятие недавно сформированного сообщества Arm HPC User Group (A-HUG), в котором приняли участие такие компании, как AWS, Hewlett Packard Enterprise, исследовательские институты Jülich Supercomputing Centre (JSC, Германия) и RIKEN (Япония), а также Ок-Риджская национальная лаборатория и Национальные лаборатории Сандия (США).

Постоянный URL: http://servernews.ru/1025690
04.08.2020 [12:54], Юрий Поздеев

GIGABYTE R272-P30: сервер на базе 80-ядерных ARM-процессоров Ampere Altra

Сегодня мощные процессоры Arm уже не являются экзотикой: Amazon выпустила инстансы на базе Graviton2, Apple собирается отказаться от Intel в своих новых моделях, Fujitsu выпускает суперкомпьютер Fugaku с собственными процессорами A64FX. Ну а  Ampere — одна из компаний, стремящихся внедрить Arm в облачные вычисления с новыми процессорами Altra и Altra Max.

Мы уже писали про процессоры Altra, которые могут предложить от 24 до 80 ядер, работающих на частотах до 3,3 Ггц. В скором времени появятся и 128-ядерные модели. Кроме большого количества ядер процессоры Altra могут похвастать 128 линиями PCIe 4.0, поддержкой CCIX и восьмиканальным контроллером памяти. Показатели выглядят весьма внушительно, однако выбор моделей серверов был невелик.

GIGABYTE является первой OEM-компанией, продемонстрировавшей свой дизайн с одним сокетом на выставке GIGABYTE Virtual Show 2020. Сервер R272-P30 представляет собой систему 2U с одним сокетом (на базе материнской платы MP32-AR0), с 16 слотами под оперативную память DDR4-3200.

Сразу бросается в глаза огромный сокет LGA4926, расположенный в центре материнской платы. Возле сокета смонтирована серверная 8-фазная система питания, которая рассчитана на потребление более 250 Вт. Дисковая подсистема позволяет установить до 24 накопителей NVMe в форм-факторе 2,5”. В итоге у GIGABYTE получилась достаточно производительная система, подходящая для создания гиперконвергентных систем или программно-определяемых СХД.

Ранее GIGABYTE анонсировала сервер на базе Marvel ThunderX3 с двумя сокетами, который позиционировался как решение для поставщиков облачных сервисов и высокопроизводительных вычислений (HPC). Как мы видим, Arm смело продвигается вперед, создавая реальную конкуренцию x86-процессорам. Будем ждать новых интересных моделей и массовых серверов на их базе.

Постоянный URL: http://servernews.ru/1017388
23.06.2020 [19:23], Алексей Степин

128 ядер ARM: Ampere Computing анонсировала процессоры Altra Max

На первый взгляд, позиции архитектуры x86 в мире высокопроизводительных вычислений выглядят незыблемыми: примерно 94% всех систем класса HPC используют в качестве основы процессоры Intel и ещё 2,2% занимает AMD. Однако запуск кластера Fugaku доказал, что ARM — соперник весьма и весьма опасный.

Система на базе процессоров Fujitsu A64FX использует именно архитектуру ARM. И наступление ARM продолжается и на других фронтах: к примеру, AWS предлагает инстансы на собственных ARM-процессорах Graviton2. Не дремлет Ampere Computing, анонсировавшая сегодня новые процессоры Altra и Altra Max.

Разработкой мощных многоядерных процессоров с архитектурой ARM компания занимается довольно давно: в конце прошлого года она уже рассказывала о втором поколении своих продуктов, чипах QuickSilver. В их основу лег дизайн ядра ARM Neoverse N1 (ARM v8.2+), количество самих ядер достигло 80, появилась поддержка интерфейса PCI Express 4.0, чего, например, до сих пор нет в процессорах Intel Xeon Scalable.

Серверные процессоры с архитектурой ARM доказали своё превосходство в энергоэффективности перед x86, что сделало их отличным выбором для облачных сервисов — в таких ЦОД плотность упаковки вычислительных мощностей максимальна и такие параметры, как удельная производительность, энергопотребление и тепловыделение играют крайне важную роль. Новые процессоры Ampere под кодовым именем Altra нацелены именно на этот сектор рынка.

В основе Altra также лежит ядро Neoverse N1 — оно же применено и в проекте Amazon Graviton2 — но Ampere Computing намеревается охватить с помощью Altra остальных крупных провайдеров облачных услуг, которые также заинтересованы в высокоплотных энергоэффективных ЦП. При этом утверждается, что Altra превосходит Graviton2; по крайней мере, на бумаге это выглядит убедительно.

Всего в серии Altra анонсировано 12 процессоров, с количеством ядер от 32 до 80, частотами от 1,7 до 3,3 ГГц и теплопакетами от 45 до 250 Ватт. Все они располагают восьмиканальным контроллером памяти DDR4-3200 (до 4 Тбайт на процессор) и предоставляют в распоряжение системы 128 линий PCI Express 4.0, чем пока могут похвастаться разве что AMD Rome. Применена очень простая система наименований: например, «Q72-30» означает, что перед нами 72 ядерный процессор поколения QuickSilver с частотой 3 ГГц.

Altra следует большинству современных тенденций в процессоростроении: процессоры располагают солидным массивом кешей (1 Мбайт на ядро, 32 Мбайт L3), ядра имеют два 128-битных блока инструкций SIMD, а также поддерживают популярные в задачах машинного интеллекта и инференс-комплексах форматы вычислений INT8 и FP16. Что касается удельной энергоэффективности, то ядро AMD Rome потребляет около 3 Ватт при полной нагрузке на частоте 3 ГГц, а для Altra Q80-30 этот показатель равен 2,6 Ватта; турборежима у Altra, впрочем, нет и максимальные частоты справедливы для всех ядер.

В настоящий момент компания поставляет образцы платформ Altra двух типов: однопроцессорную Mt. Snow и двухпроцессорную Mt. Jade. В число партнёров компании входят такие производители, как GIGABYTE и Wiwynn, заявлен также ряд контрактов с производителями более низких эшелонов. В основе Mt. Jade, вероятнее всего, лежит системная плата GIGABYTE MP32-AR0, о ней мы уже рассказывали нашим читателям.

Цены новых решений пока не разглашаются, однако, заинтересованные в процессорах Ampere провайдеры уже в течение двух месяцев тестируют новые платформы; в их число входят такие компании, как Packet и CloudFlare, причём Packet уже предоставляет своим клиентам «ранний доступ» к услугам, запускаемым на новых платформах Ampere. Более массовых поставок следует ожидать в августе и сентябре текущего года.

80 ядер — весьма солидное количество, даже в арсенале AMD таких процессоров ещё нет, семейство EPYC всё ещё ограничено 64 ядрами, но с SMT. Однако на достигнутом Ampere не останавливается и позднее в этом году планирует представить миру настоящего монстра — 128-ядерный процессор Altra Max, на базе всё той же архитектуры QuickSilver/Neoverse.

Этот чип имеет кодовое имя Mystique, он будет базироваться на новом дизайне кристалла, однако отличия здесь количественные, качественно это всё та же Altra, но с большим количеством ядер, оптимизированная с учётом возможностей сохранённой неизменной подсистемой памяти. Сохранится даже совместимость по процессорному разъёму. Образцы Altra Max если и существуют, то только в лаборатории Ampere Computing, а публичного появления сэмплов этих процессоров следует ожидать не ранее 4 квартала с началом производства в 2021 году.

Таким образом, можно утверждать, что технологическая ступень 7 нм компанией освоена. Она штурмует новую высоту — образцы процессоров Siryn, построенные с использованием 5-нм техпроцесса TSMC должны появиться ближе к концу следующего года. Некоторые блоки Siryn уже существуют в кремнии. Эти процессоры получат и новую платформу, а, возможно, и поддержку таких технологий, как PCI Express 5.0 и DDR5.

Постоянный URL: http://servernews.ru/1014076
13.05.2020 [23:28], Юрий Поздеев

Gigabyte представила плату MP32-AR0 для ARM-процессоров Ampere и NVMe-oF СХД S260

На мероприятии OCP Virtual Summit 2020 Gigabyte представила несколько новинок — дисковую полку с интерфейсом NVMe-over-fabric и материнскую плату для ARM-процессора Ampere. Но обо всем по порядку.

С точки зрения эффективности использования и энергопотребления стало ясно, что «дезагрегация» является в будущем хорошей альтернативой для центров обработки данных, где вычисления и хранение данных консолидированы в одном месте.

Новое решение Gigabyte использует карты расширения на базе контроллера Western Digital Onyx, который позволяет подключить полки с дисками к серверам через локальныую сеть, используя протокол NVMe-over-Fabric — это разработка стартапа Kazan Networks, который WD купила в прошлом году. 

На данный момент линейка дисковых полок представлена двумя моделями: S260-NF0 и S260-NF1. Обе модели имеют два дисковых контроллера, один порт 100 Гбит/с или два порта по 50 Гбит/с в каждом, 25 отсеков для 2,5 дюймовых SSD накопителей NVMe с возможностью «горячей замены» и двумя блоками питания по 800 Вт.

В дисковую полку можно дополнительно установить до трех карт расширения для дополнительного резервирования сетевых портов, либо расширения пропускной способности. Это решение является вехой в развитии программно-определяемых СХД, которые раньше были ограничены в быстродействии портами PCIe на материнской плате сервера и не могли поддерживать большое количество NVMe накопителей. Теперь это больше не является сдерживающим фактором и через несколько лет мы увидим уже множество решений, построенных на протоколе NMVe over Fabric.

Еще одной новинкой, представленной на виртуальной выставке, стала материнская плата EATX третьего поколения MP32-AR0 для процессоров ARM Ampere. Эти процессоры уже наделали много шуму в ИТ сфере, ранее мы писали про эту модель и ее перспективы, однако теперь это уже законченное готовое к производству решение, а не инженерные образцы и тестовые стенды. Новинка ориентирована на облака и периферийные вычисления.

Примечателен этот процессор тем, что он имеет 80 ядер, работающих на частотах до 3 ГГц. Материнская плата имеет один сокет для процессора и 16 слотов для оперативной памяти DDR4-3200 (8 каналов, 4 Тбайт). В односокетном варианте предоставляется 128 линий PCIe 4.0 и 192 — в двухсокетном. На данной плате есть два слота x16 и восемь слотов x8, коннектор U.2 и два слота M.2, а также посадочное место для адаптера OCP 2.0 (PCIe 3.0). Для BMC используется привычный AST2500. На плате есть два порта 1GbE (Intel i350)

Данное решение будет потреблять меньше энергии, чем аналогичные решения на Intel Xeon, но подойдет не для всех задач, т.к. ПО для ARM нужно либо писать с нуля, либо портировать с платформы x86, что потребует определенных затрат. Пока ARM платформы еще не так распространены и востребованы, чтобы разработчики бизнес приложений по умолчанию включали поддержку ARM в свои продукты.

Постоянный URL: http://servernews.ru/1010863
03.03.2020 [20:25], Андрей Созинов

Ampere Altra: серверные 80-ядерные процессоры, которые превосходят AMD EPYC Rome

Серверные процессоры с архитектурой ARM с самого своего появления обещали стать производительными и при этом энергоэффективными решениями. Правда, первая серьёзная попытка закончилась серьёзным же провалом. Но прогресс не стоял на месте, и компания Ampere сделала огромный шаг, представив серию процессоров Altra, среди которых будут модели, способные потягаться с флагманскими AMD EPYC Rome, да ещё и при меньшем энергопотреблении.

В семейство Altra войдут 7-нм процессоры, насчитывающие до 80 ядер и при этом обладающие уровнем TDP всего в 210 Вт. Ядра в рамках кристалла связаны между собой когерентной mesh-шиной. Построены новинки на архитектуре ARM v8.2+, в которую были добавлены некоторые улучшения от ARM v8.3 и v8.4. На каждое ядро приходится 64 Кбайт кеша инструкций и данных первого уровня и 1 Мбайт кеша второго уровня, а весь процессор имеет до 32 Мбайт общего кеша третьего уровня.

В отличие от х86-совместимых Intel Xeon и AMD EPYC, каждое ARM-ядро процессоров Altra работает лишь на один поток, а не на два. Производитель отмечает, что это позволяет обеспечить более низкое энергопотребление, а также более качественного обслуживания и повышения уровня безопасности за счёт отсутствия разделения ресурсов в случае виртуальных машин. К слову, тактовые частоты новых процессоров будут достигать 3,0 ГГц в режиме Turbo, а вот базовые частоты не уточняются.

Что касается внешних интерфейсов, то процессоры Altra предложат четыре, шесть или восемь каналов для подключения оперативной памяти DDR4-3200 общим объёмом до 4 Тбайт. Ещё новые чипы предложат до 128 линий PCIe 4.0 в однопроцессорной системе, а двухпроцессорная система сможет обеспечить до 192 линий (часть линий пойдёт на связь между CPU). И ещё заявлена поддержка интерфейса CCIX, а в будущем и CXL.

По словам Ampere, её процессоры Altra опережают по производительности флагманские решения от AMD и Intel в сфере облачных рабочих нагрузок. Причём если преимущество над AMD EPYC 7702 довольно небольшое, то флагманский Xeon Platinum 8280 новинка обходит более чем в два раза. И при этом процессоры Altra ещё и потребляют меньше энергии.

По словам самой Ampere, она лидирует в отрасли по показателю энергопотребления на одно ядро процессора, что и позволило ей нарастить число ядер до восьмидесяти. Это обеспечивает очень высокую плотность — более 3500 ядер на стойку высотой 42U. То есть на 38 % больше по сравнению с системами на AMD EPYC 7702 и на 173 % больше по сравнению с Intel Xeon Platinum 8276. Отмечается и высокая производительность по отношению к стоимости владения системами на Altra.

На данный момент Ampere располагает лишь образцами процессоров Altra. К сожалению, дата начала полномасштабных поставок пока что не уточняется. 

Постоянный URL: http://servernews.ru/1005095
25.12.2019 [17:47], Андрей Созинов

Ampere QuickSilver: 80-ядерные серверные ARM-процессоры на базе ARM Neoverse N1

Около месяца назад компания Ampere Computing поделилась планами касательно своих серверных ARM-процессоров следующего поколения. Теперь же были раскрыты новые подробности о технических характеристиках будущего флагманского чипа, который получил кодовое название QuickSilver (англ. — ртуть).

Как и сообщалось ранее, будущий процессор Ampere будет производиться по 7-нм техпроцессу на мощностях TSMC и предложит сразу 80 ядер с архитектурой ARM 8.2+. Причём с точки зрения архитектуры ядра будут довольно сильно отличаться от используемых в актуальных процессорах Ampere eMAG кастомных ядрах ARM 8.0.

Ampere QuickSilver создан на базе платформы ARM Neoverse N1, равно как и представленный недавно процессорAmazon Graviton2 , то есть использует ядра с той же архитектурой и явно станет его прямым конкурентом. Новинка в первую очередь предназначена для использования в системах облачных провайдеров.

Помимо большого числа ядер, чипы Ampere QuickSilver предложат более 128 линий PCI Express 4.0, но сколько именно, не уточняется. В любом случае, это больше чем способен предложить любой x86- или ARM-процессор на данный момент. Напомним, что больше всего, 128 линий PCI Express 4.0 на сокет-два, способны предложить разве что процессоры AMD EPYC Rome.

Контроллер памяти будущих процессоров Ampere будет поддерживать до восьми каналов и сможет работать с модулями DDR4 с частотой выше 2666 МГц. Также будет поддерживаться работа в двухпроцессорных конфигурациях с использованием CCIX поверх PCIe 4.0. Отмечается общее увеличение производительности (повышение IPC и частоты), улучшение эффективности и уменьшение энергопотребления.

Постоянный URL: http://servernews.ru/1000453
07.12.2019 [14:40], Геннадий Детинич

Первая и доступная: представлена рабочая станция на ARM-процессорах Ampere eMAG

Наши коллеги с сайта AnandTech подсказывают, что начались продажи первых и условно доступных по цене рабочих станций на ARM-процессорах eMAG компании Ampere (не путать с архитектурой NVIDIA Ampere).

О непростой судьбе этих процессоров обанкротившейся компании AppliedMicro можно прочесть в архиве наших новостей за 6 февраля 2018 года. Сейчас для нас главное, что процессоры eMAG первого поколения стали доступны для программистов на ARM не только в виде облачных инстансов или серверов, но также в виде настольных рабочих лошадок, на которых можно отточить мастерство.

Рабочие станции на 64-разрядных процессорах eMAG выпускает британская компания Avantek. Серверами на ARM-процессорах она занялась одной из первых ещё в 2013 году.

Опыта в этой сфере ей не занимать. Что касается рабочей станции на процессоре Ampere, то она выполнена в корпусе формата XL-ATX как однопроцессорное решение с объёмом бортовой памяти до 512 Гбайт DDR4-2666. В наличии порты SATA и поддержка NVMe SSD. Имеется слот расширения PCIe 3.0 x8 для установки дополнительных адаптеров.

Предложение Avantek ограничено одной единственной моделью процессора ― eMAG 8180 (к Intel 8180 это тоже не имеет отношения, разве что глава Ampere Рене Джеймс как бывший президент Intel решила подшутить над бывшим работодателем).

Модель eMAG 8180 несёт 32 ядра с тактовой частотой 2,8 ГГц и частотой в разгоне до 3 ГГц. Уровень TDP при этом не превышает 125 Вт. Добавим, в процессор встроен 8-канальный контроллер памяти, контроллер PCIe с 42 линиями и кеш L3 объёмом 32 Мбайт.

В составе рабочей станции производитель предлагает на выбор три ускорителя: AMD FirePro W2100, Radeon Pro WX 5100 или NVIDIA Quadro GV100. Поддерживаются операционные Linux-системы Ubuntu, CentOS, SUSE SLES и openSUSE.

Наконец, самое интересное ― цена. Выбор самой младшей конфигурации подразумевает один SSD на 240 Гбайт и одну 8-Гбайт планку памяти. В такой конфигурации рабочая станция стоит $2794,5. Кстати, любители иллюминации за корпус с окном и LED-подсветкой должны будут добавить ещё $108. Рабочая станция на ARM с подсветкой ― это ведь так необычно!

В конфигурации с видеокартой W2100, с 64 Гбайт памяти и с четырьмя SSD по 240 Гбайт цена вопроса поднимается до $4044,6. А на подходе второе поколение процессоров Ampere. Но это уже другая история.

Постоянный URL: http://servernews.ru/999252
24.11.2019 [22:22], Андрей Созинов

Ampere готовит 80-ядерные серверные ARM-процессоры второго поколения

Компания Ampere Computing, разработавшая серверный ARM-процессор для облачных центров обработки данных, готовит к выпуску второе поколение своих CPU. Об этом ресурсу DataCenter Knowledge в интервью рассказал Джефф Виттич (Jeff Wittich), старший вице-президент Ampere по продуктам.

Готовящийся флагманский 64-бит CPU Ampere будет производиться по 7-нм техпроцессу TSMC и получит 80 вычислительных ядер. Это больше чем у актуальных CPU Intel и AMD, а также большинства серверных ARM-процессоров.

Отмечается, что новинка Ampere сможет конкурировать по цене и производительности с любым нынешним серверным CPU, в том числе x86. Ранее им недоставало производительности, чтобы соответствовать потребностям поставщиков облачных услуг.

Теперь же за счёт архитектуры ARMv8, передовых техпроцессов и современных технологий, новинки в состоянии обеспечить нужный уровень производительности. Отмечается, что прежние серверные ARM-процессоры появились слишком рано, чтобы противостоять Intel и другим, но нынешние решения вполне способны составить конкуренцию традиционным чипам в ряде задач.

Актуальный 32-ядерный процессор Ampere eMAG

Актуальный 32-ядерный процессор Ampere eMAG

С одной стороны, облачные провайдеры сейчас нуждаются в том, чтобы на одну стойку приходилось как можно больше ядер, а с другой — система должна обладать максимальной энергоэффективностью. Оба этих качества как раз присущи решениям Ampere. Чипы второго поколения насчитывают до 80 ядер и смогут работать в конфигурациях с одним или двумя процессорами, а их энергопотребление будет варьироваться в пределах от 45 до 200 Вт.

Постоянный URL: http://servernews.ru/998355
Система Orphus