Материалы по тегу: arm

03.05.2021 [21:57], Андрей Галадей

Microsoft готовит Linux для работы в качестве гостевой системы Hyper-V на 64-бит ARM-платформах

Ресур Phoronix обратил внимание на любопытный патч от Microsoft для готовящегося ядра Linux 5.13. Он добавляет возможность запуска Linux в качестве гостевой системы Hyper-V на ARM64-платформе. Важно отметить, что внесённые изменения не касаются кода, непосредственно зависящего от архитектуры процессора, однако сам факт таких работ интересен.

Это косвенно может указывать на будущую поддержку ARM64-хостов Hyper-V и Azure. На данный момент система виртуализации Hyper-V от Microsoft работает только на архитектуре x86-64, как и облако Azure, построенное на этом гипервизоре. Ранее компания также представила ещё один важный патч, позволяющий использовать ядро в качестве корневого раздела Hyper-V.

Ранее Microsoft неоднократно проводила различные эксперименты с серверными ARM-платформами, в том числе для нужд облака Azure, где уже давно доминирует Linux. Несколько лет назад компания рассказала о ARM-форке Windows Server для серверов на базе почившего Qualcomm Centriq. Затем компания переключилась на ThunderX 2 и даже взялась за оптимизацию Linux для этих чипов, всего за несколько месяц до отказа Marvell от развития этой серии CPU.

Теперь же, по слухам, компания взялась за проектирование собственных ARM-чипов для серверов и мобильных устройств. В этом свете нельзя не отметить, что у AWS уже давно есть процессоры Graviton. Что интересно, по словам компании, уже 14% всех EC2-инстансов в облаке Amazon базируются именно на этих чипах, а в 2020 году почти половина новых инстансов тоже использовала ARM. При этом VMware тоже смотрит в сторону ARM.

Постоянный URL: http://servernews.ru/1038725
27.04.2021 [22:45], Владимир Фетисов

Arm раскрыла больше деталей о серверных платформах Neoverse V1 и Neoverse N2

Компания Arm опубликовала больше информации касательно производительности своих новых серверных решений семейства Neoverse, анонс которых состоялся осенью прошлого года. Согласно опубликованным данным, чипы Neoverse V1 и Neoverse N2 обеспечивают на 40-50 % более высокую производительность по сравнению с решениями предыдущего поколения.

Требования к рабочим нагрузкам центров обработки данных и потребляемому интернет-трафику растут в геометрической прогрессии, поэтому необходимы новые аппаратные решения, способные удовлетворить растущие потребности при одновременном снижении уровня энергопотребления. По мнению Arm, её новые серверные платформы отвечают современным требованиям в плане производительности и энергопотребления.

Neoverse V1 представляет собой серверную платформу, которая подходит для использования в крупных центрах обработки данных. Решение поддерживает векторные инструкции Scalable Vector Extension (SVE) и обеспечивает до 50 % более высокую производительность по части машинного обучения, по сравнению с решениями предыдущего поколения. Помимо прочего, V1 поддерживает формат bfloat16, который является актуальным для нейронных сетей.

Платформа Neoverse N2 построена на базе архитектуры ARMv9, которая была анонсирована не так давно. Она способна обеспечить до 40 % более высокую производительность для разных типов рабочих нагрузок. «Я думаю, что N2 приятно удивит разработчиков тем, насколько производительными будут проекты с однопоточным дизайном. V1 выглядит хорошим стартом на нишевом рынке высокопроизводительных вычислений. В целом Arm усиливает свои позиции на рынке», — заявил Патрик Мурхед (Patrick Moorhead), аналитик компании Moor Insights & Strategy.

Постоянный URL: http://servernews.ru/1038317
16.04.2021 [17:43], Андрей Галадей

Сибирские учёные протестировали в научных задачах Arm-серверы Huawei Taishan 2280 v2

Специалисты Института вычислительной математики и математической геофизики Сибирского отделения РАН (ИВМиМГ) и Центра коллективного пользования «Сибирский суперкомпьютерный центр СО РАН» изучили возможности практического применения серверов Huawei Taishan 2280 v2 на базе процессоров HiSilicon Kunpeng 920 с архитектурой ARMv8.2-A. Институт в течение четырёх месяцев тестировал кластер из трёх 128-ядерных (2,6 ГГц) серверов 2280v2 суммарной производительностью почти 3 Тфлопс.

В качестве основной ОС использовался диструбутив OpenEuler. В рамках проекта сотрудники института портировали с архитектуры x86-64 на Arm и показали работоспособность ПО для научных расчётов PARMONC и ELSHOW. Как выяснилось в ходе тестирования, в ряде случаев ARM-серверы могут полноценно конкурировать с решения на основе архитектуры x86, причём даже без использования оптимизированных математических библиотек от Huawei.

«Мы рассчитываем на создание совместной лаборатории с компанией Huawei, с целью построения связующей цепочки между решениями компании и научными разработками институтов Новосибирского Академгородка», — заявил Михаил Марченко, директор ИВМиМГ. «Проект показал высокую эффективность работы учёных на оборудовании Huawei. Мы надеемся на дальнейшее расширение сотрудничества с научными организациями России», — отметил Лю Юй (на фото выше), директор департамента интеллектуальных вычислений Huawei в России.

Постоянный URL: http://servernews.ru/1037518
15.04.2021 [23:16], Владимир Мироненко

РосСХД разработает системы хранения данных на базе российских Arm-процессоров «Байкал»

В Консорциуме российских разработчиков систем хранения данных РосСХД появился новый участник — отечественный производитель высокоинтегрированных процессорных систем «Байкал Электроникс». В связи с этим участники РосСХД запланировали разработку новой серии систем хранения данных на базе процессоров «Байкал».

Как ожидается, объединение усилий российских разработчиков производителей программного и аппаратного обеспечения позволит создать продукт высокого уровня — как по производительности и функциональности, так и исходя из конкурентоспособности цены и гарантий.

Среди разработок «Байкал Электроникс» — отечественные системы на кристалле на базе как архитектуры MIPS (процессор BE-T1000), так и ARM v8 (модель BE-M1000). Её продукция используется в коммуникационной инфраструктуре, сетевых накопителях данных, системах безопасности и управления зданиями, а также на офисах. Во второй половине этого года на рынке появится 48-ядерный ARM-процессор серверного класса (модель BE-S1000), что станет следующим этапом эффективного импортозамещения вычислительной техники.

Использование архитектуры ARM позволило «Байкал Электроникс» создать обширную экосистему системного и прикладного программного обеспечения, что значительно облегчает задачу перехода на российские аппаратные платформы. По словам Виталия Богданова, директора по развитию бизнеса «Байкал Электроникс», РосСХД является действенным инструментом реализации импортозамещения в сегменте решений для хранения данных, поэтому совместными усилиями можно будет построить партнёрскую экосистему и максимально быстро представить решения для конечных клиентов.

Постоянный URL: http://servernews.ru/1037469
15.04.2021 [01:31], Владимир Мироненко

TSMC остановит выпуск Arm-процессоров Phytium — судьба китайского экзафлопсного суперкомпьютера Tianhe-3 под вопросом

Тайваньская компания Taiwan Semiconductor Manufacturing Company (TSMC) приостановила поставку чипов по новым заказам китайской компании Phytium, которая на прошлой неделе была добавлена властями США в «чёрный» список Министерства торговли. Внесение компаний в этот перечень означает запрет для американских компаний на работу с ними и предоставление продуктов или услуг без получения соответствующих лицензий.

Иностранные компании, такие как TSMC, теоретически могут продолжать работать с компаниями из «чёрного списка», но США могут оказывать на них давление через их американских поставщиков. Например, когда США занесли Huawei в «чёрный» список, TSMC была вынуждена отказаться от сотрудничества с ней, поскольку многие ключевые технологии, лежащие в основе её производственных процессов, были разработаны американскими фирмами.

REUTERS/Tyrone Siu

REUTERS/Tyrone Siu

Пока неясно, оказывалось ли сейчас подобное давление на TSMC, и были ли ею прекращены поставки остальным шести суперкомпьютерным китайским фирмам из «чёрного» списка. Как сообщает South China Morning Post, TSMC выполнит заказы, размещённые Phytium до внесения в «чёрный список», но больше поставлять ей чипы не будет.

Предполагается, что Phytium стоит за развёртыванием систем высокопроизводительных вычислений для китайского военно-промышленного комплекса, использующего её разработки при создании гиперзвуковых ракет. Компания сотрудничает с Оборонным научно-техническим университетом Народно-освободительной армии Китая (NUDT), который ранее создал суперкомпьютеры Tianhe-1 и Tianhe-2, в своё время занимавшие первые строчки рейтинга TOP500.

Прототип Tianhe-3. Фото: Xinhua

Прототип Tianhe-3. Фото: Xinhua

Tianhe-3, один из трёх проектов китайских суперкомпьютеров экзафлопсного класса, должен был быть закончен в прошлом году, однако осенью было объявлено, что из-за пандемии коронавируса сроки сдвигаются. Летом 2020 года в распоряжении исследователей уже был прототип новой машины, имевший теоретическую производительность 3,146 Пфлопс. Он включал 512 плат с тремя процессорами Phytium MT2000+ и 128 плат с четырьмя Phytium FT2000+.

Точные параметры этих 7-нм Arm-чипов не приводятся, но в одной из свежих научных публикаций упоминается, что на каждый 64-ядерный FT2000+ в прототипе Tianhe-3 приходилось 64 Гбайт RAM. А каждый MT2000+ можно поделить на четыре NUMA-узла с 32 ядрами и 16 Гбайт RAM, то есть, судя по описанию, это 128-ядерный чип, о котором ранее ничего не было известно. Теперь же судьба этих CPU и суперкомпьютера Tianhe-3 и вовсе под вопросом.

Постоянный URL: http://servernews.ru/1037383
12.04.2021 [19:34], Владимир Мироненко

NVIDIA развивает Arm-экосистему: GPU-инстансы с Graviton2, набор HPC-разработчика на базе Ampere Altra и новые партнёрства с Marvell, MediaTek и SiPearl

Собственный серверный Arm-процессор NVIDIA Grace ещё не вышел, но компания уже формирует экосистему вокруг Arm и собственных ускорителей. NVIDIA анонсировала серию совместных проектов с использованием своих GPU и программного обеспечения с процессорами на базе Arm для широкого круга рабочих нагрузок — от облака до периферии.

В частности, анонсированы инстансы Amazon EC2 на базе AWS Graviton2 с графическими процессорами NVIDIA, поддержка разработки научных приложений и ИИ-приложений с помощью нового набора разработчиков HPC, повышение уровня видеоаналитики и функций безопасности на границе сети, а также создание нового класса ПК на базе Arm с графическими процессорами NVIDIA RTX.

В частности, NVIDIA и AWS объявили о совместном проекте по развёртыванию Arm-экземпляров с графическими процессорами в облаке. Новые экземпляры Amazon EC2 позволят разработчикам запускать Android-игры в AWS, ускорять рендеринг и кодирование, а также транслировать игры на мобильные устройства.

Также NVIDIA представила набор NVIDIA Arm HPC Developer Kit, который включает сервер с 80-ядерным процессором Ampere Altra с тактовой частотой до 3,3 ГГц, два ускорителя NVIDIA A100, а также два DPU NVIDIA BlueField-2, которые ускоряют решение ключевых задач безопасности, передачи и хранения данных в ЦОД, включая изоляцию, , управление ключами, RDMA / RoCE, GPU Direct, хранение эластичных блоков, сжатие данных и многое другое.

Для этой платформы компания предлагает NVIDIA HPC SDK: набор компиляторов, библиотек и инструментов, которые позволяют создавать и переносить GPU-приложения HPC и ИИ в Arm-окружение. Среди первых ведущих вычислительных центров, развернувших новые платформы разработки, есть Ок-Риджская национальная лаборатория, Национальная лаборатория Лос-Аламоса и Университет Стоуни-Брук в США, а также Национальный центр высокопроизводительных вычислений на Тайване и Корейский институт науки и техники. NVIDIA Arm HPC Developer Kit будет доступен в 3 квартале 2021 года.

В области периферийных вычислений NVIDIA объявила о расширении сотрудничества с Marvell с целью объединения DPU OCTEON с графическими процессорами для ускорения облачных, корпоративных, операторских и пограничных приложений, и, в целом, повышения производительности систем и сокращения задержек от периферии до облака.

В категории ПК компания сотрудничает с MediaTek, одним из крупнейших мировых поставщиков SoC на базе Arm, чтобы создать эталонную платформу, поддерживающую Chromium, Linux и NVIDIA SDK. Сочетание графических процессоров NVIDIA RTX с высокопроизводительными, энергоэффективными процессорами Arm Cortex позволит использовать в ноутбуках графику с трассировкой лучей и искусственный интеллект.

Кроме того, NVIDIA сотрудничает и с другими партнёрами, включая Fujitsu и SiPearl. Первая, напомним, разработала самый мощный в мире суперкомпьютер Fugaku, который по совместительству является и самой производительной системой на базе Arm-процессоров, пусть и довольно специфичных. Вторая же пока всё ещё занимается разработкой Arm-процессоров SiPearl Rhea для будущих европейских суперкомпьютеров.

Постоянный URL: http://servernews.ru/1037079
12.04.2021 [19:26], Игорь Осколков

NVIDIA анонсировала серверные Arm-процессоры Grace и будущие суперкомпьютеры на их базе

В рамках GTC’21 NVIDIA анонсировала Arm-процессоры Grace серверного класса, которые станут компаньонами будущих ускорителей компании. Это не означает полный отказ от x86-64, но это позволит компании предложить клиентам более глубоко оптимизированные, а, значит, и более быстрые решения. NVIDIA говорит, что новый CPU позволит на порядок повысить производительность систем на его основе в ИИ и HPC-задачах в сравнении с современными решениями.

Процессор назван в честь Грейс Хоппер (Grace Hopper), одного из пионеров информатики и создательницы целого ряда основополагающих концепций и инструментов программирования. И это имя нам уже встречалось в контексте NVIDIA — в конце 2019 года компания зарегистрировала торговую марку Hopper для MCM-решений.

Компания не готова раскрыть полные технически характеристики новинки, которая станет доступна в начале 2023 года, но приводит некоторые интересные детали. В частности, процессор будет использовать Arm-ядра Neoverse следующего поколения (надо полагать, уже на базе ARMv9),  которые позволят получить в SPECrate2017_int_base результат выше 300. Для сравнения — система с парой современных AMD EPYC 7763 в том же бенчмарке показывает результат на уровне 800.

Вторая особенность Grace — использование памяти LPDRR5X (с ECC, естественно). В сравнении с DDR4 она будет иметь вдвое большую пропускную способность (ПСП) и в 10 раз меньшее энергопотребление. Число и скорость каналов памяти не уточняются, но говорится о суммарной ПСП в более чем 500 Гбайт/с на процессор. А у того же EPYC 7763 теоретический пик ПСП чуть больше 200 Гбайт/с. Очевидно, что другие процессоры к моменту выхода NVIDIA Grace тоже увеличат и производительность, и пропускную способность памяти. Гораздо более интересный вопрос, сколько линий PCIe 5.0 они смогут предложить. Если допустить, что у них будет 128 линий, то общая скорость для них составит чуть больше 500 Гбайт/с.

И NVIDIA этого мало — процессоры Grace получат прямое, кеш-когерентное подключение к GPU по NVLInk 4.0 (14x) с суммарной пропускной способностью боле 900 Гбайт/с. GPU тоже, как и прежде, будут общаться напрямую друг с другом по NVLink. Скорость связи между двумя CPU превысит 600 Гбайт/с, а в сборке из четырёх модулей CPU+GPU суммарная скорость обмена данными между системной памятью процессоров и GPU в такой mesh-сети составит 2 Тбайт/с. Но самое интересное тут то, что у памяти CPU (LPDDR5X) и GPU (HBM2e) в такой системе будет единое адресное пространство. Собственно говоря, таким образом компания решает давно назревшую проблему дисбаланса между скоростью обмена данными и доступным объёмом памяти в различных частях вычислительного комплекса.

Для сравнения можно посмотреть на архитектуру нынешних DGX A100 или HGX. У каждого ускорителя A100 есть 40 или 80 Гбайт набортной памяти HBM2e (1555 или 2039 Гбайт/с соответственно) и NVLInk-подключение на 600 Гбайт/c, которое идёт к коммутатору NVSwitch, имеющего суммарную пропускную способность 1,8 Тбайт/с. Всего таких коммутаторов шесть, а объединяют они восемь ускорителей. Внутри этой NVLInk-фабрики сохраняется достаточно высокая скорость обмена данными, но как только мы выходим за её пределы, ситуация меняется.

Схема NVIDIA DGX A100. Источник: Microway

Схема NVIDIA DGX A100. Источник: Microway

Каждый ускоритель A100 имеет второй интерфейс — PCIe 4.0 x16 (64 Гбайт/с), который уходит к PCIe-коммутатору, каковых в DGX A100 имеется четыре. Коммутаторы, в свою очередь, объединяют между собой сетевые 200GbE-адаптеры (суммарно в дуплексе до 1,6 Тбайт/с для связи с другими DGX A100), NVMe-накопители и CPU. У каждого CPU может быть довольно много памяти (от 512 Гбайт), но её скорость ограничена упомянутыми выше 200 Гбайт/c.

Узким местом во всей этой схеме является как раз PCIe, поэтому переход исключительно на NVLInk позволит NVIDIA получить большой объём памяти при сохранении приемлемой ПСП, не тратясь лишний раз на дорогую локальную HBM2e у каждого GPU. Впрочем, если компания не переведёт на NVLink и собственные будущие DPU Bluefield-3 (400GbE), которые будут скармливать связке CPU+GPU по, например, GPUDirect Storage данные из внешних NVMe-oF хранилищ и объединять узлы DGX POD, то PCIe 5.0 в составе Grace стоит ждать. Это опять-таки упростит и повысит эффективность масштабирования.

В целом, всё это необходимо из-за быстрого роста объёма ИИ-моделей — в GPT-3 уже 175 млрд параметров, а в течение пары лет можно ожидать модели уже с 0,5-1 трлн параметров. Им потребуются не только новые решения для обучения, но и для инференса. То же касается и физических расчётов — модели становятся всё больше и требовательнее + ИИ здесь тоже активно внедряется. Параллельно с разработкой Grace NVIDIA развивает программную экосистему вокруг Arm и своих решений, готовя почву для будущих систем на их основе.

Одной из такой систем станет суперкомпьютер Alps в Швейцарском национальном компьютерном центре (Swiss National Computing Centre, CSCS), который придёт на смену Piz Daint (12 место в нынешнем рейтинге TOP500). Этот суперкомпьютер серии HPE Cray EX, в частности, сможет в семь раз быстрее обучить модель GPT-3, чем машина NVIDIA Selene (5 место в TOP500). Впрочем, на нём будут выполняться и классические HPC-задачи в области метеорологии, физики, химии, биологии, экономики и так далее. Ввод в эксплуатацию намечен на 2023 год. Тогда же в США появится аналогичная машина от HPE в Лос-Аламосской национальной лаборатории (LANL). Она дополнит систему Crossroads, использующую исключительно процессоры Intel Xeon Sapphire Rapids.

Постоянный URL: http://servernews.ru/1037136
06.04.2021 [15:14], Владимир Мироненко

Серверные решения на базе Arm наращивают присутствие на рынке периферийных вычислений

Согласно недавнему отчёту Digitimes Research, Arm-архитектура расширяет своё присутствие на рынке серверов для периферийных вычислений, поскольку решения на этой платформе отличаются низким энергопотреблением и более доступной стоимостью.

Операторы облачных вычислений первого уровня и крупные вендоры, такие как Amazon, Huawei и Hewlett-Packard Enterprise (HPE), инвестировали в разработку чипов и систем на базе Arm, а сама Arm также начала продвигать проект Project Cassini, стремясь укрепить экосистему своей серверной платформы и расширить совместимость с периферийными решениями.

Supermicro SYS E403 9D 16C IPD2 — периферийный сервер для радиомачт

Supermicro SYS E403 9D 16C IPD2 — периферийный сервер для радиомачт

Как ожидается, Amazon станет основным клиентом решений для облачных вычислений на базе Arm. В дополнение к своим сервисам AWS Elastic Compute Cloud (EC2) на базе Arm, компания также планирует запустить к концу 2021 года гибридные облачные сервисы Outposts на базе Arm, которые будут ориентированы на бизнес периферийных вычислений на предприятиях.

Аналитики отметили, что в настоящее время решения на базе Arm занимают лишь ограниченную долю на рынке серверов и по-прежнему имеют проблемы, связанные с совместимостью с аппаратным и программным обеспечением серверов на базе x86. Поэтому экосистему Arm пока нельзя назвать всеобъемлющей.

Но, как прогнозирует Digitimes Research, Arm-решения будут постепенно проникать на рынок пограничных серверов, где в настоящее время доминирует архитектура x86, с большим количеством брендов серверов и операторов облачных вычислений, которые будут разрабатывать продукты на основе Arm.

Постоянный URL: http://servernews.ru/1036660
05.04.2021 [23:46], Владимир Мироненко

Новая версия VMware ESXi для Arm поддерживает Ampere Altra

В прошлом году VMware выпустила первую экспериментальную версию ESXi для Arm-процессоров. Следует отметить, что перенос ESXi на Arm является огромной технической задачей не только потому, что ESXi — большая кодовая база со множеством технических тонкостей, но и потому что семантика, лежащая в основе процессоров Arm, сильно отличается от архитектуры x86.

Как сообщили в VMware, это потребовало тщательного тестирования и доработки, чтобы гарантировать, что ESXi работает как на Arm, так и на x86-платформах, сохраняя при этом высокие стандарты ESXi. Тем не менее, работа на Arm-версией продолжается, и на днях компания представила очередной минорный релиз ESXi Arm Edition 1.3.

Обновление включает в себя несколько новых функций и компонентов, и требует новой установки. Как сообщила компания, обновление представляет собой оценочную программу, предназначенную для корпоративных архитекторов, которые рассматривают возможность виртуализации рабочих нагрузок на Arm, а также для команд разработчиков и тестировщиков, ищущих способ развернуть свои рабочие среды на Arm, и для профессионалов, которые просто хотят изучить возможности ESXi-Arm.

Основные особенности ESXi Arm fling v1.3:

  • Улучшенная совместимость оборудования (различные исправления ошибок и улучшения);
  • Добавлена экспериментальная поддержка процессоров Ampere Altra (только для систем с одним сокетом);
  • Поддержка ACPI для виртуальных машин;
  • Поддержка NVMe и PVSCSI Boot в vEFI;
  • Возможность обходного решения для загрузки ISO на некоторых серверах Arm;
  • Устранение сбоя VMM для новых гостевых ОС и систем на базе Neoverse N1;
  • Улучшенная виртуализация гостевого контроллера прерываний;
  • Улучшенная виртуализация PMU;
  • Улучшенная поддержка ВМ, использующих прямой порядок байтов (big endian).
Постоянный URL: http://servernews.ru/1036594
19.03.2021 [15:43], Сергей Карасёв

128-ядерные Arm-процессоры Ampere Altra Max будут в полтора раза быстрее предшественников

Ampere в текущем году собирается выпустить новые процессоры с архитектурой ARM, предназначенные для использования в серверах: изделия, получившие название Altra Max, обеспечат высокую производительность при относительно небольшом потреблении энергии.

Около года назад мы подробно рассказывали о первых чипах Ampere Altra. Напомним, что эти 7-нм изделия содержат 80 вычислительных ядер без поддержки многопоточности. При этом показатель TDP составляет 250 Вт при частоте 3,3 ГГц. Первые тесты показали, что в ряде задач Altra не хуже x86-64.

Число ядер в процессорах Ampere Altra Max увеличится до 128, то есть возрастёт ровно на 60 % по сравнению с предшественниками. При этом чипы будут по-прежнему производиться по 7-нм технологии. Важно отметить, что Ampere Altra Max будут совместимы на уровне сокета с Altra. Они также получат 128 линий PCIe 4.0 и восемь каналов оперативной памяти DDR4-3200.

Судя по обнародованной разработчикам информации, быстродействие по сравнению с Ampere Altra в зависимости от типа выполняемых задач поднимется на 51–57 % (при одинаковых тактовых частотах). Естественно, стоит ожидать, что выбор бенчмарков не является случайным. С другой стороны, Altra на звание HPC-чипов и не претендуют.

В дальнейшем Ampere намерена представить 5-нм процессоры серии Siryn. Однако соревноваться ей фактически не с кем: Marvell отказалась от развития ThunderX, Huawei находится под санкциями, а Qualcomm, поглотившая Nuvia, не намерена развивать серверное направление. Решения же вроде AWS Graviton2 и подобных ему не предназначены для использования вне облаков.

Постоянный URL: http://servernews.ru/1035283
Система Orphus