Материалы по тегу: ocp

26.05.2020 [21:06], Алексей Степин

Facebook Yosemite и Delta Lake: OCP-платформы с Intel Xeon Cooper Lake

На прошлой неделе мы писали о решении ITRenew Sesame, которое позволит небольшим компаниями получить недорогое, но производительное б/у «железо» от Facebook и других гигантов. Особенность такого оборудования в том, что оно имеет OCP-исполнение.

И самый простой способ познакомиться с миром OCP — посмотреть на новые решения самой Facebook. Среди них есть одноюнитовое шасси Sonora Pass, но это не единственная новинка, использующая самые свежие CPU Intel Xeon Cooper Lake. Есть и специфичные для OCP платформы Yosemite v3 и Delta Lake.

Привычные нам стоечные форм-факторы серверов создавались в те времена, когда вопрос упаковки вычислительных мощностей не стоял столь остро, как сейчас. В лучшем случае, стандартный 19-дюймовый корпус может содержать системную плату с четырьмя процессорами, но чаще ограничен двухсокетными конфигурациями.

Facebook использует стандарт стоек Open Rack, главное в которых — возможность более плотного размещения серверов (21"), увеличение воздушного потока и единая шина питания (12 В DC). Yosemite v3 являет собой уже третье поколение серверных систем в этом стандарте.

В третьей версии 4 юнита вертикального пространства стойки вмещает в себя три модуля Yosemite v3. Каждый из этих модулей может включать в себя до четырёх сверхкомпактных серверов Delta Lake на базе новых процессоров Intel Cooper Lake-SP. Предусматриваются разные варианты модулей: классический «вычислительный» с четырьмя системными платами, вариант с собственным флеш-хранилищем, версия с акселераторами и модель с интегрированным сетевым коммутатором. В зависимости от решаемой задачи, стойка может включать различные сочетания Yosemite v3.

Два последних варианта предусматривают два процессорных гнезда вместо четырёх, но в них предусмотрено пространство для размещения ГП-ускорителей или собственной сетевой подсистемы, включающей в себя выделенные сетевые адаптеры и коммутатор. Все четыре варианта базируются на шасси высотой 4U и шириной в треть стойки, в верхней части которого размещается базовая плата с общим сетевым адаптером, а в задней — платы питания Medusa Board.

«Лезвия» с системными платами быстросъёмные. Основная модель «лезвия» носит название Delta Lake. Она представляет собой компактную системную плату с процессором Intel Xeon Scalable третьего поколения (Cooper Lake). Эти платы изначально создавались с прицелом на повышенный уровень производительности в системах машинного интеллекта и принятия решений.

За отвод тепла отвечает компактная, но мощная система охлаждения с четырьмя тепловыми трубками и дополнительными секциями радиаторов. Поддерживаются расширенные возможности удалённого управления и администрирования, имеется пара набортных разъёмов для накопителей типа M.2. Также платы Delta Lake поддерживают новый стандарт модулей Intel Optane DCPMM под кодовым названием Barlow Pass.

Помимо Yosemite v3, Facebook представила также новую платформу для запуска нейронных сетей (инеференс). Каждый модуль этой платформы состоит из системного модуля Yosemite v2.50 и модуля расширения Glacier Point v2, общающегося с ЦП посредством 16 линий PCI Express 3.0; особенный интерес представляет именно последний.

В этом модуле реализована возможность установки как стандартных одинарных модулей M.2 (теплопакет до 14 Ватт), так и двойных, с теплопакетом 25 Ватт. Всего модуль расширения может содержать до шести двойных или двенадцати одинарных плат с интерфейсом M.2. Два таких блока с модулями GPv2 устанавливаются в шасси Yosemite v2.50.

В сравнении с Yosemite v2 с 600 до 720 Ватт увеличена мощность подсистем питания, реализована поддержка 100GbE, сетевой контроллер подключён к процессору, а не к мосту PCH, как ранее.

Новая платформа для инференс-систем

Новая платформа для инференс-систем

В данном решении особый интерес вызывает поддержка M.2 двойной ширины. Сам по себе стандарт M.2 достаточно компактен, но ширина одинарной платы означает и ограничение по габаритам чипа ускорителя. Двойная ширина позволяет это ограничение преодолеть и оснащать ускорители более мощными и крупными ASIC, но не терять при этом электрической и механической совместимости.

Такой модульный дизайн обеспечивает сочетанию Yv2.50 и GPv2 непревзойдённую гибкость, ведь в единой системе могут уживаться различные ускорители на базе разных чипов. А благодаря единой системе BMC и поддержке стандартных протоколов SMBUS, UART, JTag и I2C, обеспечивается полный спектр средств удаленного управления и мониторинга. Ограничение по ширине интерфейса к основному ЦП нивелируется тем, что GPv2 имеет собственный коммутатор PCIe, так что ускорители, в нём установленные, могут общаться и в режиме «точка-точка».

Платформа Yv2.50 + GPv2 имеет свои недостатки, но компания-разработчик их осознаёт. В частности, в будущих версиях, возможно, каждый сервер будет иметь собственный контроллер BMC и сетевой процессор, а модуль расширения получит поддержку PCI Express 4.0, что снимет возможные проблемы с нехваткой пропускной способности.

При этом необходимо отметить, что Facebook является участником проекта OCP и платформа Yv2.50 + GPv2 имеет открытые спецификации. Подробнее о них можно узнать на wiki-странице проекта. Отдельно опубликованы спецификации на ускорительные модули M.2 обычной и двойной ширины.

Постоянный URL: http://servernews.ru/1011904
20.05.2020 [00:10], Юрий Поздеев

Б/У серверы Facebook и Microsoft обретут новый дом благодаря ITRenew Sesame

Гиганты Google, Facebook и Microsoft каждый год покупают огромное количество серверов, которые могут работать и до 10 лет. Однако через 2-3 года они заменяются на новые, более производительные модели, так как для гиперскейлеров это проще и быстрее, чем строить или расширять ЦОД. При объемах закупок от 100 тыс. серверов в год каждый квартал более 10 тыс. единиц оборудования выводится из эксплуатации. 

Утилизировать всю эту технику было бы слишком расточительно, ведь даже серверы возрастом 2-3 года из ЦОД гиперскейлеров мощнее многих серверов, которые используются на предприятиях сегодня. ITRenew предлагает разумный выход из ситуации.

Стойки ITRenew Sesame

ITRenew подписала с гиперскейлерами контракты на выкуп старого оборудования. Впрочем, «старое» — не совсем подходящее слово, так как оно отработало в среднем от 2 до 5 лет. Компания помогает значительно снизить издержки, дав, с одной стороны, возможность гипескейлерам вернуть часть вложенных средств, а с другой — снизить затраты на 40-50% для небольших предприятий, которые оснащают свои дата-центры. 

Для многих компаний это единственная возможность купить оборудование такого класса, так как ODM вроде Wiwynn, Inspur, Quanta продают его только гиперскейлерам 1-го уровня (Amazon, Facebook, Google) и не собираются менять свою модель продаж, поскольку у них нет проблем со сбытом своей продукции. 

Еще один важный момент, на который обращают большое внимание в Европе и США, связан с экологией. То, что техника продолжает использоваться, а не уничтожается, позволяет экономить ресурсы и не загрязнять окружающую среду. Это особенно важно в свете того, что Китай закрыл ввоз подобного оборудования для утилизации и сортировки. И пока тенденция агрессивного обновления крупнейших дата-центров сохраняется, объем выведенной из эксплуатации техники будет расти. 

Может сложиться впечатление, что покупка б/у оборудования — это удел отсталых и бедных компаний, которые не хотят вкладывать деньги в развитие IT. Однако это далеко не так! Оборудованием от ITRenew комплектуются целые дата-центры, например, шведский ЦОД Hydro66.

Все оборудование в ITRenew проходит обязательную процедуру обслуживания: компоненты с малым остаточным ресурсом заменяются новыми или снятыми с других единиц техники. Затем всё проверяется, настраивается и упаковывается для транспортировки новым владельцам.

Узлы ITRenew Sesame

Узлы ITRenew Sesame

Несмотря на то, что оборудование из дата-центров гиперскейлеров выпущено разными производителями (Wiwynn, Quanta и другими), оно проходит процедуру стандартизации и настройки, после чего управлять и поддерживать его гораздо проще, чем «зоопарком» обычного серверного оборудования разных брендов. Кроме того, многие компоненты таких систем открыты — они будут иметь полноценную поддержку долгие годы.

Одна из причин, почему продажа б/у-оборудования от гиперскейлеров до сих по не стала действительно массовым явления, в том, что оно имеет OCP-исполнение, отличное от принятых в корпоративном мире стандартов. Это касается и шасси, и прошивок, и ПО. Именно поэтому ITrenew создала серию платформ Sesame (Сезам), готовых принятть OCP-оборудование, со всем необходимым ПО для оркестрации Kubernetes. 

Sesame позволит объединить до 20 стоек (более 750 узлов) в один кластер с 25GbE-подключение. Слоган нового решения: «Сила гиперскейлеров для всех». Звучит довольно громко, однако так оно и есть. Теперь даже мелкие компании могут приобрести производительное оборудование, которое не стоит огромных денег.  А для «самых маленьких» компания предлагает Sesame Fast Start, мини-стойку на колёсиках со всем необходимым. Fast-Start помещается под столом — она рассчитана на 5 узлов суммарной мощностью до 1600 Вт и имеет 10GbE-коммутатор.

Постоянный URL: http://servernews.ru/1011303
15.05.2020 [15:07], Юрий Поздеев

Facebook представила серверы Sonora Pass с Intel Xeon Cooper Lake

На мероприятии OCP Virtual Summit 2020 Facebook поделилась некоторыми подробностями о своем новой платформе Sonora Pass. Информации по новому шасси не очень много — известно лишь то, что данная модель продолжает развивает концепцию серверов Facebook Tioga Pass, но делает больший акцент на безопасность и улучшение интеграции с текущей инфраструктурой. 

Основные конструктивные изменения в Sonora Pass направлены на еще большую модульность платформы. Новый сервер спроектирован таким образом, чтобы быть еще более удобным в обслуживании, что должно снизить стоимость владения инфраструктурой при массовом развертывании данной модели.

В частности, увеличилось количество USB-портов, поддерживается размещение в стойках по стандарту OCP V.2. Не осталось без внимания и ПО управления сервером, в котором были значительно усилены функции безопасности — есть система обнаружения вторжений и дополнительная аутентификация до загрузки сервера.

Для удобства управления сервером на передней панели размещен светодиодный дисплей, на который могут выводиться информационные сообщения и ошибки. Дополнительные опции сервера включают в себя карты расширения с четырьмя E1.S 25 мм, два слота OCP NIC 3.0, дополнительный порт отладки OCP USB и два слота PCIe FHHL.

Sonora Pass поддерживает установку двух процессоров Intel Xeon Cooper Lake, в отличие от Tioga Pass, где использовались процессоры Intel Xeon Skylake-SP с TDP до 165 Вт. Для оперативной памяти используется 12 слотов (по 6 на каждый процессор). 

Не смотря на сообщения о дефиците процессоров Intel Xeon Cooper Lake, Facebook удалось заключить контракт на поставку необходимого количества чипов для собственных нужд, что позволит производить новую модель сервера без задержек.

Постоянный URL: http://servernews.ru/1010992
14.05.2020 [16:56], Юрий Поздеев

Penguin Computing представила OCP-платформу для Intel Xeon Platinum 9200

На мероприятии OCP Virtual Summit 2020 Penguin Computing представила новую модель сервера RELION XO1122eAP на базе Intel Xeon Cascade Lake-AP. Данное решение разработано с учетом стандартов OCP (Open Compute Project) и предназначено для использования в областях высокопроизводительных вычислений (HPC), ИИ и машинного обучения (AI/ML). 

Сервер RELLION XO1122eAP имеет форм-фактор 1U и предназначен для платформы TUNDRA AP второго поколения.

В компактном корпусе располагаются два узла Intel Server System S9200WK, каждый из которых включает в себя два процессора Intel Xeon 9200, до 3 Тбайт оперативной памяти DDR4 и два накопителя форм-фактора M.2.

Для отвода тепла от такой компактной системы используется жидкостная система охлаждения CoolIT. Питается система от стойки — для этого используется три независимых модуля с напряжением 48В постоянного тока (OCP Rack V.2). Данный сервер не предполагает использование дополнительных GPU/ускорителей. В портфолио Penguin Computing есть подобные решения, но они не обладают такой высокой плотностью размещения.

Таким образом, в 1U-сервере можно получить систему с 224 ядрами и 6 Тбайт оперативной памяти. При этом цена такой системы будет невысока — разработчик в своем пресс-релизе делает на этом акцент. Именно простота обслуживания и низкие эксплуатационные расходы являются преимуществами оборудования на базе OCP.

В стандартной стойке OCP Rack можно разместить до 40 подобных серверов, что делает это решение одним из самых компактных на рынке.

Постоянный URL: http://servernews.ru/1010937
14.05.2020 [15:17], Юрий Поздеев

Inspur представила TOR-коммутаторы 100GbE

На мероприятии OCP Virtual Summit 2020 Inspur представила две новинки: коммутатор доступа SC5630EL и коммутатор агрегации SC8661SL. Обе модели построены на ASIC Broadcom в паре с Intel Xeon D-1527 (4 ядра с базовой частотой 2,2 ГГц) и имеют скорость портов до 100 Гбит/с.

Коммутатор доступа SC5630EL в форм-факторе 1U имеет 48 портов 10/25 Гбит/с и 8 портов 40/100 Гбит/с. Общая пропускная способность коммутатора достигает 4 Тбит/с. Для обработки сетевых пакетов используется отдельный процессор ASIC Broadcom Trident3 с буфером 32 Мбайт. Для управления есть выделенные порты: один RJ-45 10/100/1000 Мбит/с, один RJ-45 Serial Console Port и один USB 3.0 порт. 

Для работы ОС доступно от 16 до 32 Гбайт оперативной памяти и 240 Гбайт на встроенном накопителе. Два блоки питания с возможностью «горячей замены» могут работать при входном напряжении от 90 до 265 В переменного тока, также существует версия для работы от постоянного тока напряжением от 164 до 300 В. Максимальная потребляемая мощность коммутатора составляет всего 296 Вт. Рабочая температура от 0 до 40 градусов Цельсия. 

Коммутатор агрегации SC8661SL представляет собой модульное шасси форм-фактора 4U с 4 слотами для модулей расширения. Каждый модуль может иметь 32 100GbE-порта — таким образом, максимальное количество портов достигает 128. Общая пропускная способность коммутатора составляет 25,6 Тбит/с.

Ресурсы для работы ОС коммутатор имеет аналогичные предыдущей модели, но процессор для обработки сетевых пакетов установлен уже более производительный — ASIC Broadcom Tomahawk 3 с буфером 64 Мбайт. Максимальная потребляемая мощность составляет 2148 Вт, а за питание отвечают четыре (2+2) блока с возможностью «горячей замены».

Работают коммутаторы под управлением открытой ОС SONIC. Оба коммутатора могут поставляться как отдельно, так и в составе комплексного решения OCP Rack Solution for AI.

Постоянный URL: http://servernews.ru/1010931
13.05.2020 [16:47], Юрий Поздеев

Wiwynn анонсировала серверы с Intel Xeon Cooper Lake

В рамках OCP Virtual Summit 2020 широко известная в узких кругах компания Wiwynn, сотрудничающая на ниве OCP с Facebook и Microsoft, представила свои новые модульные серверные платформы, ориентированные на облачных провайдеров и крупные дата-центры.

1U-система SV5100G4 разработана на основе спецификаций OCP Project Olympus, поддерживает до двух процессоров Intel Xeon Cooper Lake и оптимизирована для работы с приложениями *aaS.

SV7100G4 представляет собой 4U-шасси на 12 однопроцессорных серверов-лезвий. Каждое лезвие имеет слоты расширения PCIe для подключения дополнительных карт и встроенную систему управления OCP 3.0 Unified Server Management. Серверы-лезвия можно менять «на горячую», без остановки работы всей системы.

В серии также имеется специализированный сервер SV7100G3. В шасси высотой 4U можно разместить до 48 ускорителей в форм-факторе M.2, что позволяет создать высокоплотное решение для транскодирования видео или ИИ-задач. 

Для эпохи 5G и вычислений на границе сети Wiwynn представила два компактных сервера (уменьшенной глубины) для размещения в шкафах вместе с телекоммуникационным оборудованием.

EP100 3U разработан с учетом спецификаций OCP openEDGE и позволяет разместить в неглубоком (ШхГхВ 440х430х130 мм) корпусе 3U до пяти серверов-лезвий, каждый из которых имеет один процессор Intel Xeon, 8 слотов под оперативную память DDR4 и два отсека для SSD дисков форм-фактора U.2 с возможностью горячей замены.

ES200 представляет собой платформу 2U с глубиной всего 450 мм, поддерживает установку до двух процессоров Intel Xeon Cooper Lake, имеет 16 слотов под оперативную память DDR4, позволяет установить до 6 SSD дисков форм-фактора U.2. Основная сфера применения данного сервера — IoT и небольшие периферийные нагрузки.

Постоянный URL: http://servernews.ru/1010830
23.04.2020 [13:00], Владимир Мироненко

Продажи OCP-оборудования выросли в 2019 году на 40 %

Организация Open Compute Project Foundation (OCP) сообщила результаты независимой оценки влияния проекта Open Compute на рынок, выполненной международной исследовательской компанией Omdia.

В исследовании, проведенном Omdia по заказу OCP, выполнен анализ глобального внедрения и влияния оборудования, сертифицированного OCP, на технологическую индустрию.

В числе предварительных выводов исследования указаны:

  • Продавцы сертифицированного OCP-оборудования получили доход от продаж в размере $3,6 млрд (без учёта членов совета OCP), увеличив реализацию по сравнению с 2018 годом более чем на $1 млрд или на 40 %.
  • Прогноз выручки OCP за период до 2020 года составил $5,3 млрд, а к 2023 году — $11,8 млрд, прогнозируемые совокупные годовые темпы роста (CAGR) равны 36 %.
  • В регионах APAC и EMEA рост рынка составит к 2023 году до 50 %.
  • Продажи OCP-оборудования (без учёта членов совета OCP) к 2023 году могут достичь 5 % рынка.
  • Государственные проекты, игры, электронная коммерция и энергетика стали главными источниками роста продаж в 2019 году, они будут и дальше выступать в качестве основных факторов роста.
  • Важность высокопроизводительных вычислений (HPC) всё больше находит признание у телекоммуникационных компаний, предприятий и правительственных организаций, так как HPC были названы несколькими корпоративными вертикалями в качестве важного фактора роста.
  • Преимущества использования оборудования, сертифицированного OCP, привлекает внимание новых клиентов из таких отраслей, как энергетика и нефтегазовый сектор.

«Мы наблюдаем смену парадигмы в отрасли центров обработки данных, поскольку ускорение внедрения продолжается, — считает Роки Баллок, исполнительный директор Фонда OCP. — Исходя из выводов исследования, мы будем стимулировать наше сообщество к внедрению инноваций, развитию сотрудничества и улучшению глобальной экосистемы для поддержки будущего роста».

Постоянный URL: http://servernews.ru/1009208
20.04.2020 [18:59], Сергей Карасёв

Видео дня: монтаж суперкомпьютера Attaway в Sandia Labs

Национальными лабораториями Сандия (Sandia National Labs) Министерства энергетики США опубликован видеоролик в формате Timelapse (см. ниже), демонстрирующий процесс создания высокопроизводительного вычислительного комплекса Attaway. Система Attaway названа в честь Стива Аттавея (Steve Attaway), сотрудника лабораторий, который посвятил им больше 30 лет своей жизни.

Созданием вычислительного комплекса занималась компания Penguin Computing.

Суперкомпьютер построен в рамках программы Tri-Laboratory Commodity Technology Systems (CTS-1) Администрации по национальной ядерной безопасности США (NNSA). Целью инициативы является реализация проектов в сфере безопасности в интересах Лос-Аламосской национальной лаборатории и Ливерморской национальной лаборатории им. Э. Лоуренса.

Суперкомпьютер Attaway использует решения Open Compute и является одной из крупнейших OCP-систем в мире. Основой платформы являются 18-ядерные процессоры Intel Xeon Gold 6140 с базовой тактовой частотой 2,3 ГГц. Общее количество вычислительных ядер достигает 52 920. Система использует 282 240 Гбайт памяти и интерконнект Intel Omni-Path.

Производительность в тесте Linpack составляет 2724,52 терафлопса (триллиона операций с плавающей запятой в секунду). Пиковое быстродействие достигает 3894,91 терафлопса. В текущем рейтинге мощнейших суперкомпьютеров мира Тор500 система занимает 94-е место. 

Постоянный URL: http://servernews.ru/1008912
29.02.2020 [15:21], Сергей Карасёв

Мероприятие OCP Global Summit отменено из-за коронавируса

Организация Open Compute Project Foundation (OCP) вынуждена сообщить об отмене мероприятия OCP Global Summit. Ранее планировалось, что саммит пройдёт с 4 по 5 марта в центре San Jose Convention Center в Калифорнии (США).

Опасения у организаторов вызывает дальнейшее распространение коронавируса, из-за которого пострадали многие сегменты отрасли информационных технологий.

Мероприятие OCP Global Summit посвящено открытым проектам в сферах программного и аппаратного обеспечения для центров обработки данных. Разработки призваны достичь универсальности и простоты масштабирования серверных платформ.

Open Compute Project поддерживается такими известными компаниями, как Facebook, IBM, Intel, AMD, Nokia, Google, Huawei, Microsoft, Seagate, Western Digital, Dell, Cisco, Lenovo, Samsung и другими.

Увы, в нынешнем году OCP Global Summit в традиционной форме проводиться не будет — организаторы предпочли отказаться от массовых мероприятий, привлекающих большое количество людей. Отмечается, что в связи с отменой саммита не будут проводиться и запланированные события — Future Technology Symposium, OCP SONiC/SAI Pre-Summit Workshop и Open System Firmware Hack.

Таким образом, коронавирус нанёс ещё один удар по IT-индустрии. Ранее, напомним, была отменена ожидаемая выставка MWC 2020, которая должна была пройти в испанской Барселоне. 

Постоянный URL: http://servernews.ru/1004880
22.11.2019 [23:46], Алексей Степин

SC19: Microsoft показала серверы Open CloudServer — сердце Azure

Мы уже рассказывали нашим читателям об инициативе Microsoft по запуску высокопроизводительной инфраструктуры в облачном сервисе Azure. Новые виртуальные машины компании предназначены для тех, кому требуются самые интенсивные вычисления.

Анонсом дело не ограничилось, и на SC19 компания продемонстрировала новое высокопроизводительное аппаратное обеспечение Azure на базе ускорителей NVIDIA и Graphcore.

Новые серверы Microsoft Azure являются частью инициативы Open Compute Project. Платформа называется Open CloudServer (изначально MS Project Olympus) и частично является открытой; код инструментария управления будет выкладываться на GitHub. Аппаратный дизайн открыт полностью, стандартизирован и его описание можно найти по вышеприведённой ссылке, а также на ресурсе MSDN

Открывает серию сервер Azure NDv2, самый крупный из новинок. Его высота обусловлена применением 8 ускорителей NVIDIA Tesla V100 в формате SXM2, каждый из которых снабжён солидным радиатором. Неудивительно, поскольку каждый такой чип может выделять до 300 ватт тепла.

Основным процессором в этих серверах выступает Xeon Platinum 8168 (24C/48T, 205 Ватт TDP), его дополняет 672 Гбайт оперативной памяти, но основная мощь скрыта именно в ускорителях V100, каждый из которых несёт на борту 32 Гбайт быстрой памяти HBM2. Заказчикам новой услуги доступны кластеры, включающие до 100 таких серверов (до 800 ускорителей NVIDIA). В качестве межсоединений используется сеть InfiniBand, как обеспечивающая меньшую латентность, нежели Ethernet.

А вот серверы Azure HBv2 отличаются от NDv2 буквально всем. Они используют компактные корпуса и процессоры AMD серии EPYC 7002. Весьма любопытно выглядит система охлаждения с четырьмя тепловыми трубками на каждый процессор, но такое решение продиктовано желанием повысить плотность размещения вычислительных мощностей.

Виртуальные машины, которые будут размещаться на этих серверах, смогут предоставить заказчикам до 120 ядер AMD Rome (без SMT), до 480 Гбайт оперативной памяти и локальное хранилище данных объёмом до 1,6 Тбайт. Внутренняя сеть NDv2 на базе InfiniBand HDR будет использовать RDMA и работать на скорости 200 Гбит/с, внешняя сеть Azure ‒ на скорости 40 Гбит/с.

Максимальный объём кластера на базе NDv2 для одной задачи может достигать 36 тысячи ядер, крупнейшим клиентам Microsoft сможет предоставить до 80 тысяч ядер. Любопытно, что в выставочном экземпляре HBv2 явно видна установленная обычная видеокарта GIGABYTE, использовавшаяся, скорее всего, в демонстрационных целях.

Серверы Azure NDv3 используют более высокий корпус, что вызвано необходимостью размещения полноразмерных плат ускорителей на базе интеллектуального процессора (IPU) Graphcore C2. Об этом процессоре мы уже рассказывали, он имеет уникальную тайловую архитектуру и предназначен для ускорения задач машинного обучения.

Каждая виртуальная машина нового типа сможет предоставить в распоряжение заказчика 16 процессоров IPU, каждый из которых способен выполнять более 1200 потоков. Система межсоединений, задействованных в NDv3, обеспечит обучение больших нейросетей на крупномасштабных моделях. Объём доступной системной памяти составит 768 Гбайт, внутренней памяти IPU ‒ 300 Мбайт на чип.

Наконец, серверы Azure NVv4 представляют собой решения на базе процессоров AMD EPYC 7002 и ускорителей AMD Radeon Instinct. Выставочная модель была оснащена пакетами плат Instinct MI25. Пожалуй, это самое гибкое решение, поскольку заказчики смогут использовать виртуальные машины даже с 1/8 от ускорителя. Microsoft предлагает широкий выбор вариантов.

В отличие от NDv2, поддержка SMT в этой варианте будет включена. Данная версия сервера предназначается, главным образом, для сервисов удалённой визуализации и удалённых рабочих сред (virtual desktops). Поддерживаются протоколы RDP 10, Teradici PCoIP и HDX 3D Pro, пользователь сможет работать с API DirectX9 ‒ 12, OpenGL 4.6 или Vulkan 1.1. Максимально возможная конфигурация одной виртуальной машины NVv4 ‒ 32 процессора, 112 Гбайт памяти и 16 Гбайт памяти GPU. Скорость сети Azure для этих систем составляет 50 Гбит/с.

Постоянный URL: http://servernews.ru/998260
Система Orphus