Материалы по тегу: cuda

17.09.2017 [20:00], Иван Грудцын

Сервер NVIDIA DGX-1 возглавил рейтинг производительности Geekbench

Онлайн-база Geekbench Browser время от времени пополняется результатами, в которых фигурируют опытные образцы комплектующих — процессоров, материнских плат, графических адаптеров и т. д. И вот недавно в ней обнаружились записи, в которых фигурировал обновлённый сервер NVIDIA DGX-1 для задач глубинного обучения. Найти результаты системы на базе восьми HPC-ускорителей Tesla V100 было совсем несложно, ведь расположились они на первом и втором местах в табели о рангах Geekbench 4.

В ходе тестирования использовались разные API — OpenCL и CUDA. Прогон бенчмарка Geekbench 4 с проприетарным API NVIDIA оказался значительно более успешным, чем с альтернативным интерфейсом программирования приложений. Разница между результатами составила 54,4 % — 743 537 очков против 481 504. Лучшие результаты на ускорителях Tesla P100 сегодня выглядят совсем уж скромно на фоне успехов представителей семейства NVIDIA Volta. Лучший из них едва превысил отметку в 320 тыс. очков.

Тестирование проводилось в Linux-среде (Ubuntu 16.04.2 LTS), а конфигурация сервера DGX-1, скорее всего, соответствовала базовой. По умолчанию в 3U-корпусе установлены восемь ускорителей Tesla V100 16GB HBM2 в форм-факторе SXM2 (интерфейс NVLink 2.0 с ПСП 300 Гбайт/с), дуэт 20-ядерных процессоров Intel Xeon E5-2698 v4, 512 Гбайт оперативной памяти LRDIMM DDR4-2133, четыре 1,92-Тбайт SSD-накопителя в массиве RAID 0, такое же количество блоков питания номиналом 1600 Вт каждый и множество элементов системы охлаждения.

Сравнение характеристик PCI-E и SXM2-версий Tesla V100

Сравнение характеристик PCI-E и SXM2-версий Tesla V100

Вычислительные возможности сервера NVIDIA DGX-1 образца 2017 года (ранее система базировалась на Tesla P100) наглядно иллюстрирует сравнение его результатов с показателями двух- и четырёхпроцессорных серверов, «заряженных» CPU Intel Xeon Platinum серии 8100. Шестикратное преимущество DGX-1 — веский аргумент в пользу решения NVIDIA. Напомним, что в матричных (Tensor) вычислениях производительность SXM2-версии Tesla V100 составляет 120 Тфлопс, а PCI-E версии — 112 Тфлопс. Последняя используется в рабочих станциях DGX Station «всего лишь» с четырьмя HPC-ускорителями NVIDIA и одним процессором Intel Xeon E5-2698 v4.

Поставки серверов DGX-1 на базе решений NVIDIA Volta начались более полутора месяцев назад. За одну систему заказчикам предлагается заплатить $149 000 — на 20 тыс. долларов больше, чем за аналогичный сервер на ускорителях Tesla P100.

Постоянный URL: http://servernews.ru/958629
30.05.2017 [12:39], Геннадий Детинич

NVIDIA и тайваньские ODM-производители наполнят мир ИИ-ускорителями

В ходе выступления на открытии Computex 2017 глава NVIDIA Дженсен Хуанг сделал ряд заявлений, которые призваны подчеркнуть новую роль компании в меняющемся мире. Новый мир обещает оказаться наполненным платформами и решениями с зачатками искусственного интеллекта. Десять лет назад всё началось с поглощения AMD компании ATI, что вылилось в создание гибридных решений и технологий GPGPU, которые позволили графическим ядрам выполнять неграфические расчёты. В активе NVIDIA нет собственных вычислительных скалярных ядер, но технология CUDA компании для решения задач с помощью GPGPU стала более популярной, чем аналогичная технология AMD.

www.extremetech.com

www.extremetech.com

Тема искусственного интеллекта и глубокого машинного обучения вдохнула в GPGPU-платформы новую жизнь. Графические процессоры с множеством потоковых процессоров оптимально подходят для ускорения «ИИ-расчётов» с одинарной (FP32) и половинной (FP16) точностью. Появляется возможность собрать суперкомпьютер для ИИ буквально размером с тумбочку. Это закроет нужды в подобных вычислительных ресурсах для массы небольших фирм и учебных учреждений, а для центров обработки данных открываются перспективы едва ли не безграничного масштабирования соответствующих ресурсов. Отдать клиенту ровно столько, сколько он требует — это высший пилотаж любого сервиса, и NVIDIA готова в этом помочь.

Полочный компьютер NVIDIA DGX-1 на адаптерах с графическими процессорами P100 или V100

Полочный компьютер NVIDIA DGX-1 на адаптерах с графическими процессорами P100 или V100

Год назад компания представила полочный компьютер DGX-1 на адаптерах с графическими процессорами P100 (архитектура Pascal). Неделями ранее платформа DGX-1 получила обновление в виде адаптеров с GPU V100 (архитектура Volta). Это система с восемью ускорителями в формфакторе SXM2. Между собой ускорители связаны в «кубическую» ячеистую сеть через интерфейс NVIDIA NVLink. Одна такая полка в операциях с половинной точностью обеспечивает производительность на уровне 960 Тфлопс. Помимо восьми адаптеров Tesla V100 в состав DGX-1 входит пара процессоров Intel Xeon, обеспечивая загрузку операционной системы и GPGPU-вычисления.

Эталонная платформа NVIDIA HGX

Эталонная платформа NVIDIA HGX

Для использования DGX-1 в составе стандартных стоек в ЦОД в компании разработали эталонную платформу HGX на базе жидкостного охлаждения. Аппаратные конфигурации DGX-1 и HGX ничем не отличаются. Более того, DGX-1 на GPU P100 легко могут быть замены на DGX-1 с GPU V100. Чтобы наполнить рынок систем для ЦОД критической массой ускорителей, NVIDIA запустила в понедельник 29 мая партнёрскую программу по поддержке ряда тайваньских ODM-производителей. Среди партнёров можно обнаружить как давних клиентов NVIDIA — это компании Inventec, Quanta и Wistron, так и новое имя — компанию Foxconn.

Блок-схема эталонной платформы NVIDIA HGX (NVIDIA)

Блок-схема эталонной платформы NVIDIA HGX (NVIDIA)

В рамках партнёрской программы NVIDIA обещает разработчикам ранний доступ к документации и архитектуре HGX, а также всестороннюю техническую поддержку. Для компании важно заручится интересом со стороны тайваньских производителей, иначе их фокус внимания рискует переключиться на конкурирующие продукты Google (TPU),  AMD (Vega) и Intel (Xeon Phi).

Постоянный URL: http://servernews.ru/953054
10.09.2016 [02:00], Алексей Степин

IBM анонсировала новые процессоры Power8 с поддержкой NVLink

Несмотря на серьезную заявку архитектуры х86 на полное доминирование в компьютерном мире, остаются сферы и области, где используются иные, более эффективные в ряде задач архитектуры. Одной из таких областей является сфера супервычислений, где довольно прочно укрепилась компания IBM со своими процессорами Power. Текущее поколение этих процессоров носит общее название Power8, впервые оно было представлено ещё в 2013 году в версиях с количеством ядер от 4 до 12. Поколение Power9 должно увидеть свет в следующем году, ну а пока на днях корпорация анонсировала выпуск новых, усовершенствованных процессоров поколения Power8, получивших название Power8+.

IBM Power8 (без NVLink)

IBM Power8 (без NVLink)

Отличий у новинок немного. Самым главным является поддержка высокоскоростной шины обмена данными NVLink, разработанной и продвигаемой NVIDIA. Это позволяет создавать гетерогенные системы на базе Power8+ и ускорителей NVIDIA Pascal GP100 с невиданной ранее производительностью и отсутствием узких мест, ведь даже базовая версия NVLink обеспечивает пропускную способность 80 Гбайт/с. Каждый процессор Power8+ поддерживает прямое подключение до четырёх устройств NVLink, то есть, четырёхпроцессорная система с четырьмя 12-ядерными чипами может оснащаться шестнадцатью ускорителями GP100. Пока Power8+ имеет только один чип в семействе — десятиядерную модель с частотой до 3,26 ГГц. Интегрированный контроллер памяти DDR4 обладает пропускной способностью 115 Гбайт/с на процессор. Максимальный поддерживаемый объём составляет 512 Гбайт на чип.

Новое семейство серверов на базе Power8

Новое семейство серверов на базе Power8

Помимо обновлённых процессоров, компания также продемонстрировала новые серверные системы, но только одна из новинок, Power S822LC, предназначенная для рынка HPC, базируется на Power8+ и поддерживает NVLink. По словам производителя, скорость передачи данных у нее в пять раз превышает аналогичный параметр у сопоставимой по характеристикам системы на базе х86, а использование единого пространства памяти существенно облегчает разработку программного обеспечения, использующего ресурсы графических процессоров.  Эта система может нести на борту два 10-ядерных чипа Power8+ и до четырёх модулей NVIDIA GP100. Максимальная ёмкость оперативной памяти составляет 1 Тбайт в 32 модулях DIMM, общая пропускная способность подсистемы составляет 230 Гбайт/с. Имеются дополнительные слоты расширения PCIe, поддерживается как жидкостное, так и воздушное охлаждение.

NVLink позвляет ЦП и ГП общаться гораздо более эффективно

NVLink позволяет ЦП и ГП общаться гораздо более эффективно

Аналогичная модель выпущена для рынка Big Data, но она не использует ускорители GP100, а вместо этого поддерживает обычные ускорители NVIDIA в формате PCI Express. Зато количество дисковых отсеков в этой модели увеличено с двух до двенадцати, что позволяет разместить до 96 Тбайт дискового пространства в одном корпусе. Базовая модель S821LC выполнена в корпусе 1U (старшие имеют конструктив 2U) и по конфигурации напоминает S822LC for Big Data, но у неё всего четыре дисковых отсека и четыре слота PCIe. Возможна установка одного ускорителя NVIDIA K80 в форм-факторе PCI Express. В моделях S822LC for Big Data и 821LC максимальный объём оперативной памяти уменьшен до 512 Гбайт в 16 слотах DIMM. Напомним, что контроллеры памяти у Power8 внешние, выполненные в виде чипов Centaur, служащих также в качестве кеша L4.

IBM S822LC for High Performance Computing: два процессора и четыре ускорителя GP100

IBM S822LC for High Performance Computing: два процессора и четыре ускорителя GP100

Согласно данным, опубликованным IBM, ранние тесты, проделанные одним из крупнейших интернет-провайдеров, компанией Tencent, показали, что кластер на базе S822LC for BigData под нагрузкой показал результаты в три раза превосходящие результаты кластера на базе х86, причём, общее количество серверов в первом случае было на 2/3 меньше. На новые системы IBM ожидается существенный спрос: многие организации уже провели собственные тесты и разместили соответствующие заказы. В числе первых заказчиков значится лаборатория департамента энергетики США Oak Ridge National Laboratory (ORNL), а также ряд крупных межнациональных корпораций. ORNL планирует использовать новинки в качестве тестовой платформы для подготовки к выпуску следующего поколения процессоров IBM — Power9, которые также будут поддерживать NVLink, но уже новой, второй версии.

Постоянный URL: http://servernews.ru/939220
06.10.2014 [11:28], Алексей Степин

IBM будет сотрудничать с NVIDIA в деле упрочнения союза OpenPOWER

Никто в здравом уме сегодня не поставит под сомнение доминирующую роль архитектуры x86 на рынке вычислительных систем. Она далеко не идеальна, но речь не об этом. Одним из немногих оставшихся бастионов, неподвластных альянсу Wintel, является IBM с её архитектурой POWER, которая активно используется в фирменных «больших системах», поставляемых на рынок компанией. Специалисты не без оснований считают, что POWER гораздо лучше проявляет себя именно на масштабных задачах, где для систем на базе x86 приходится городить многочисленные «костыли». Однако закрытой архитектуре да ещё с довольно узкой областью применения тяжело продержаться на рынке в одиночку.

Именно поэтому IBM провозгласила инициативу под названием OpenPOWER, главной целью которой стало продвижение процессорной архитектуры POWER посредством открытия спецификаций на аппаратное и программное обеспечение партнерам, которые вошли в созданный 6 августа 2013 года консорциум под тем же названием. Таким образом, стал возможным выпуск чипов POWER не только силами самой IBM, но и её партнёров. Но, как мы знаем, есть и другой путь к созданию мощных и эффективных крупномасштабных вычислительных систем — использование графических процессоров для параллельной обработки данных.

Компания NVIDIA, чья платформа CUDA на сегодня является наиболее распространённой в мире вычислений на графических процессорах, объявила о сотрудничестве с IBM в рамках вышеописанной инициативы OpenPOWER с целью создания сверхвысокопроизводительных серверов, сочетающих в себе лучшие черты обоих вычислительных архитектур. IBM уже провела работу по оптимизации своей системы баз данных DB2 под графические процессоры NVIDIA и полагает, что в итоге может выйти платформа, оставляющая позади самые дорогие решения Oracle. Ведутся работы над оптимизацией другого программного обеспечения во всех областях — от биоинформации и молекулярной динамики до погодного и экономического моделирования.

Ранее к альянсу OpenPOWER присоединилась компания Samsung, один из крупнейших разработчиков микроэлектроники. Располагая мощными процессорами POWER, продвинутыми техпроцессами Samsung и лучшими разработками NVIDIA, союз производителей может выпустить на рынок уникальные как по возможностям, так и по уровню производительности системы, разработка и создание которых были бы невозможными без этого сотрудничества. 

Постоянный URL: http://servernews.ru/903029
16.12.2011 [10:03], SN Team

NVIDIA открыла исходный код компилятора CUDA

NVIDIA объявила о предоставлении исходного кода нового компилятора CUDA на базе системы LLVM исследователям и разработчикам программных инструментов, чтобы упростить добавление поддержки GPU в большее число языков программирования и обеспечить работу приложений CUDA на альтернативных процессорных архитектурах.

LLVM - это распространенная инфраструктура компилятора с открытым кодом, имеющая модульное строение, которая упрощает добавление поддержки новых языков программирования и процессорных архитектур. Она используется для разных задач программирования во многих ведущих компаниях, включая Adobe, Apple, Cray и Electronic Arts.

Появление альтернативных подходов к программированию гетерогенных параллельных систем для решения специфических задач и к созданию будущих моделей программирования ускорит внедрение экзафлопных вычислений. Открыв исходный код компилятора CUDA и формат внутреннего представления (IR), NVIDIA позволяет исследователям более гибко применять модель программирования CUDA к другим архитектурам, что способствует появлению более мощных вычислительных платформ следующего поколения.

Источник:

Постоянный URL: http://servernews.ru/595291
17.11.2011 [12:04], SN Team

NVIDIA предлагает новый подход к программированию гетерогенных систем

Чтобы упростить программистам доступ к преимуществам параллельных вычислений в гетерогенных системах, основанных на базе CPU и GPU, компании NVIDIA, Cray, Portland Group (PGI) и CAPS представили новый стандарт под названием OpenACC. Использование стандарта позволит программистам с помощью директив давать "подсказки" компилятору, какие участки кода нуждаются в ускорении, при этом исчезает необходимость модификации самого кода. Перепоручая компилятору задачу ускорения за счет распараллеливания, директивы позволяют ему распределять вычисления по ресурсам акселератора.

 

 

Предполагается, что от внедрения OpenACC выиграют разработчики, создающие программы для моделирования процессов в химии, биологии, физике, анализе данных, прогнозировании погоды и климата, разведке и многих других областях знания. Ожидается, что в существующих компиляторах, развиваемых компаниями Cray, PGI и CAPS, поддержка OpenACC появится с первого квартала 2012 года.

Директивы позволяют переносить код между платформами и оборудованием от разных поставщиков, позволяя продолжить инвестирование в существующие приложения и обеспечивая легкий путь миграции к ускоренным вычислениям. По последним данным, большинство разработчиков сообщают об увеличениях производительности приложений от 2 до 10 раз в двухнедельный срок при использовании существующих компиляторов с поддержкой директивной модели программирования.

Источник:

Постоянный URL: http://servernews.ru/595216
16.11.2011 [13:28], SN Team

NVIDIA и BSC построят суперкомпьютер на базе чипов ARM и CUDA

Компания NVIDIA объявила об участии в совместном проекте с Барселонским суперкомпьютерным центром (BSC) по разработке гибридного суперкомпьютера, в котором будут использоваться энергоэффективные процессоры Tegra с архитектурой ARM и высокопроизводительные графические процессоры с множеством ядер CUDA. Совместный проект получил название EU Mont-Blanc Project, основной задачей разработчиков станет повышение эффективности вычислений в 2-5 раз при сравнении с существующими на данный момент энергосберегающими системами.

 

EU Mont-Blanc Project
EU Mont-Blanc Project

 

В конечном итоге организации планируют создать суперкомпьютер, производительность которого достигнет одного экзафлопса (1000 петафлопс или в 100 раз производительнее самого быстрого на сегодняшний день суперкомпьютера), а энергопотребление будет 15-30 раз меньше в сравнении с используемыми сегодня архитектурами вычислительных комплексов.

 

EU Mont-Blanc Project

 

Для поддержки растущего спроса во всем мире на подобные инициативы на базе ARM, NVIDIA также объявила о планах по разработке нового пакета для разработчиков приложений. Набор с аппаратным обеспечением от SECO включает четырехъядерный ARM CPU NVIDIA Tegra 3 и для ускорения дискретный GPU NVIDIA. Появление на рынке данного решения ожидается в первой половине 2012 года. Решение получит поддержку набора инструментов параллельного программирования NVIDIA CUDA.

Источник:

Постоянный URL: http://servernews.ru/595214
12.08.2011 [18:52], Георгий Орлов

Barracuda удвоила емкость «облака» для резервного копирования

Компания Barracuda Networks Inc. сообщила об увеличении дискового пространства для хранения данных в рамках своей услуги резервного копирования Barracuda Backup Service. Теперь 200 Гбайт облачного хранилища будут доступны за 50 долларов в месяц, то есть 25 центов за Гбайт. Ранее Barracuda предоставляла эту услугу за ту же абонентскую плату, однако клиентам было доступно 100 Гбайт дискового пространства. Как и прежде, Barracuda не ограничивает трафик при резервировании и восстановлении данных. Емкость удаленного хранилища резервируемых данных можно увеличивать «порциями» по 200 Гбайт. При использовании облачного хранилища Barracuda данные пользователя сохраняются по защищенному каналу в двух географически разных местах, а третья резервная копия находится у пользователя. Компания предлагает свой фирменный программно-аппаратный комплекс Barracuda Backup Server по цене от 999 долларов США с подпиской на обновления (Energize Updates) по цене от 199 долларов в год.

 

Barracuda Networks

 

Комплекс обеспечивает полное автоматическое локальное резервное копирование данных, безопасную репликацию с избыточностью, а также поддержку сетевых файловых систем CIFS (Windows), SSHFS (Mac и Linux/Unix) и NCP (Novell), почтового сервера Microsoft Exchange Server 2000, 2003 и 2007 и Microsoft SQL Server 2000, 2005 и 2008. Помимо этого, программа-агент позволяет записывать резервные копии состояния системы серверов под управлением Microsoft Windows Server 2003 и 2008, Windows Storage Server 2003, Windows Vista и Windows XP.

Источник:

Постоянный URL: http://servernews.ru/594919
Система Orphus