Материалы по тегу: nvidia

21.06.2017 [23:38], Иван Грудцын

В «меню» PNY на ISC 2017 — ускорители Quadro, Tesla и мощные серверы

Известный поставщик серверных решений, компания PNY, не могла пропустить выставку ISC 2017, где продемонстрировала свой ассортимент видеоадаптеров и систем в сборе. Большинство прототипов и продуктов полностью изготовлены на производственных мощностях подрядчиков и партнёров американской компании, в числе которых ASUS, Gigabyte, NVIDIA, Supermicro, TYAN и другие. Как бы то ни было, приобрести их зачастую можно только через PNY Technologies (в том числе и на российском рынке).

PNY уже давно занимается поставками ускорителей Quadro, но в этом году взялась отгружать ещё и модели Tesla. Официальный анонс PCI-E версии Tesla V100 состоялся только на днях, поэтому в компании решили ограничиться демонстрацией на стенде адаптера предыдущего поколения — Tesla P100. Продукт TCSP100M-16GB-PB оснащён графическим процессором NVIDIA GP100 (3584 шейдерных блоков) и 16 Гбайт памяти HBM2 с функцией контроля ошибок. В вычислениях двойной точности (FP64) карта обеспечивает быстродействие на уровне 4,67 Тфлопс, а её энергопотребление составляет 250 Вт.

Без Quadro также не обошлось: перед нами модель Quadro GP100 (PNY VCQGP100-PB) с теми же 3584 ядрами CUDA и 16 Гбайт HBM2, что и у Tesla P100. За счёт более высокой частоты GPU «чистая» производительность увеличена до 5,15 Тфлопс (FP64), а максимальное энергопотребление, наоборот, немного ниже — 235 Вт. В число видеовыходов включены DVI-D и квартет DisplayPort 1.4.

Дистрибуция серверов NVIDIA DGX-1 для вычислений, связанных с искусственным интеллектом, также не чужда PNY. Система DGX-1 первого поколения (на фото) содержит восемь ускорителей Tesla P100 с суммарной производительностью 170 Тфлопс (FP16). Среди прочего, сервер включает два 20-ядерных процессора Intel Xeon E5-2698 v4, 512 Гбайт памяти DDR4-2133 и четыре 1,92-Тбайт SSD-накопителя в RAID 0.

А так выглядит NVIDIA DGX-1 второго поколения (наше фото с ISC 2017):

Имеются в ассортименте PNY и серверы попроще. Как, например, следующая двухпроцессорная система с платой Gigabyte:

Однако системы наподобие PNY/TYAN FT77D-B7109 (см. ниже) всё-таки выглядят более впечатляюще. Мощь восьми ускорителей NVIDIA и двух Xeon может использоваться для научных исследований широкого спектра, анализа генетических последовательностей, обнаружения месторождений нефти и газа, масштабных проектов в области распознавания лиц и расшифровки важных данных методом полного перебора или «грубой силы» (англ. brute force). В 4U-корпусе также имеются посадочные места для четырнадцати 2,5-дюймовых SSD и четырёх M.2-накопителей.

Посетители ISC 2017 могли оценить прямо со стенда PNY работу кластера компании в г. Бордо. Для доступа к ресурсам HPC-системы было достаточно воспользоваться QR-кодом.

Постоянный URL: http://servernews.ru/954336
30.05.2017 [12:39], Геннадий Детинич

NVIDIA и тайваньские ODM-производители наполнят мир ИИ-ускорителями

В ходе выступления на открытии Computex 2017 глава NVIDIA Дженсен Хуанг сделал ряд заявлений, которые призваны подчеркнуть новую роль компании в меняющемся мире. Новый мир обещает оказаться наполненным платформами и решениями с зачатками искусственного интеллекта. Десять лет назад всё началось с поглощения AMD компании ATI, что вылилось в создание гибридных решений и технологий GPGPU, которые позволили графическим ядрам выполнять неграфические расчёты. В активе NVIDIA нет собственных вычислительных скалярных ядер, но технология CUDA компании для решения задач с помощью GPGPU стала более популярной, чем аналогичная технология AMD.

www.extremetech.com

www.extremetech.com

Тема искусственного интеллекта и глубокого машинного обучения вдохнула в GPGPU-платформы новую жизнь. Графические процессоры с множеством потоковых процессоров оптимально подходят для ускорения «ИИ-расчётов» с одинарной (FP32) и половинной (FP16) точностью. Появляется возможность собрать суперкомпьютер для ИИ буквально размером с тумбочку. Это закроет нужды в подобных вычислительных ресурсах для массы небольших фирм и учебных учреждений, а для центров обработки данных открываются перспективы едва ли не безграничного масштабирования соответствующих ресурсов. Отдать клиенту ровно столько, сколько он требует — это высший пилотаж любого сервиса, и NVIDIA готова в этом помочь.

Полочный компьютер NVIDIA DGX-1 на адаптерах с графическими процессорами P100 или V100

Полочный компьютер NVIDIA DGX-1 на адаптерах с графическими процессорами P100 или V100

Год назад компания представила полочный компьютер DGX-1 на адаптерах с графическими процессорами P100 (архитектура Pascal). Неделями ранее платформа DGX-1 получила обновление в виде адаптеров с GPU V100 (архитектура Volta). Это система с восемью ускорителями в формфакторе SXM2. Между собой ускорители связаны в «кубическую» ячеистую сеть через интерфейс NVIDIA NVLink. Одна такая полка в операциях с половинной точностью обеспечивает производительность на уровне 960 Тфлопс. Помимо восьми адаптеров Tesla V100 в состав DGX-1 входит пара процессоров Intel Xeon, обеспечивая загрузку операционной системы и GPGPU-вычисления.

Эталонная платформа NVIDIA HGX

Эталонная платформа NVIDIA HGX

Для использования DGX-1 в составе стандартных стоек в ЦОД в компании разработали эталонную платформу HGX на базе жидкостного охлаждения. Аппаратные конфигурации DGX-1 и HGX ничем не отличаются. Более того, DGX-1 на GPU P100 легко могут быть замены на DGX-1 с GPU V100. Чтобы наполнить рынок систем для ЦОД критической массой ускорителей, NVIDIA запустила в понедельник 29 мая партнёрскую программу по поддержке ряда тайваньских ODM-производителей. Среди партнёров можно обнаружить как давних клиентов NVIDIA — это компании Inventec, Quanta и Wistron, так и новое имя — компанию Foxconn.

Блок-схема эталонной платформы NVIDIA HGX (NVIDIA)

Блок-схема эталонной платформы NVIDIA HGX (NVIDIA)

В рамках партнёрской программы NVIDIA обещает разработчикам ранний доступ к документации и архитектуре HGX, а также всестороннюю техническую поддержку. Для компании важно заручится интересом со стороны тайваньских производителей, иначе их фокус внимания рискует переключиться на конкурирующие продукты Google (TPU),  AMD (Vega) и Intel (Xeon Phi).

Постоянный URL: http://servernews.ru/953054
12.05.2017 [14:59], Алексей Степин

Анонсированы новые платформы NVIDIA для разработчиков

Вчера мы рассказывали читателям о прототипе первой многопользовательской рабочей станции виртуальной реальности, которую NVIDIA представила на конференции GTC 2017. Она оснащена четырьмя ускорителями Quadro P6000 и позволяет четырём пользователям работать одновременно в единой среде VR. Но компания анонсировала и другие новинки, например, серию вычислительных станций на базе новой технологии Volta. В серию входят модели DGX-1, DGX Station и HGX.

Рабочая станция с четырьмя новыми процессорами NVIDIA Volta

Рабочая станция с четырьмя новыми процессорами NVIDIA Volta

Первая модель представляет собой стоечное решение с восемью ускорителями Tesla V100, что обеспечивает производительность порядка 960 тензорных терафлопс. По мнению NVIDIA это заменяет 400 обычных серверов. Стоит такая система $149 тысяч, а заказчики получат её уже в третьем квартале. Модель DGX Station выглядит совсем иначе: это рабочая станция в настольном исполнении, она содержит четыре ускорителя Tesla V100. В ней установлены версии ускорителей с разъёмами PCIe и тремя портами DisplayPort. Друг с другом, однако, платы общаются посредством NVLink. Стоит такая станция $69 тысяч.

Серверные варианты

Серверные варианты

Наконец, была представлена платформа NVIDIA HGX-1. Её назначение —  облачные вычисления. Она изначально рассчитана на работу в составе единой инфраструктуры ЦОД, причём эта инфраструктура должна предусматривать наличие единого контура жидкостного охлаждения, к которому платформа и подключается. Характеристики и производительность у HGX-1 аналогичны таковым параметрам у DGX-1, и она содержит восемь ускорителей Tesla V100 в версии с интерфейсом NVLink. Стоимость не оглашена, но она должна быть выше стоимости DGX-1.

Постоянный URL: http://servernews.ru/952092
14.04.2017 [12:23], Сергей Юртайкин

Суперкомпьютер NVIDIA DGX-1 вышел на российский рынок

IT-дистрибутор OCS сообщил о выводе суперкомпьютера NVIDIA DGX-1 на российский рынок. Система рассчитана на задачи в области искусственного интеллекта.

NVIDIA DGX-1 построен на профессиональных ускорителях Tesla P100, взаимодействующих посредством интерфейса NVIDIA NVLink, который обеспечивает 12-кратное превосходство в скорости обмена данными между GPU по сравнению с шиной PCI-E.

Программная составляющая включает NVIDIA DIGITS GPU Training System, NVIDIA Deep Learning SDK (CuDNN, NCCL), NVIDIA Docker для быстрого создания и обучения глубоких нейронных сетей, а также оптимизированные версии фреймворков глубинного обучения — Caffe, Theano, Torch.

По производительности суперкомпьютер сравним с 250 серверами на архитектуре x86. NVIDIA DGX-1 способен обрабатывать и анализировать информацию в 100 раз быстрее по сравнению с традиционными вычислительными системами.

Система разработана специально для искусственного интеллекта, который широко используется в таких областях, как распознавание и синтез речи, распознавание и обработка изображений, создание роботизированных консультационных систем, фармацевтика, персонализированная медицина, беспилотные автомобили и др.

Постоянный URL: http://servernews.ru/950734
13.03.2017 [14:18], Сергей Карасёв

TSMC займётся выпуском HPC-чипов по заказам NVIDIA и Qualcomm

Taiwan Semiconductor Manufacturing Company (TSMC), по сообщениям сетевых источников, займётся выпуском однокристальных систем NVIDIA и Qualcomm для высокопроизводительных вычислений.

В случае NVIDIA речь идёт об изделиях Xavier. По сути, это суперкомпьютер на чипе для автономных транспортных средств. Изделие содержит восемь кастомизированных ядер ARM и графический блок нового поколения на архитектуре Volta с 512 ядрами CUDA. Чип обеспечит производительность на уровне 20 трлн операций глубокого обучения в секунду.

Изначально сообщалось, что при производстве Xavier планируется задействовать 16-нанометровую технологию. Но, вполне вероятно, будет применён более «тонкий» техпроцесс.

Что касается Qualcomm, то эта компания договорилась с TSMC о выпуске изделий Centriq 2400 по 10-нанометровой технологии. Названные чипы созданы специально с прицелом на центры обработки данных и облачные платформы. В основу Centriq 2400 положены собственные вычислительные ядра Qualcomm Falkor CPU на основе архитектуры ARMv8. Количество таких ядер в составе чипа может достигать 48. На коммерческом рынке изделия станут доступны во второй половине нынешнего года. 

Постоянный URL: http://servernews.ru/948998
01.02.2017 [11:11], Сергей Карасёв

Сервер System76 Ibex Pro может комплектоваться восемью ускорителями NVIDIA Tesla P100

Компания System76 выпустила высокопроизводительный сервер Ibex Pro, который может поставляться с программной платформой Ubuntu Server 16.04.1 LTS или Ubuntu Server 16.10.

Стоечная система может нести на борту два серверных процессора Intel Xeon E5 v4 2600 Series. Объём оперативной памяти DDR4-2400 в максимальной конфигурации достигает 1536 Гбайт. В составе подсистемы хранения данных могут быть задействованы восемь 3,5-дюймовых накопителей с интерфейсом Serial ATA 3.0.

Для системы предлагается установка восьми ускорителей NVIDIA Tesla P100 на архитектуре Pascal. Структура памяти CoWoS (чип-на-пластине-на-подложке) с HBM2 с 4096-битной шиной позволила втрое увеличить полосу пропускания памяти по сравнению с архитектурой NVIDIA Maxwell.

Ускорители Tesla P100 для PCIe характеризуется производительностью 4,7 Тфлопс для вычислений двойной точности, 9,3 Тфлопс для вычислений одинарной точности и 18,7 Тфлопс для вычислений половинной точности с технологией NVIDIA GPU Boost.

Цена сервера System76 Ibex Pro начинается с $9575 и может достигать $114 725. Сконфигурировать систему под собственные нужды можно здесь

Постоянный URL: http://servernews.ru/946856
21.12.2016 [08:39], Алексей Степин

Производительность NVIDIA Volta GV100 может достигнуть 9,5 терафлопс

Как известно, следующим после Pascal поколением графических процессоров NVIDIA является Volta. Впрочем, к современным чипам название «графический процессор» применимо всё меньше — с тех пор, как их архитектура стала полностью унифицированной и программируемой, они прочно утвердились в различных проектах суперкомпьютеров, некоторые из которых уже вступили в строй и вовсю заняты научными и другими сложными вычислениями. Создавая свой первый чип Pascal GP100, NVIDIA уделила больше внимания его вычислительным возможностям, нежели графическим, и, похоже, первенца в семействе Volta, чип GV100, ожидает аналогичный подход.

Новый принцип построения узлов суперкомпьютера. Количество плат ускорителей не соответствует указанному в заметке

Новый принцип построения узлов суперкомпьютера. Количество плат ускорителей не соответствует указанному в заметке

Уже подтверждено, что GV100 станет сердцем, а точнее, сердцами суперкомпьютеров Summit в Национальной лаборатории Ок-Ридж (Oak Ridge National Laboratory) и Sierra в Ливерморской национальной лаборатории (Lawrence Livermore National Laboratory). Первый проект должен войти в рабочую стадию в начале 2018 года и развить пиковую мощность 200 петафлопс, что существенно превышает показатель самого быстрого сегодняшнего китайского суперкомпьютера Sunway TaihuLight, чьи возможности оцениваются в 125,4 петафлопса. К сожалению, о характеристиках и архитектуре GV100 мы до сих пор знаем не так много, как хотелось бы, но кое-какие сведения о проекте Summit позволяют сделать некоторые выводы.

Тот самый слайд

Тот самый слайд

Лаборатория в Ок-Ридже опубликовала слайд, на котором Summit сравнивается с суперкомпьютером Titan, базирующимся на чипах Kepler GK110. Состоит он из 18688 узлов, мощность каждого из них составляет 1,4 терафлопса. На том же плакате указаны спецификации Summit: 4600 узлов с мощностью более 40 терафлопс на узел. Указано также, что в каждом узле будет 512 Гбайт памяти DDR4, 800 Гбайт энергонезависимой памяти и некий объём памяти HBM (речь, разумеется, идёт о HBM2). Основой каждого узла станут пара процессоров IBM POWER9 и шесть процессоров NVIDIA Volta. Чипы POWER9, помимо традиционных линий PCI Express (версия 4.0) имеют и 48 линий интерфейса Bluelink, который будет работать в режиме NVLink 2.0 и соединять их с процессорами Volta, что позволит процессорам различных архитектур делить общее пространство памяти, практически не теряя в скорости: пропускная способность может составлять от 80 до 200 Гбайт/с.

Использование NVLink экономит энергию и повышает производительность

Использование NVLink экономит энергию и повышает производительность

Потребляемая Summit мощность составит 13 мегаватт — всего на 4 мегаватта больше, нежели у Titan, при более чем десятикратном превосходстве в производительности. Как мы знаем, NVIDIA объявила о том, что GV100 будет демонстрировать эффективность 72 гигафлопса на ватт при операции перемножения матриц с одинарной точностью (Single precision floating General Matrix Multiply). Для GP100 этот показатель равен 42 гигафлопса на ватт. Нетрудно посчитать, приняв за основу теплопакет GV100 на уровне 300 ватт, что этот чип в теории может достичь производительности 9,5 терафлопс на вычислениях двойной точности (FP64). Шесть чипов GV100 при потреблении не выше 300 ватт на чип как раз и дадут упомянутые на плакате «более 40 терафлопс», а точнее, в теории, смогут выдать 57,2 терафлопса. Даже при конфигурации с теплопакетом 200 ватт и на 20‒25 % более низкой производительности производительность узла составит 45,6 терафлопс, так что у создателей Summit явно есть задел по части экономии электроэнергии при сохранении заявленных характеристик. По крайней мере, такой подход может существенно облегчить работу холодильных установок Summit.

Постоянный URL: http://servernews.ru/944758
15.11.2016 [19:07], Константин Ходаковский

NVIDIA создаёт новые GPU с помощью своего суперкомпьютера на архитектуре Pascal

Представленный в апреле суперкомпьютер NVIDIA DGX SATURNV занял 28-е место по быстродействию в обновлённом мировом рейтинге Top500 и 1-е место — по энергоэффективности, которая оценивается в 9,46 гигафлопс на ватт. По этому показателю детище NVIDIA на 27 % обходит ближайшего конкурента из Швейцарии в лице Piz Daint. А если сравнивать с аналогичным по производительности суперкомпьютером Intel Camphore 2 на базе процессоров Xeon Phi Knights Landing, вычислительный центр SATURNV потребляет в 2,3 раза меньше энергии.

Именно графические ускорители дали резкий толчок развитию суперкомпьютерных мощностей и технологий искусственного интеллекта. Машинное самообучение открывает новые горизонты в самых разных сферах науки, медицины, финансов, проектирования и даже искусства.

Кластер общей производительностью 3,3 петафлопс включает 124 системы DGX-1, каждая из которых объединяет 8 графических процессоров Tesla P100 на архитектуре Pascal. По оценкам NVIDIA, один модуль DGX-1 способен заменить 250 серверов с процессорами x86. Неудивительно, что компания сама использует преимущества искусственного интеллекта в исследованиях и разработках.

В частности, ИИ-технологии суперкомпьютера SATURNV задействованы в разработке программного обеспечения платформы автономного вождения NVIDIA DRIVE PX 2, которая, например, станет основой автоматического управления электромобилей Tesla Motors. Более того, нейросети помогают инженерам компании проектировать дизайн новых сложноинтегрированных GPU и SoC.

Среди наиболее значимых сторонних применений серверов DGX-1 NVIDIA называет корпорацию SAP, предоставляющую инструменты бизнес-планирования 320 тысячам своих клиентов; разработчика искусственного интеллекта OpenAI; Стэндфордский и Нью-Йоркский университеты; стартап в области медицины BenevolentAI.

Постоянный URL: http://servernews.ru/942758
15.11.2016 [15:09], Александр Будик

IBM и NVIDIA совместно занялись продвижением глубинного обучения

Два гиганта IT-индустрии, компании IBM и NVIDIA объединили свои усилия в создании набора инструментов, нацеленных на зарождающийся рынок искусственного интеллекта для корпоративного сегмента. Новый продукт включает решение NVIDIA PowerAI, а также аппаратную платформу IBM Power S822LC.

HPC-сервер IBM Power S822LC

HPC-сервер IBM Power S822LC

Первоначально глубинное обучение было прерогативой отдельных IT-компаний, таких как Google, Baidu, Microsoft. Но теперь AI-приложения всё чаще находят применение в традиционных предприятиях - в банках (например, для распознавания угроз в режиме реального времени), занимающихся производством автомобилей организациях (в системах автономного вождения), розничной торговле (для создания полностью автоматизированных сервисов поддержки с использованием чат-ботов). IBM одной из первых начала внедрение современных технологий искусственного интеллекта в бизнес-процессы предприятий, и технологии NVIDIA помогут развивать это направление, считают представители обеих компаний.

Современный высокопроизводительный GPU NVIDIA P100

Современный высокопроизводительный GPU NVIDIA P100

PowerAI включает большое количество популярных фреймворков для реализации глубинного обучения, в том числе, Caffe, Theano, Torch, NVCaffe, IBM-Caffe. Высокопроизводительный сервер IBM S822LC был представлен в сентябре. Этот компьютер оснащён двумя процессорами Power8 и поддерживает установку до четырёх ускорителей NVIDIA P100. В настоящее время этот сервер является единственным на рынке, который полностью интегрирует технологию NVIDIA NVLink (Power8 является единственным в мире процессором со встроенной поддержкой NVLink).

Как отметила компания IBM, S822LC пользуется популярностью, и вся партия оказалась распроданной к концу третьего квартала. Комплект PowerAI предлагается в качестве бесплатного бонуса к серверу.

Постоянный URL: http://servernews.ru/942738
18.10.2016 [12:48], Алексей Степин

Альянс Google и Rackspace представил сервер на базе IBM POWER9

Не столь давно мы рассказывали читателям о новых версиях процессоров IBM POWER8 с поддержкой шины NVLink. Эти чипы предназначались для использования совместно с новейшими ускорителями NVIDIA Tesla для использования в сфере HPC и машинного обучения. Но POWER8 не является последним поколением процессоров, разрабатываемых «голубым гигантом». Альянс Google и Rackspace объявил о выпуске новой серверной платформы Zaius на базе чипов POWER9. О планах по созданию таких серверов в рамках инициативы Open Compute Project было объявлено ещё весной этого года, а теперь мы имеем дело с реальным глубоко проработанным проектом. Над созданием системы Zaius P9 Server активно работали Google, Rackspace, IBM и Ingrasys, учтены были все возможные пожелания сообщества OCP. В итоге система вышла уникальной. Она поддерживает OpenCAPI 2.0, NVLink 2.0 и четвёртое поколение шины PCI Express; в отличие от предыдущих наработок в рамках OCP в ней используются новейшие процессоры POWER9.

Напомним, что POWER8 имеют внешний кеш L4, объединённый с контроллерами памяти, но в POWER9 эти компоненты переехали в состав процессора. Каждый из двух чипов POWER9 имеет 8 каналов DDR4 с пропускной способностью до 2400 МТ/с и два канала NVLink/OpenCAPI. Это позволяет установить до четырёх ускорителей Tesla и при этом не упереться в нехватку пропускной способности подсистемы памяти. Всего на системной плате сервера имеется 32 слота DDR4 DIMM. Поддержка PCI Express 4.0 будет использована для высокоскоростных навесных сетевых адаптеров формата OCP 2.0. Zaius P9 относится к классу NUMA-систем, процессоры в нём используют собственные контроллеры памяти и общаются между собой посредством двухканальной шины X Bus. На приведённой блок-схеме её пропускная способность не указана, но она наверняка достаточно высока: у IBM, как разработчика серии POWER, огромный опыт в создании мощных серверных систем и мейнфреймов. Из документации IBM понятно, что речь идёт о скоростях порядка 38,4 Гбайт/с × 2.

Примерная компоновка системной платы Zaius P9

Примерная компоновка системной платы Zaius P9

Новые процессоры используют набор инструкций Power ISA 3.0, выпускаются с использованием 14-нм техпроцесса GlobalFoundries и могут иметь о 12 до 24 ядер. Прочие характеристики тоже впечатляют: так, объём кеша L3 на чип может достигать 120 Мбайт, а тактовые частоты — отметки 4 ГГц. По всей видимости, в Zaius P9 установлены чипы версии SO, специально предназначенные для двухсокетных систем. Любопытно, что новые серверы предназначены для работы с основным напряжением питания 48 вольт, поддерживается стандарт 48V-POL. В качестве BIOS или, точнее, BMC (на схеме это ПО предназначено для управляющего процессора AST 25X0), используется полностью открытая разработка Open BMC. Google планирует выдвинуть дизайн Zaius P9 на рассмотрение сообщества OCP Foundation и надеется, что он будет принят, а внедрение нового высоковольтного стандарта питания серверов продолжится. Компания надеется, что новые гетерогенные вычислительные системы открытого стандарта ждёт большое будущее в её собственных облачных проектах.

Постоянный URL: http://servernews.ru/941143