Материалы по тегу: nvidia

18.06.2019 [19:36], Константин Ходаковский

NVIDIA DGX SuperPOD: суперкомпьютер для автопилота за три недели

NVIDIA активно вкладывается в сферу автономных автомобилей. Буквально недавно она объединила усилия с AB Volvo в разработке ИИ-платформы для автономных грузовиков. А теперь компания представила 22-й по производительности в мире (если ориентироваться на публичный рейтинг Top 500) суперкомпьютер — DGX SuperPOD. Задача этой системы — предоставить инфраструктуру ИИ, которая отвечает огромным требованиям программы развёртывания автономных транспортных средств.

Система была построена всего за три недели на основе 96 суперкомпьютеров NVIDIA DGX-2H с использованием интерконнекта Mellanox. Суперкомпьютер в состоянии обеспечить 9,4 петафлопс вычислительной производительности и рассчитан на глубинное обучение массы нейронных сетей, необходимых для создания безопасного самоходного транспорта. 

Заказчики могут самостоятельно построить такой же суперкомпьютер, заказав аналогичные конфигурации DGX-2 у партнёров NVIDIA. DGX SuperPOD оснащён 1536 тензорными ускорителями NVIDIA Tesla V100, объединённых NVIDIA NVSwitch и интерконнектом Mellanox InfiniBand. 

Компания поясняет, что обучение автономного автомобиля — это сложнейшая задача, требующая больших вычислительных ресурсов. Одна машина, собирающая данные, генерирует 1 терабайт информации в час. Если умножить это на годы вождения всего автопарка, то речь идёт о петабайтах данных. Они используются для обучения авто правилам дорожного движения, а также для выявления потенциальных сбоев в нейронных сетях, работающих в автономных машинах, которые затем повторно обучаются в непрерывном цикле — суперкомпьютер трудится над этими задачами круглосуточно. 

«Лидерство в области требует первенства и в вычислительной инфраструктуре, — подчеркнул вице-президент по инфраструктуре ИИ в NVIDIA Клемент Фарабет (Clement Farabet). — Мало направлений ИИ столь же требовательны к ресурсам, как обучение автономных автомобилей — эта задача требует десятки тысяч раз переобучать нейронные сети, чтобы удовлетворить требованиям максимальной точности и надёжности. И здесь ничто не заменит такие ​​мощные вычислительные ресурсы, какие имеются у DGX SuperPOD».

Например, программно-аппаратная платформа DGX SuperPOD способна обучить модель ResNet-50 менее чем за две минуты. Когда эта модель появилась в 2015 году, потребовалось 25 дней, чтобы обучить её на системе с единственной картой NVIDIA K80. DGX SuperPOD работает в 18 000 раз быстрее. В то время как другие системы из списка Top 500 с сопоставимым уровнем производительности используют тысячи серверов, DGX SuperPOD занимает малое пространство — примерно в 400 раз меньше, чем его ближайшие соперники.

Постоянный URL: http://servernews.ru/989395
17.06.2019 [19:51], Андрей Созинов

NVIDIA обеспечит ARM-системам поддержку ускорения вычислений с CUDA

Компания NVIDIA объявила о том, что теперь её продукты в полной мере поддерживают работу с центральными процессорами на архитектуре ARM. В первую очередь это должно позволить производителям создавать ещё более экономичные суперкомпьютеры для вычислений экзафлопсного уровня с поддержкой алгоритмов искусственного интеллекта.

Уже к концу текущего года создатели систем на базе ARM получат доступ ко всему программному обеспечению NVIDIA для искусственного интеллекта (ИИ) и высокопроизводительных вычислений (High performance computing, HPC). По словам компании, это ПО способно ускорить свыше 600 HPC-приложений и все AI-фреймворки. Сюда входят все библиотеки NVIDIA CUDA-X AI и HPC, GPU-ускоренные AI-фреймворки и инструменты программной разработки, такие, как PGI-компиляторы с поддержкой OpenACC и профилировщики.

Как известно, опыт работы с ARM у компании NVIDIA уже был. Ещё относительно недавно она активно трудилась над созданием собственных ARM-процессоров, которые сочетались бы с её собственными графическими ускорителями и использовались в мобильных устройствах, роботах и роботизированных автомобилях. Вместе с тем NVIDIA разрабатывала не только аппаратную часть, но и программную, и в итоге теперь эти наработки смогут использовать и сторонние производители.

Заметим, что уже сейчас NVIDIA обеспечила поддержку ускорения HPC и ИИ на архитектурах x86 и POWER, а после завершения процесса оптимизации к ним присоединится ARM. Получается, NVIDIA в скором времени сможет предложить ускорение вычислений для всех наиболее распространённых архитектур CPU.

«Суперкомпьютеры являются необходимым инструментом для совершения научных открытий. Переход на экзафлопсный уровень вычислений значительно расширит горизонты человеческого познания, — говорит Дженсен Хуанг (Jensen Huang), основатель и генеральный директор NVIDIA. — Масштабирование традиционных вычислений подходит к своему пределу из-за ограничений, накладываемых энергопотреблением суперкомпьютеров. Сочетание CUDA-ускоренных вычислений и энергоэффективной архитектуры ARM позволит HPC-сообществу перейти на экзафлопсный уровень».

«ARM работает со своей экосистемой, чтобы наделить платформы на базе ARM высочайшей производительностью и возможностями экзафлопсного уровня, — говорит Саймон Сигарс (Simon Segars), генеральный директор ARM. — Партнёрство с NVIDIA для обеспечения CUDA-ускорения архитектуре ARM является очень важным событием для HPC-сообщества, которое уже применяет технологии ARM для решения самых сложных в мире научных задач».

Согласно представленному сегодня обновлённому рейтингу Green500, ускорители на графических процессорах NVIDIA лежат в основе 22 из 25 самых энергоэффективных суперкомпьютеров мира. Высокой эффективности способствует то, что в данных системах тяжёлые вычислительные нагрузки выполняются на более энергоэффективных GPU с ядрами CUDA. Ещё отмечается сотрудничество NVIDIA с Mellanox по оптимизации вычислений в супервычислительных кластерах, а также использование SXM 3D-компоновки и высокоскоростного интерфейса NVIDIA NVLink, что позволяет создавать узлы с высокой плотностью и масштабируемостью. А теперь с поддержкой ARM могут появиться ещё более эффективные системы. 

Идеальным вариантом для NVIDIA было бы наличие в портфолио собственного процессора, что позволило бы создать единую платформу и экосистему без явной зависимости от других производителей. Причём такой процессор вовсе не обязан быть очень мощным. Гораздо важнее масштабируемость GPU-платформ, и покупка Mellanox вполне может оказаться первым шагом в этом направлении. 

Постоянный URL: http://servernews.ru/989326
06.06.2019 [11:31], Сергей Карасёв

Сбербанк и NVIDIA займутся технологиями искусственного интеллекта

Компании SberCloud, облачный провайдер Сбербанка, и NVIDIA объявили о подписании соглашения о сотрудничестве в рамках Петербургского международного экономического форума 2019 года.

Стороны займутся разработкой и внедрением на российском рынке продуктов и услуг на основе искусственного интеллекта (ИИ). Соответствующее направление в настоящее время считается одним из самых перспективных на глобальном IT-рынке.

В рамках сотрудничества компания SberCloud создает AI Cloud — продукт, построенный на системах NVIDIA DGX-2, высокопроизводительных вычислительных комплексах, созданных специально для решения задач искусственного интеллекта.

Ожидается, что партнёрство SberCloud и NVIDIA позволит сделать услугу Data Science As a Service доступной как для крупнейших российских корпораций, так и для предприятий малого и среднего бизнеса, а также научных и образовательных учреждений.

Пользователи AI Cloud с помощью единого портала управления смогут работать со всеми ключевыми направлениями искусственного интеллекта: анализ и синтез речи, компьютерное зрение, распознавание символов и текстов, система поддержки принятия решений, автоматическое обучение компьютерных систем. 

Постоянный URL: http://servernews.ru/988733
20.05.2019 [00:04], Алексей Разин

AMD наблюдает подъём на серверном рынке, в отличие от конкурентов

К середине мая о результатах квартала отчитались не только Intel и AMD, но и NVIDIA, у которой дела в сегменте центров обработки данных шли не так хорошо, как хотелось бы. Фактически, выручка компании на этом направлении снизилась на 7 % в последовательном сравнении и на 10 % в годовом. Руководство NVIDIA на квартальном отчётном мероприятии много говорило о блестящих перспективах компонентов марки в серверных системах всех категорий, об открываемых покупкой Mellanox новых перспективах, но все они были отдалены от суровой реальности, в которой компания столкнулась со снижением выручки. В текущем квартале ситуация вряд ли изменится к лучшему, как резюмировали представители NVIDIA. Некоторые надежды на улучшение связываются только со вторым полугодием.

Не смогла порадовать акционеров и инвесторов и компания Intel, у которой выручка в сегменте компонентов для центров обработки данных сократилась в годовом сравнении на 6 %, и не смогла достичь прогнозируемых отраслевыми экспертами значений. Всё это не очень обрадовало инвесторов, которые уже привыкли слышать от Intel призывы к скорейшему смещению приоритетов от персональных компьютеров к сегментам рынка, в той или иной степени связанных с обработкой и передачей информации.

На этом фоне динамика показателей AMD в серверном сегменте выглядела оптимистично. Выручка от реализации центральных и графических процессоров для серверного применения за год увеличилась более чем в два раза. В совокупности с ростом популярности настольных процессоров семейства Ryzen, это обеспечило рост нормы прибыли на пять процентных пунктов. Прошлый год AMD завершила с долей серверного рынка, близкой к пяти или шести процентам, и через полтора–два года может преодолеть десятипроцентный рубеж.

Всё это заставляет автора публикации на страницах сайта The Motley Fool предполагать, что в серверном сегменте показатели AMD укрепляются, тогда как Intel и NVIDIA свои позиции теряют. Подспорьем для экспансии AMD станет выход в третьем квартале этого года 7-нм процессоров EPYC поколения Rome. Глава компании Лиза Су (Lisa Su) на годовом собрании акционеров подчеркнула, что успеху AMD будут способствовать не только 7-нм техпроцесс и передовые архитектурные решения, но и использование многокристальной компоновки с так называемыми «чиплетами». Компания готова выходить на большие рынки и постепенно увеличивать свою долю на них.

Проблема заключается в том, что бизнес AMD по сравнению конкурентами не так велик, и бороться с ними ей приходится, довольствуясь гораздо меньшими материальными ресурсами. Даже если перед AMD откроются какие-то уникальные возможности, к резкому рывку она должна быть готова как с точки зрения возможности увеличить объёмы поставок продуктов, так и с точки зрения способности их эффективно продавать. Серверный рынок достаточно инертен и консервативен, здесь для растущего с низких позиций игрока может возникнуть достаточно сопротивления и от самих клиентов компании AMD, а не только её конкурентов.

Постоянный URL: http://servernews.ru/987705
04.05.2019 [11:00], Андрей Созинов

NVIDIA готовит мобильное семейство профессиональных видеокарт Quadro на базе Turing

Компания NVIDIA готовит мобильную серию профессиональных видеокарт Quadro на базе графических процессоров Turing. Новинки упоминаются во внутренней документации компании Dell, которая «утекла» в Сеть стараниями ресурса Tweakers, который не так давно раскрыл информацию о будущем процессоров Intel.

К сожалению, конкретные модели видеокарт, компания Dell в своих документах не уточняет, а лишь указывает уровень ускорителя. Так, наиболее продвинутые комплектации ноутбуков Precision 7540 и Precision 7740 получат некие видеокарты Quadro RTX с наиболее высоким уровнем производительности. Причём, это могут быть две разные модели, относящиеся к верхнему сегменту.

На такое предположение наталкивают альтернативные GPU для этих ноутбуков. Так, более крупный 17-дюймовый Precision 7740 будет также предлагаться с мобильной версией Radeon Pro WX 7100, которая является аналогом Radeon RX 580. В свою очередь 15-дюймовый Precision 7540 сможет предложить Radeon Pro WX4150 — аналог Radeon RX 460. Соответственно, в первом случае может быть использован ускоритель Quadro RTX на базе более мощного Turing TU104, а во втором — на Turing TU106.

Ещё одним ноутбуком с некой новой Quadro станет Precision 5540. Тут также не уточняется модель видеокарты, а лишь указано что это будет некая «новая Quadro среднего уровня». Отсутствие в названии «RTX» может указывать на то, что эта видеокарта будет построена на Turing TU116 и не сможет предложить аппаратное ускорение трассировки лучей. Тем не менее, она также должна обеспечить весьма неплохой уровень производительности.

Напомним, что младшей настольной Quadro RTX на данный момент является модель Quadro RTX 4000 на базе графического процессора TU104 с 2304 ядрами CUDA и 8 Гбайт памяти GDDR6. Следом за ней идёт уже Quadro RTX 5000 на базе Turing TU102. Поэтому, скорее всего, в мобильном сегменте флагманом станет как раз Quadro RTX 4000, а не более старшая модель, так как графический процессор TU102 может быть слишком мощным даже для мобильных рабочих станций. А вот менее производительные профессиональные видеокарты в мобильном сегменте явно появятся.

Постоянный URL: http://servernews.ru/986932
12.04.2019 [18:08], Сергей Тверье

Fortran-компилятор NVIDIA F18 принят в LLVM

Fortran — один из первых языков высокого уровня, но он до сих пор активно используется в высокопроизводительных вычислениях наряду с C++ и Python. Инженеры NVIDIA уже продолжительное время работают над компилятором языка Fortran с открытым исходным кодом — Flang, созданным поверх инфраструктуры LLVM и вдохновленным компилятором Clang C/C++.

Компилятор Fortran F18 — переписанный инженерами NVIDIA на С++ Flang, теперь проект будет развиваться в составе инфраструктуры LLVM

Компилятор Fortran F18 — переписанный инженерами NVIDIA на С++ Flang, теперь проект будет развиваться в составе инфраструктуры LLVM

Не так давно разработчики из NVIDIA приступили к переписыванию проекта с языка C на C++, новый проект получил название F18. F18 поддерживает большую часть возможностей Flang, полностью реализует версию языка Fortran 2018, а также поддерживает OpenMP 4.5 для параллельного программирования.

NVIDIA изначально хотела, чтобы новый компилятор стал частью проекта LLVM и развивался на базе его инфраструктуры, но принятие этого решения затянулось на длительный срок, и судьба F18 оставалась неопределённой. И вот на днях в рассылке проекта LLVM, один из его основателей и ведущих разработчиков Крис Латтнер, сообщил, что разработчики приняли решение принять новый компилятор в свою «‎семью»‎.

NVIDIA давно использует LLVM и в частности Fortran в рамках архитектуры CUDA

NVIDIA давно использует LLVM и в частности Fortran в рамках архитектуры CUDA

«Наше сообщество обсудило вопрос о том, следует ли принимать компилятор и среду выполнения Fortran F18 в состав LLVM, обсуждение прошло на EuroLLVM'19, на котором совет директоров LLVM Foundation одобрил его включение в наш проект», — сообщил Крис.

Команде разработчиков F18 было рекомендовано рассмотреть возможность избавления от функций, завязанных на стандарт C++17, чтобы F18 мог быть быстрее и полнее интегрирован в инфраструктуру LLVM. Тем не менее, это вопрос будущего, так как сейчас F18 только начал своё развитие.

Постоянный URL: http://servernews.ru/985782
09.04.2019 [20:31], Андрей Крупин

REG.RU предложил почасовую оплату облачных вычислений на базе NVIDIA GPU

Регистратор и хостинг-провайдер REG.RU сообщил пересмотре тарифной сетки на услуги сервиса высокопроизводительных GPU-вычислений, предназначенного для решения задач, связанных с искусственным интеллектом, машинным обучением и анализом больших массивов данных. Теперь пользователям стала доступа почасовая оплата облачных вычислений. Ранее заказать услугу можно было только в формате посуточной или помесячной оплаты.

В основу предлагаемого компанией REG.RU сервиса положены GPU-ускорители Tesla V100 с архитектурой NVIDIA Volta, производительность которых в задачах глубокого обучения может достигать 125 терафлопс. Исходя из потребностей пользователя, в рамках услуги можно подключить до 8 вычислительных ускорителей к одному виртуальному контейнеру либо арендовать физический сервер целиком. Через панель управления клиент может самостоятельно разворачивать и удалять серверы, выбирать преднастроенные шаблоны виртуального окружения с Ubuntu или Windows и производить базовые действия с сервисом.

Для максимальной производительности и удобства работы при обучении нейросетей облако REG.RU сделано совместимым с контейнерами NVIDIA GPU Cloud (NGC) — это экономит время пользователя на разворачивании и последующей работе с ПО. Репозиторий NGC обеспечивает свободный доступ к каталогу GPU-ускоренных контейнеров, который включает ведущие фреймворки и оптимизированное NVIDIA программное обеспечение для глубокого обучения, инструменты для HPC-визуализации и сторонние HPC-приложения.

Получить доступ к системе облачных вычислений REG.RU на базе NVIDIA GPU можно по ссылке reg.ru/cloud-services/cloud_gpu. На время бета-тестирования, до 1 июня 2019 года, минимальная стоимость пользования сервисом составляет 90 рублей за час работы.

Материалы по теме:

Источник:

Постоянный URL: http://servernews.ru/985596
09.04.2019 [11:35], Андрей Созинов

NVIDIA RC 18: прототип процессора для глубокого обучения из 36 отдельных кристаллов

Компания NVIDIA работает над созданием нового решения, предназначенного для работы с искусственным интеллектом, которое называется RC 18. Ключевой особенностью данного чипа является то, что он будет представлять собой «склейку» из нескольких кристаллов, то есть станет мультичиповым решением.

Инженеры NVIDIA Research создали прототип процессора, который состоит сразу из 36 модулей. Несмотря на столь большое количество кристаллов, площадь чипа довольно небольшая. Всё дело в том, что кристаллы весьма компактные, хоть и производятся по не самому «тонкому» 16-нм техпроцессу компанией TSMC. Напомним, что по таким же нормам производятся графические процессоры Pascal.

Каждый из 36 модулей состоит из 16 процессорных элементов (Processing Elements, PE), являющихся базовыми процессорными ядрами с архитектурой RISC-V Rocket. Кроме того, у модуля есть буфер памяти и восемь каналов GRS (Ground-Referenced Signaling) для операций ввода/вывода с общей пропускной способностью в 100 Гбайт/с, что весьма немало.

На данный момент RC 18 является скорее экспериментальной разработкой, нежели прототипом некоего готовящегося продукта. Этот многочиповый модуль (Multi-chip module, MCM) предназначен для ускорения глубокого обучения искусственного интеллекта и его главной особенностью является высокий уровень масштабируемости. То есть изменять производительность такого MCM-модуля куда проще, чем чипа с монолитным кристаллом, ведь можно просто добавлять или убирать кристаллы с процессорными элементами.

Чип RC 18 создан для ускорения процесса глубокого обучения, что само по себе не очень интересно для рядовых пользователей. Тем не менее, многие из технологий, которые делают возможным создание и работу данного многочипового модуля, могут найти применение в будущих графических процессорах NVIDIA. Компания ранее уже заявляла о том, что рассматривает варианты создания GPU из нескольких кристаллов. И RC 18 является одним из шагов на пути к этому.

«Этот чип (RC 18 — прим. ред.) обладает таким преимуществом, как способность продемонстрировать сразу множество технологий, — отмечает Билл Дэлли (Bill Dally), глава NVIDIA Research. — Одной из технологий является масштабируемая архитектура для глубокого обучения. Другой является очень эффективная технология интерконнекта на органической основе».

Некоторые из технологий, применённых в RC 18, однажды могут стать ключевыми при создании больших высокопроизводительных графических процессоров из нескольких кристаллов. Например, это может быть ячеистая топология, передача сигналов с малой задержкой с помощью GRS, объектно-ориентированный высокоуровневый синтез (Object-Oriented High-Level Synthesis, OOHLS) и технология GALS (Globally Asynchronous Locally Synchronous).

Заметим, что NVIDIA является не первой компанией, которая планирует создание графического процессора из нескольких кристаллов. Некоторое время назад компания AMD также говорила о том, что её шина Infinity Fabric, используемая в центральных процессорах, может найти применение в области GPU. Однако создание таких графических процессоров сопряжено с рядом трудностей, одна из которых заключается в том, чтобы заставить программное обеспечение воспринимать «склейку» как единый GPU. Иначе получится связка SLI или CrossFire, что для потребительских видеокарт означает не самую высокую эффективность. Но когда-то многочиповые модули могут стать вполне обычным явлением для настольных видеокарт.

Постоянный URL: http://servernews.ru/985537
03.04.2019 [12:10], Сергей Карасёв

SAS и NVIDIA займутся технологиями машинного обучения и компьютерного зрения

Компания SAS объявила о заключении соглашения о сотрудничестве с NVIDIA, предусматривающего развитие технологий искусственного интеллекта (ИИ).

В частности, стороны займутся совместными разработками в сфере машинного обучения, компьютерного зрения и обработки естественного языка.

«Графические процессоры и библиотеки CUDA-X AI от NVIDIA усилят решения на основе искусственного интеллекта от SAS, что позволит повысить скорость обработки данных и сделать их анализ ещё более точным», — отмечается в сообщении партнёров.

В настоящее время системы искусственного интеллекта являются одним из наиболее перспективных направлений развития рынка информационных технологий. Такие платформы востребованы в самых разных сферах — в здравоохранении и фармацевтике, в промышленности, финансах и пр.

Компании, работающие в указанных областях, благодаря сотрудничеству SAS и NVIDIA получат ряд новых преимуществ. Например, медицинские специалисты смогут использовать технологию распознавания объектов, чтобы отличить доброкачественные опухоли от злокачественных. Промышленным предприятиям компьютерное зрение поможет увидеть скрытый брак прямо на конвейере, а финансовые организации сэкономят миллиарды долларов благодаря своевременному обнаружению мошеннических операций.

Новые технологии позволят решать задачи по классификации и распознаванию изображений, обнаружению объектов, перевода речи в текст, определению эмоций и др. Всё это будет способствовать развитию рынка Интернета вещей. 

Постоянный URL: http://servernews.ru/985215
19.03.2019 [11:02], Сергей Карасёв

NVIDIA Jetson Nano: платформа для разработчиков по цене $99

Компания NVIDIA анонсировала комплект для разработчиков Jetson Nano: платформа подходит для реализации различных проектов в сфере робототехники, Интернета вещей и пр.

Комплект включает вычислительный модуль и сопутствующую интерфейсную плату. «Сердцем» служит процессор с четырьмя вычислительными ядрами ARM Cortex-A57, функционирующими на тактовой частоте до 1,43 ГГц. Предусмотрен графический ускоритель с архитектурой NVIDIA Maxwell.

Объём оперативной памяти LPDDR4 составляет 4 Гбайт. Для хранения данных может быть задействована флеш-карта формата microSD.

Среди доступных интерфейсов упомянуты GPIO, I2C, I2S, SPI, UART. Сопутствующая плата позволяет использовать такие разъёмы, как USB 3.0 (×4), HDMI 2.0 и DisplayPort 1.4, Gigabit Ethernet, Micro-USB.

Изделие оборудовано пассивной системой охлаждения на основе радиатора. Более подробная информация о новинке доступна здесь.

Приобрести комплект NVIDIA Jetson Nano можно по ориентировочной цене от 99 долларов США. 

Постоянный URL: http://servernews.ru/984429
Система Orphus