Материалы по тегу: turing

04.05.2019 [11:00], Андрей Созинов

NVIDIA готовит мобильное семейство профессиональных видеокарт Quadro на базе Turing

Компания NVIDIA готовит мобильную серию профессиональных видеокарт Quadro на базе графических процессоров Turing. Новинки упоминаются во внутренней документации компании Dell, которая «утекла» в Сеть стараниями ресурса Tweakers, который не так давно раскрыл информацию о будущем процессоров Intel.

К сожалению, конкретные модели видеокарт, компания Dell в своих документах не уточняет, а лишь указывает уровень ускорителя. Так, наиболее продвинутые комплектации ноутбуков Precision 7540 и Precision 7740 получат некие видеокарты Quadro RTX с наиболее высоким уровнем производительности. Причём, это могут быть две разные модели, относящиеся к верхнему сегменту.

На такое предположение наталкивают альтернативные GPU для этих ноутбуков. Так, более крупный 17-дюймовый Precision 7740 будет также предлагаться с мобильной версией Radeon Pro WX 7100, которая является аналогом Radeon RX 580. В свою очередь 15-дюймовый Precision 7540 сможет предложить Radeon Pro WX4150 — аналог Radeon RX 460. Соответственно, в первом случае может быть использован ускоритель Quadro RTX на базе более мощного Turing TU104, а во втором — на Turing TU106.

Ещё одним ноутбуком с некой новой Quadro станет Precision 5540. Тут также не уточняется модель видеокарты, а лишь указано что это будет некая «новая Quadro среднего уровня». Отсутствие в названии «RTX» может указывать на то, что эта видеокарта будет построена на Turing TU116 и не сможет предложить аппаратное ускорение трассировки лучей. Тем не менее, она также должна обеспечить весьма неплохой уровень производительности.

Напомним, что младшей настольной Quadro RTX на данный момент является модель Quadro RTX 4000 на базе графического процессора TU104 с 2304 ядрами CUDA и 8 Гбайт памяти GDDR6. Следом за ней идёт уже Quadro RTX 5000 на базе Turing TU102. Поэтому, скорее всего, в мобильном сегменте флагманом станет как раз Quadro RTX 4000, а не более старшая модель, так как графический процессор TU102 может быть слишком мощным даже для мобильных рабочих станций. А вот менее производительные профессиональные видеокарты в мобильном сегменте явно появятся.

Постоянный URL: http://servernews.ru/986932
01.10.2018 [23:30], Иван Грудцын

NVIDIA открыла возможность предзаказа ускорителя Quadro RTX 6000

Новое поколение видеокарт NVIDIA Turing приковывает к себе всеобщее внимание, пока AMD лишь планирует выпустить широкий ассортимент 7-нм решений. Сегодня ускорители GeForce RTX 20 покоряют крупнейшие рынки, прощупывая почву для выпуска менее дорогих и потенциально более продаваемых моделей. Параллельно NVIDIA налаживает каналы поставок родственных GeForce RTX 2080/2080 Ti профессиональных адаптеров Quadro RTX с индексами 5000, 6000 и 8000.

Первенцем в рамках новой серии Quadro, судя по всему, станет ускоритель RTX 6000. На сайте nvidia.com уже указана его стоимость по предзаказу — 6300 долларов США. При оформлении заявки стоит учитывать, во-первых, географические ограничения для осуществления доставки (предложение актуально для США, Пуэрто-Рико, Виргинских островов и Канады), во-вторых, длительный срок выполнения заказа (несколько недель) и, в-третьих, количественное ограничение в пять устройств на одного клиента.

Преемник карты Quadro P6000 в соответствующем ценовом сегменте превосходит её по крайней мере на треть по «чистой» производительности (16,3 Тфлопс против 12 Тфлопс для FP32-вычислений). Ускоритель RTX 6000 оперирует 4608 потоковыми процессорами Turing, 384-битной шиной памяти и тем же объёмом буферной памяти в 24 Гбайт, что и P6000, но с более высокой пропускной способностью — за счёт перехода с GDDR5X на GDDR6. На панели видеовыходов, наряду с привычными разъёмами DisplayPort 1.4, прописался единичный USB 3.1 Type-C/VirtualLink (вместо DVI-D).

Quadro RTX 6000

Quadro RTX 6000

Найдётся, однако, немало желающих подождать релиза флагманской карты NVIDIA для создателей цифрового контента — Quadro RTX 8000 стоимостью $10 000. Она основана на том же графическом процессоре, что и RTX 6000 (TU102GL), но при этом располагает вдвое бóльшим объёмом памяти GDDR6 в 48 Гбайт и тактуется на повышенных частотах ядра и памяти. Система охлаждения ускорителя должна быть достаточно продвинутой для отвода более 300 Вт тепла, поскольку даже младшее решение RTX 6000 потребляет 295 Вт в пике нагрузки.

Официальная страница третьего дебютанта — Quadro RTX 5000 — пока не содержит информации о его стоимости. Ранее NVIDIA обещала установить ценник на RTX 5000 в $2300, и, скорее всего, так оно и будет. Устройство представляет собой сочетание 3072 потоковых процессоров Turing, 256-битной шины памяти и чипов GDDR6 общим объёмом 16 Гбайт. В RTX 5000 легко узнать аналог игровой видеокарты GeForce RTX 2080, в арсенале которой значится вдвое меньше памяти и меньшее количество шейдерных блоков — 2944 шт.

Quadro RTX 5000

Quadro RTX 5000

По «чистой» производительности Quadro RTX 5000 опережает Quadro P5000 на скромные 26 % (11,2 Тфлопс против 8,9 Тфлопс), но зато лучше подходит для рендеринга сцен с применением технологий трассировки лучей.

Постоянный URL: http://servernews.ru/976189
14.09.2018 [00:00], Константин Ходаковский

NVIDIA представила Tesla T4 — самый быстрый ИИ-ускоритель для ЦОД

NVIDIA вслед за профессиональной графикой Quadro RTX и игровыми ускорителями GeForce RTX представила на GTC 2018 в Японии новое семейство GPU для машинного обучения и анализа информации в центрах обработки данных. Новые решения Tesla T4 («T» в названии означает новую архитектуру Turing) являются преемниками текущего семейства GPU P4, которые сейчас предлагают практически все крупные поставщики облачных вычислений. По словам NVIDIA, Google будет в числе первых компаний, которые задействуют в своей облачной платформе ускорители T4.

NVIDIA утверждает, что T4 значительно быстрее, чем P4. Например, в задачах принятия решений, связанных с лингвистикой, T4 в 34 раза быстрее, чем CPU и более чем в 3,5 раза быстрее, чем P4. Пиковая производительность T4 составляет 260 TOPS для 4-битных целочисленных операций INT4, 130 TOPS — для INT8 и 65  терафлопс для смешанных тензорных операций FP16. При обычных расчётах с плавающей запятой FP32 обещана пиковая производительность в 8,1 терафлопс.

Низкопрофильная карта T4 предназначена для установки в стандартный 75-Вт слот PCI Express. Это означает, что для установки в 1U, 4U или иные стандартные серверные стойки не требуется думать о внешнем источнике питания: достаточно возможностей слота PCIe. А низкопрофильная конструкция обеспечивает широкую совместимость с самыми разными серверами.

Но главное, что NVIDIA разработала эти чипы специально для процессов логического умозаключения в искусственном интеллекте. «Столь эффективным графическим процессором для задач принятия решений Tesla T4 делают новые тензорные ядра архитектуры Turing, — подчеркнул вице-президент и руководитель по бизнесу ЦОД в NVIDIA Tesla Ян Бак (Ian Buck). — Исполнительный директор Дженсен Хуанг (Jensen Huang) уже говорил о тензорных ядрах и о том, что они могут предложить в играх, задачах рендеринга и в области ИИ, но они прежде всего предназначены для наибольшей эффективности в процессах логического умозаключения». Сообщается, что ускоритель включает 320 тензорных ядер и 2560 ядер CUDA Turing.

Поскольку объем онлайн-видео продолжает расти экспоненциально, спрос на решения для эффективного поиска и извлечения информации из видео также увеличивается. Tesla T4 обеспечивает высокую производительность и для задач, связанных с ИИ-анализом видео. А отдельные блоки перекодировки видеопотока обеспечивают двукратный рост производительности декодирования по сравнению с GPU предыдущего поколения. T4 может декодировать до 38 потоков видео 1080p, что позволяет легко интегрировать масштабируемое глубинное обучение в видеопрограммы для создания новых интеллектуальных услуг.

В дополнение к собственно Tesla T4 компания также представила обновление своего программного обеспечения TensorRT 5 для оптимизации моделей глубинного обучения. Эта новая версия также включает в себя сервер принятия решений TensorRT, полностью контейнерный микросервис для процессов логического умозаключения в центрах обработки данных, который легко подключается к существующей инфраструктуре Kubernetes.

Постоянный URL: http://servernews.ru/975330
Система Orphus