Материалы по тегу: графические процессоры

02.06.2017 [12:30], Алексей Степин

AMD анонсировала новые профессиональные карты начального уровня

После долгого затишья компания AMD проявляет серьёзную активность во всех сферах: она успешно вывела на рынок доступные многоядерные процессоры потребительского класса, готовится вторгнуться на рынок HEDT-платформ и вернуть себе место под солнцем в сфере серверных решений. Существенные успехи есть и у графического подразделения, бывшей ATI Technologies, хотя дебют проекта Vega ещё впереди. Продвигаются дела у AMD и на рынке профессиональной графики, причём, не только в секторе дорогих и мощных решений. Совсем недавно было объявлено о выпуске новых моделей Radeon Pro начального уровня.

Новинки получили имена Radeon Pro WX 2100 и Radeon Pro WX 3100. В их основу лёг 14-нм графический процессор Polaris, судя по конфигурации это Polaris 12 — количество активных потоковых процессоров равно 512. У Polaris 11 их 1024 и пускать такие чипы на производство новой серии в столь усечённом виде было бы невыгодно. Пиковая производительность для обеих карт заявлена на уровне 1,25 терафплос на вычислениях одинарной точности (FP32). Главным отличием между двумя новыми моделями является объём видеопамяти: 2 Гбайт GDDR5 с 64-битным интерфейсом у WX 2100 и 4 Гбайт GDDR5 со 128-битным интерфейсом у WX 3100.

Судя по результатам тестов, опубликованным AMD, новинки более чем успешно конкурируют с аналогичным им по классу решениями NVIDIA. Для младшей модели это Quadro P400, для более мощной WX 3100 — Quadro P600. В некоторых случаях выигрыш достигает полуторакратных и более значений. Карты отлично вписываются в конфигурацию компактной рабочей станции, поскольку выполнены низкопрофильными. Любопытно, что они используют шину PCI Express x8, хотя механически разъём выполнен в соответствии с габаритами слота x16. Каждая из новинок оснащена тремя разъёмами DisplayPort: одним классическим и двумя mini-DP. Гарантируется поддержка режимов HBR/HDR, возможно одновременное использование трёх мониторов формата 4К с частотой обновления 60 Гц или одного дисплея формата 5К с частотой 30 Гц.

Постоянный URL: http://servernews.ru/953251
12.05.2017 [14:59], Алексей Степин

Анонсированы новые платформы NVIDIA для разработчиков

Вчера мы рассказывали читателям о прототипе первой многопользовательской рабочей станции виртуальной реальности, которую NVIDIA представила на конференции GTC 2017. Она оснащена четырьмя ускорителями Quadro P6000 и позволяет четырём пользователям работать одновременно в единой среде VR. Но компания анонсировала и другие новинки, например, серию вычислительных станций на базе новой технологии Volta. В серию входят модели DGX-1, DGX Station и HGX.

Рабочая станция с четырьмя новыми процессорами NVIDIA Volta

Рабочая станция с четырьмя новыми процессорами NVIDIA Volta

Первая модель представляет собой стоечное решение с восемью ускорителями Tesla V100, что обеспечивает производительность порядка 960 тензорных терафлопс. По мнению NVIDIA это заменяет 400 обычных серверов. Стоит такая система $149 тысяч, а заказчики получат её уже в третьем квартале. Модель DGX Station выглядит совсем иначе: это рабочая станция в настольном исполнении, она содержит четыре ускорителя Tesla V100. В ней установлены версии ускорителей с разъёмами PCIe и тремя портами DisplayPort. Друг с другом, однако, платы общаются посредством NVLink. Стоит такая станция $69 тысяч.

Серверные варианты

Серверные варианты

Наконец, была представлена платформа NVIDIA HGX-1. Её назначение —  облачные вычисления. Она изначально рассчитана на работу в составе единой инфраструктуры ЦОД, причём эта инфраструктура должна предусматривать наличие единого контура жидкостного охлаждения, к которому платформа и подключается. Характеристики и производительность у HGX-1 аналогичны таковым параметрам у DGX-1, и она содержит восемь ускорителей Tesla V100 в версии с интерфейсом NVLink. Стоимость не оглашена, но она должна быть выше стоимости DGX-1.

Постоянный URL: http://servernews.ru/952092
21.12.2016 [08:39], Алексей Степин

Производительность NVIDIA Volta GV100 может достигнуть 9,5 терафлопс

Как известно, следующим после Pascal поколением графических процессоров NVIDIA является Volta. Впрочем, к современным чипам название «графический процессор» применимо всё меньше — с тех пор, как их архитектура стала полностью унифицированной и программируемой, они прочно утвердились в различных проектах суперкомпьютеров, некоторые из которых уже вступили в строй и вовсю заняты научными и другими сложными вычислениями. Создавая свой первый чип Pascal GP100, NVIDIA уделила больше внимания его вычислительным возможностям, нежели графическим, и, похоже, первенца в семействе Volta, чип GV100, ожидает аналогичный подход.

Новый принцип построения узлов суперкомпьютера. Количество плат ускорителей не соответствует указанному в заметке

Новый принцип построения узлов суперкомпьютера. Количество плат ускорителей не соответствует указанному в заметке

Уже подтверждено, что GV100 станет сердцем, а точнее, сердцами суперкомпьютеров Summit в Национальной лаборатории Ок-Ридж (Oak Ridge National Laboratory) и Sierra в Ливерморской национальной лаборатории (Lawrence Livermore National Laboratory). Первый проект должен войти в рабочую стадию в начале 2018 года и развить пиковую мощность 200 петафлопс, что существенно превышает показатель самого быстрого сегодняшнего китайского суперкомпьютера Sunway TaihuLight, чьи возможности оцениваются в 125,4 петафлопса. К сожалению, о характеристиках и архитектуре GV100 мы до сих пор знаем не так много, как хотелось бы, но кое-какие сведения о проекте Summit позволяют сделать некоторые выводы.

Тот самый слайд

Тот самый слайд

Лаборатория в Ок-Ридже опубликовала слайд, на котором Summit сравнивается с суперкомпьютером Titan, базирующимся на чипах Kepler GK110. Состоит он из 18688 узлов, мощность каждого из них составляет 1,4 терафлопса. На том же плакате указаны спецификации Summit: 4600 узлов с мощностью более 40 терафлопс на узел. Указано также, что в каждом узле будет 512 Гбайт памяти DDR4, 800 Гбайт энергонезависимой памяти и некий объём памяти HBM (речь, разумеется, идёт о HBM2). Основой каждого узла станут пара процессоров IBM POWER9 и шесть процессоров NVIDIA Volta. Чипы POWER9, помимо традиционных линий PCI Express (версия 4.0) имеют и 48 линий интерфейса Bluelink, который будет работать в режиме NVLink 2.0 и соединять их с процессорами Volta, что позволит процессорам различных архитектур делить общее пространство памяти, практически не теряя в скорости: пропускная способность может составлять от 80 до 200 Гбайт/с.

Использование NVLink экономит энергию и повышает производительность

Использование NVLink экономит энергию и повышает производительность

Потребляемая Summit мощность составит 13 мегаватт — всего на 4 мегаватта больше, нежели у Titan, при более чем десятикратном превосходстве в производительности. Как мы знаем, NVIDIA объявила о том, что GV100 будет демонстрировать эффективность 72 гигафлопса на ватт при операции перемножения матриц с одинарной точностью (Single precision floating General Matrix Multiply). Для GP100 этот показатель равен 42 гигафлопса на ватт. Нетрудно посчитать, приняв за основу теплопакет GV100 на уровне 300 ватт, что этот чип в теории может достичь производительности 9,5 терафлопс на вычислениях двойной точности (FP64). Шесть чипов GV100 при потреблении не выше 300 ватт на чип как раз и дадут упомянутые на плакате «более 40 терафлопс», а точнее, в теории, смогут выдать 57,2 терафлопса. Даже при конфигурации с теплопакетом 200 ватт и на 20‒25 % более низкой производительности производительность узла составит 45,6 терафлопс, так что у создателей Summit явно есть задел по части экономии электроэнергии при сохранении заявленных характеристик. По крайней мере, такой подход может существенно облегчить работу холодильных установок Summit.

Постоянный URL: http://servernews.ru/944758
26.07.2016 [15:00], Константин Ходаковский

AMD представила серию профессиональных карт Radeon Pro WX

На мероприятии SIGGPARPH 2016 компания AMD представила серию профессиональных графических ускорителей Radeon Pro WX на базе архитектуры Polaris. AMD называет их максимально доступными решениями с поддержкой виртуальной реальности для рабочих станций. Все преимущества перекочевали из потребительских карт Radeon RX 480, 470 и 460, а также добавились специфичные для рабочих станций возможности.

Представлено три карты новой серии — все они будут доступны на рынке в последней четверти года:

  • флагманский ускоритель Radeon Pro WX 7100 при стоимости менее $1000 рассчитан на решение требовательных к ресурсам инженерно-проектировочных, мультимедийных и развлекательных задач, а также создание профессионального VR-контента;
  • Radeon Pro WX 5100 — карта попроще, рассчитанная на разработку различных продуктов, использующих графические вычисления;
  • Radeon Pro WX 4100 предоставляет хорошую производительность для CAD-приложений, выпускаясь при этом в уменьшенном вдвое по высоте формате, благодаря чему может быть установлена в компактные системы.

AMD Radeon Pro WX 7100 является по сути аналогом потребительского Radeon RX 470: устройство основано на чипе Polaris 10 с 32 активными вычислительными блоками (CU), включает 2048 потоковых процессоров, 128 текстурных блока и 32 блока растеризации. Производительность решения превышает 5 терафлопс в вычислениях FP32 с плавающей запятой. WX 7100 позиционируется в качестве замены Fire Pro W7100, но по производительности заметно обходит W8100 на базе Hawaii Pro (4,2 терафлопс) и соответствует W9100 на базе Hawaii XT (5,24 терафлопс).

Остальные характеристики включают 8 Гбайт видеопамяти GDDR5 с эффективной частотой 7 ГГц и 256-бит шиной (пропускная способность, таким образом, достигает 224 Гбайт/с). Карта требует внешнего питания через 6-контактный разъём, что указывает на потребление до 150 Вт. Четыре разъёма DisplayPort 1.3 позволяют подключать 4 монитора 5K (30 Гц). Интересной особенностью является то, что это однослотовое решение.

Radeon Pro WX 5100 — урезанная конфигурация на основе Polaris 10 с 28 активными CU и 1792 потоковыми процессорами. Карта также оснащается 8 Гбайт памяти GDDR5 с эффективной частотой 7 ГГц и 256-битным интерфейсом. Ускоритель базируется на короткой печатной плате, соответствующей Radeon R9 Nano и не требует внешнего питания, довольствуясь 75 Вт через слот PCIe. Вычислительная производительность решения превышает 4 терафлопс, присутствуют три выхода Display Port 1.3. Стоимость Radeon Pro W7100 и Radeon Pro W5100 будет ниже $1000, что является хорошим показателем для таких решений.

Последняя и самая простая карта, которую AMD представила на мероприятии, — Radeon Pro WX 4100 — основана на чипе Polaris 11 и, соответственно, является аналогом потребительской RX 460: включает 16 CU и 1024 потоковых процессора, 4 Гбайт видеопамяти GDDR5 и 128-битную шину (эффективная частота памяти предположительно тоже 7 ГГц, так что пропускная способность составляет 112 Гбайт/с). Ускоритель, как и оба предыдущих, является однослотовым, но вдобавок выполнен в низкопрофильном дизайне. Несмотря на это, он включает 4 разъёма Mini Display Port и может выводить изображение на 4 монитора 5K. Это решение будет стоить менее $500.

Все графические карты Radeon Pro WX созданы на основе компонентов высокого класса, рассчитаны на надёжную работу даже в экстремальных условиях и оптимизированы для работы с широким спектром профессиональных приложений. Продаются с 3-летней стандартной и 7-летней расширенной гарантией. Покупатели получают VIP-статус с поддержкой AMD в любое время суток со временем ожидания не более 5 минут.

Постоянный URL: http://servernews.ru/936759
21.04.2016 [12:12], Алексей Степин

Профессиональная видеокарта NVIDIA Quadro M2000 использует чип GM206

Профессиональная видеокарта не всегда является огромным полноразмерным монстром с астрономической ценой и объёмами видеопамяти, которые сегодня уже достигли 32 Гбайт, а завтра вырастут ещё больше. В ряде отраслей востребованы компактные и сравнительно недорогие варианты, например, для организации мультимониторных конфигураций или несложной работы в графических редакторах. Также они востребованы в системах видеомонтажа, использующих аппаратные возможности последнего поколения ГП для кодирования и декодирования видео сверхвысокого разрешения. К такому классу профессиональных решений относится новая модель NVIDIA Quadro M2000.

Новинка представляет собой карту половинной длины с однослотовой активной системой охлаждения, оснащённой маленькой турбинкой. По сути, Quadro M2000 является профессиональным вариантом GeForce GTX 950 и использует то же графическое ядро GM206 с полноценной поддержкой кодирования-декодирования HEVC. В нём активны 768 ядер CUDA с пиковой производительностью 1,8 терафлопс на вычислениях одинарной точности. Это заметно выше показателей предыдущей модели, Quadro K2200, которая имела всего 640 ядер CUDA и производительность порядка 1,3 терафлопс.

Подсистема памяти представляет собой 4 Гбайт GDDR5, соединённых с процессором посредством 128-битной шины. Пропускная способность достигает 106 Гбайт/с, что также выше показателей предшественницы, составлявших всего 80 Гбайт/с. Новая Quadro потребляет менее 75 ватт, поэтому, как и большинство моделей GeForce GTX 950, она не требует внешнего питания, вполне довольствуясь возможностями силовой секции слота PCI Express x16. В качестве дисплейных интерфейсов на плате установлены четыре разъёма DisplayPort 1.2. Поддерживается вывод контента в разрешениях 4K, 5K и 8K. Согласно имеющимся данным, стоить данная модель будет 569 евро.

Постоянный URL: http://servernews.ru/931799
12.08.2015 [13:18], Алексей Степин

NVIDIA анонсировала новые модели Quadro M5000 и M4000

Целесообразность применения графической архитектуры NVIDIA Maxwell в профессиональных решениях класса Tesla под вопросом из-за чудовищно низкой скорости вычислений с двойной точностью. Но в решениях Quadro, графических картах для рабочих станций, этот фактор не играет столь важной роли, поэтому состоявшийся сегодня анонс новых моделей Quadro M5000 и M4000 выглядит более чем логично. Конечно, уже существует Quadro M6000, но не всем нужна такая мощность и не все готовы мириться с высоким уровнем энергопотребления.

Обе новых карты оснащены 8 Гбайт видеопамяти GDDR5, чего вполне достаточно для подавляющего большинства профессиональных приложений, на которые семейство Quadro ориентировано — систем CAD/CAM, 3D-моделирования или обработки изображений высокого разрешения. Новинки базируются на отлично зарекомендовавшем себя чипе GM204: в старшей модели он работает в полной конфигурации (2048 CUDA/128 TMU/64 RBE), а в M4000 его конфигурация усечена аналогично тому, как это сделано в GeForce GTX 970. Теплопакет обеих моделей лежит ниже отметки 200 ватт (150 ватт для M5000), что выгодно отличает их от Quadro M6000 с ее 250 ваттами. Частота процессора старшей модели — 1050 МГц в турборежиме, частота памяти — 6,6 ГГц (211 Гбайт/с).

Quadro M4000 удивляет своим однослотовым форм-фактором. Несмотря на скромный вид, её графическое ядро имеет 1664 активных ядра CUDA, 104 TMU и 64 RBE, а теплопакет составляет всего 120 ватт. Правда, достигнуто это за счет серьёзно пониженной частоты ядра, составляющей всего 780 МГц в максимально производительном режиме. Память работает на частоте 6 ГГц (192 Гбайт/с). В отличие от старшей модели, порта DVI здесь нет, но имеются четыре разъёма Display Port. Стоимость новых моделей NVIDIA Quadro пока не оглашена, но, как обычно, следует ожидать существенно более высоких цен, нежели у соответствующих игровых моделей.

Постоянный URL: http://servernews.ru/918511
19.03.2015 [18:18], Алексей Степин

ASRock Rack представила GPU-сервер высокой плотности

Подразделение компании ASRock, ASRock Rack, ответственное за выпуск серверной продукции, представила новый сервер высокой плотности 3U8G-C612, рассчитанный на установку восьми графических карт и предназначенный для использования в самых различных отраслях, включая обслуживание мультидисплейных систем и систем распознавания образов.

Шасси 3U8G поддерживает установку карт NVIDIA Tesla (и, вероятно, в ближайшем будущем TITAN X), AMD FirePro, а также вычислительных ускорителей Intel Xeon Phi. Несмотря на наличие двух центральных процессоров и возможность установки целых восьми графических ускорителей, сервер довольно компактен и имеет форм-фактор 3U.

Ничто не мешает использовать 3U8G-C612 как обычный сервер, благо, в нём используются современные высокопроизводительные процессоры Intel Xeon E5-2600 v3 или E5-4600 v3, дополненные быстрой памятью DDR4. Но главной сферой использования остаётся та, которая требует высочайшей производительности и параллелизма, который возможен только с использованием специализированных ускорителей.

Постоянный URL: http://servernews.ru/911217
Система Orphus