Материалы по тегу: gpgpu

27.12.2018 [13:00], Сергей Карасёв

Сервер башенного типа GIGABYTE W291-Z00 допускает установку четырёх GPGPU-карт

Компания GIGABYTE анонсировала сервер башенного типа W291-Z00, рассчитанный на использование в сфере малого и среднего бизнеса.

Устройство заключено в корпус с габаритами 200 × 450,2 × 642,2 мм. Применена материнская плата MZ01-CE1 с возможностью установки одного процессора AMD EPYC 7000 Series с количеством вычислительных ядер до 32. В системе можно задействовать до 1 Тбайт оперативной памяти DDR4-2666/2400/2133 в конфигурации 8 × 128 Гбайт.

Предусмотрены четыре слота PCIe x16 и один слот PCIe x8. Таким образом, в сервер можно установить до четырёх ускорителей GPGPU, обеспечивающих возможность выполнения неспециализированных вычислений на графических процессорах.

Допускается монтаж до двенадцати накопителей в форм-факторе 3,5 или 2,5 дюйма с интерфейсом Serial ATA 3.0. Во фронтальной части предусмотрены отсеки для четырёх дисков типоразмера 3,5/2,5 дюйма с возможностью «горячей» замены. Имеется также коннектор M.2.

Сервер оснащён двумя гигабитными сетевыми портами (Intel I210-AT), дополнительным сетевым портом управления Management LAN, аналоговым разъёмом D-Sub, четырьмя портами USB 3.0. В оснащение входят два блока питания мощностью 1600 Вт каждый.

Гарантирована совместимость с платформами Windows Server 2012 R2 (x64), Windows Server 2016, Red Hat Enterprise Linux 7.4, SUSE Linux Enterprise Server 11.4 / 12.2, Ubuntu 16.04 / 17.04, VMware ESXi 6.5. 

Постоянный URL: http://servernews.ru/980310
29.11.2018 [16:00], Сергей Карасёв

GIGABYTE G191-H44: сервер GPGPU в форм-факторе 1U

Компания GIGABYTE анонсировала GPGPU-сервер G191-H44, предназначенный для решения задач в области искусственного интеллекта, машинного обучения, финансовой аналитики и т. п.

Напомним, что концепция GPGPU предусматривает выполнение неспециализированных вычислений на графических процессорах. В случае нового сервера возможна установка четырёх соответствующих ускорителей, скажем, NVIDIA Tesla V100.

Новинка выполнена в формате 1U с применением набора логики Intel C621 Express. Допускается установка двух процессоров Intel Xeon Scalable (LGA 3647) с максимальным значением рассеиваемой тепловой энергии до 205 Вт.

Сервер оборудован 24 слотами для модулей оперативной памяти DDR4-2666/2400/2133. Есть два отсека для внутренних 2,5-дюймовых накопителей и два отсека для 2,5-дюймовых устройств с возможностью «горячей» замены. Возможна также установка двух дополнительных низкопрофильных карт расширения PCIe.

Устройство наделено двухпортовым гигабитным сетевым контроллером Intel I350-AM2 и вспомогательным портом управления 10/100/1000 Management LAN.

Габариты составляют 430 × 43,5 × 900 мм. На фронтальную панель выведены гнёзда для сетевых кабелей, два порта USB 3.0, разъём D-Sub и последовательный порт. 

Постоянный URL: http://servernews.ru/978910
17.11.2016 [17:49], Константин Ходаковский

Ускорители AMD будут использоваться в облачной платформе Google в 2017 году

На мероприятии SC16 компания AMD сообщала, что её технологии будут доступны пользователям облачной платформы Google по всему миру. Начиная с 2017 года поисковый гигант задействует самые быстрые двухчиповые вычислительные ускорители AMD, FirePro S9300 x2, для ускорения вычислительного движка Google Compute Engine и служб машинного обучения Google Cloud Machine Learning.

AMD FirePro S9300 x2 могут производить высокопараллельные расчёты, включая сложные медицинские и финансовые симуляции, исследования сейсмической активности и подземных слоёв, машинного обучения, осуществлять рендеринг и кодирование видео, проводить научный анализ. Облачная платформа Google Cloud Platform сделает ресурсы ускорителей AMD доступными всем заинтересованным компаниям в мире.

«Графические процессоры представляют собой наилучшую комбинацию производительности и программируемости для уже существующих и только возникающих направлений анализа больших данных, — отмечает старший вице-президент и ведущий архитектор подразделения Radeon в AMD Раджа Кодури (Raja Koduri). — Применение нашей технологии в облачной платформе Google — доказательство прогресса AMD в области развития аппаратных GPU, а также нашей открытой вычислительной платформы Radeon Open Compute Platform. Последняя является единственной полностью открытой высокомасштабируемой вычислительной платформой GPU в мире. Мы ожидаем, что достигнутый нами текущий импульс в области GPU-вычислений будет ускоряться с выходом будущих аппаратных и программных продуктов, а также развития экосистемы промежуточного ПО и библиотек».

На днях AMD также выпустила свежую версию Radeon Open Compute Platform, в которой реализована программная поддержка новых ускорителей, добавлены некоторые математические библиотеки, расширена поддержка современных языков программирования для ускорения развития высокопроизводительных энергоэффективных гетерогенных вычислительных систем.

На SC16 компания также коснулась ряда других вопросов, включая работу технологий машинного обучения на серверах Supermicro; портирование CUDA-приложения Caffe на ускорители AMD через HIP Porting Tool; трассировку лучей и визуализацию в виртуальной реальности для HPC с помощью ускорителей AMD FirePro S9300 X2 и Radeon R9 Nano; и других.

Постоянный URL: http://servernews.ru/942911
26.07.2016 [00:19], Иван Грудцын

NVIDIA представила видеоускорители Quadro P6000 и P5000

«Тяжеловес» рынка дискретной графики NVIDIA продолжает расширять ассортимент видеоадаптеров на 16-нм чипе Pascal GP100. До сегодняшнего дня калифорнийская компания анонсировала эталонный вариант GP100 с 3840 потоковыми процессорами, HPC-ускоритель Tesla P100 с интерфейсами NVLink и PCI Express, а также объявила о грядущем выходе видеокарты NVIDIA Titan X для широкого круга задач, включая игры и работу в GPU-ускоренных приложениях. Теперь же пришло время для анонса видеоадаптера Quadro P6000 (3584 ядра CUDA, 384-разрядная шина памяти), компанию которому составила модель Quadro P5000 на полнофункциональном чипе GP104 с 2560 ядрами CUDA и 256-битной шиной RAM.

Устройства Quadro последних поколений всегда выделялись внушительным объёмом буферной памяти, и карты Quadro P6000 не стали в этом плане исключением. Впрочем, ради увеличения общей ёмкости микросхем RAM инженеры NVIDIA принесли в жертву скорость доступа к ним (как и в Titan X): чипы HBM2 уступили место памяти GDDR5X суммарным объёмом 24 Гбайт. Тот же тип RAM задействован и в ускорителе Quadro P5000, который располагает вдвое большим объёмом локальной памяти (16 Гбайт) по сравнению с игровым GeForce GTX 1080. Производительность Quadro P6000 в FP32-вычислениях NVIDIA оценила в 12 TFLOPS.

Оба новых видеоускорителя Quadro характеризуются наличием разъёмов для вывода изображения DVI-D и DisplayPort 1.4 (4 шт.). С их помощью можно организовать рабочее пространство из четырёх мониторов с разрешением 4096 × 2160 пикселей при 120 Гц или 5120 × 2880 при 60 Гц. Активное охлаждение Quadro P6000/P5000 открывает возможность интеграции данных устройств в состав моделей серверов и рабочих станций, которые не оборудованы высокопроизводительными вентиляторами или СЖО.

NVIDIA Quadro P6000, P5000
NVIDIA Quadro P6000, P5000

NVIDIA подчёркивает, что новинки семейства Quadro должны справиться с практически с любыми задачами, в том числе теми, которые нецелесообразно выполнять на профессиональных картах поколений Kepler и Maxwell ввиду больших временных и эксплуатационных затрат. Так, Quadro P6000 способна отрисовывать очень большие CAD-модели, фотореалистичные сцены, выполнять GPGPU-вычисления и решать задачи, связанные с прогнозированием сейсмической активности. У Quadro P5000 возможности скромнее: работа с большими (сложными) объектами в CAD-приложениях, вычисления, связанные с сейсмическими исследованиями, отрисовка сложных DCC-эффектов и объёмных изображений в медицине (например, воссоздание моделей органов человека на основе вводных данных).

Видеоускорители NVIDIA Quadro P6000 и P5000 появятся у авторизованных поставщиков в октябре текущего года. Рекомендованные цены продуктов пока не объявлены.

Постоянный URL: http://servernews.ru/936733
17.03.2016 [14:09], Алексей Степин

Новый сервер GIGABYTE вмещает до восьми ускорителей GPGPU

Компания GIGABYTE объявила о доступности нового сервера G25N-G51 в форм-факторе 2U, предназначенного для рынка супервычислений (HPC). Чем же выделяется с виду ничем не примечательная модель в обычном стоечном корпусе? А интересна она специальной конфигурацией модулей расширения PCI Express, позволяющей устанавливать до восьми ускорителей на базе графических процессоров AMD/NVIDIA или плат Intel Xeon Phi. На снимке хорошо видны эти боковые тоннели со сквозной вентиляцией, рассчитанные на то, что у карт, которые туда устанавливаются, собственных вентиляторов не будет.

Установка восьми ускорителей NVIDIA Tesla K80 позволяет нарастить вычислительную мощность до 16 графических процессоров. Если в обычном частотном режиме эти карты обеспечивают производительность 1,87 терафлопса в FP64, то итоговый результат внушает — почти 30 терафлопс чистой вычислительной мощи. Система сертифицирована и для работы с серией AMD FirePro. В случае с восемью FirePro S9170 итоговая мощность может достигать свыше 20 терафлопс при вычислениях двойной точности. Конфигурация с Xeon Phi по цифрам выглядит не столь впечатляюще, но в некоторых случаях она может оказаться предпочительной. По всей видимости, допустима и смешанная конфигурация.

Между прочим, поддержка таких конфигураций означает способность системы справиться почти с 2,5 киловаттами тепла, ведь каждая из карт Tesla K80 имеет теплопакет 300 ватт, да и решения других компаний в этом NVIDIA почти не уступают. Обычных процессорных разъёмов LGA 2011-3 у GIGABYTE G25N-G51 два, заявлена поддержка всего семейства Xeon E5-2600 v3. Система также имеет 24 слота RDIMM/LRDIMM ECC и два интерфейса 10 GbE SFP+, обслуживаемые чипами Intel 82599ES. Дисковая подсистема представлена двумя 2,5″ отсеками для накопителей NVMe и шестью отсеками для традиционных 2,5″ SSD или жёстких дисков. Питается система от дублируемого блока питания мощностью 2 киловатта.

Постоянный URL: http://servernews.ru/930049
06.10.2014 [11:28], Алексей Степин

IBM будет сотрудничать с NVIDIA в деле упрочнения союза OpenPOWER

Никто в здравом уме сегодня не поставит под сомнение доминирующую роль архитектуры x86 на рынке вычислительных систем. Она далеко не идеальна, но речь не об этом. Одним из немногих оставшихся бастионов, неподвластных альянсу Wintel, является IBM с её архитектурой POWER, которая активно используется в фирменных «больших системах», поставляемых на рынок компанией. Специалисты не без оснований считают, что POWER гораздо лучше проявляет себя именно на масштабных задачах, где для систем на базе x86 приходится городить многочисленные «костыли». Однако закрытой архитектуре да ещё с довольно узкой областью применения тяжело продержаться на рынке в одиночку.

Именно поэтому IBM провозгласила инициативу под названием OpenPOWER, главной целью которой стало продвижение процессорной архитектуры POWER посредством открытия спецификаций на аппаратное и программное обеспечение партнерам, которые вошли в созданный 6 августа 2013 года консорциум под тем же названием. Таким образом, стал возможным выпуск чипов POWER не только силами самой IBM, но и её партнёров. Но, как мы знаем, есть и другой путь к созданию мощных и эффективных крупномасштабных вычислительных систем — использование графических процессоров для параллельной обработки данных.

Компания NVIDIA, чья платформа CUDA на сегодня является наиболее распространённой в мире вычислений на графических процессорах, объявила о сотрудничестве с IBM в рамках вышеописанной инициативы OpenPOWER с целью создания сверхвысокопроизводительных серверов, сочетающих в себе лучшие черты обоих вычислительных архитектур. IBM уже провела работу по оптимизации своей системы баз данных DB2 под графические процессоры NVIDIA и полагает, что в итоге может выйти платформа, оставляющая позади самые дорогие решения Oracle. Ведутся работы над оптимизацией другого программного обеспечения во всех областях — от биоинформации и молекулярной динамики до погодного и экономического моделирования.

Ранее к альянсу OpenPOWER присоединилась компания Samsung, один из крупнейших разработчиков микроэлектроники. Располагая мощными процессорами POWER, продвинутыми техпроцессами Samsung и лучшими разработками NVIDIA, союз производителей может выпустить на рынок уникальные как по возможностям, так и по уровню производительности системы, разработка и создание которых были бы невозможными без этого сотрудничества. 

Постоянный URL: http://servernews.ru/903029
18.09.2014 [13:51], Алексей Степин

Supermicro представила линейку серверных решений X10

На мероприятии Intel Developer Forum 2014 компания Supermicro, известный производитель серверного аппаратного обеспечения, представила новую линейку серверных решений X10. Её характеризует использование процессоров Intel Xeon E5 v3, памяти DDR4 и накопителей NVMe. Возглавляют семейство серверы X10 Ultra SuperServers, доступные в форм-факторах 1U и 2U. Они поддерживают горячую замену накопителей NVMe и SAS 3.0, а также сетевые подключения на скорости до 40 Гбит/с.

Активный интерес у посетителей IDF 2014 вызвала платформа X10 DP MicroBlade. Как нетрудно догадаться по названию, это лезвийный сервер, поддерживающий до 28 лезвий в общем корпусе высотой 6U. Каждый лезвийный модуль имеет габариты всего 0,2U, но включает в себя два процессора Xeon E5-2600 v3 с теплопакетом до 120 ватт. Supermicro не без оснований считает, что X10 DP MicroBlade обеспечивает наивысшую возможную плотность вычислений.

Серия X10 TwinPro поддерживает горячую замену узлов и процессоры с теплопакетом до 145 ватт, а также установку ускорителей Xeon Phi. Сетевая часть представлена двумя интерфейсами 10 GBase-T и каналом InfiniBand FDR с пропускной способностью 56 Гбит/с. Мощность подсистемы питания может достигать 1280 ватт при эффективности свыше 95 %.

Модели X10 FatTwin похожи на TwinPro. Они могут принимать самые разнообразные конфигурации. Количество двухпроцессорных модулей с горячей заменой может достигать восьми. Здесь также поддерживаются процессоры с теплопакетом до 145 ватт и ускорители Xeon Phi.

Сверхмощная система X10 7U SuperBlade может комплектоваться серверными модулями двух типов: Datacenter Blade с процессорами с теплопакетом до 145 ватт и Storage Blade, где максимальный теплопакет составляет 160 ватт. Опционально поддерживается InfiniBand. Система питания работает по формуле N+1 и подразумевает бесперебойное функционирование.

Существенный интерес представляет платформа X10 GPU/Xeon Phi. Она специально оптимизирована для установки ускорителей на базе графических процессоров или карт Intel Xeon Phi. Максимальная плотность для стоечной модели высотой 2U составляет 6 карт-ускорителей, для башенной – 5 ускорителей. Стоечная версия высотой 1U позволяет устанавливать до трёх ускорителей, что при таких размерах весьма немало.

Помимо описанных моделей, в семействе X10 были представлены различные стоечные серверы для ЦОД, серверы систем ввода-вывода, классические стоечные и башенные модели серверов, а также системы хранения данных X10 SuperStorage с поддержкой до 36 жёстких дисков с возможностью горячей замены.

Заслуживает упоминания и новая линейка рабочих станций X10 SuperWorkstation, в которой даже младшая модель может нести до трёх графических карт или плат-ускорителей, а старшая увеличивает это число до пяти. Все рабочие станции выполнены в классическом башенном форм-факторе и способны работать с устройствами, оснащёнными интерфейсом Thunderbolt.

Помимо готовых систем Supermicro представила целое семейство системных плат X10 с поддержкой всех современных технологий, включая Thunderbolt 2.0. Покрытым оказался весь диапазон форм-факторов от ATX и EATX до специальных форм-факторов под лезвийные и модульные решения компании.

Полный список моделей выглядит следующим образом: двухпроцессорные модели - X10DRC-T4+, X10DRC-LN4+, X10DRi-T4+, X10DRi-LN4+, X10DRi/-T, X10DRW-i/-iT, X10DDW-i, X10DDW-iN, X10DRG-Q, X10DRL-I, X10DAi, X10DAC и X10DAX. Однопроцессорные платы: X10SRL-F, X10SRi-F, X10SRW-F, X10SRH-CF и C7X99-OCE.

Кроме того, Supermicro впервые выступила в сегменте «Интернета вещей», выпустив контроллер SYS-E100-8Q на базе процессора Intel Quark X1021 с теплопакетом всего 2,2 ватта. На борту этого решения имеются 512 Мбайт оперативной памяти DDR3, два порта USB 2.0, два слота Mini PCI Express, слот трансивера ZigBee, два порта 100 Мбит Ethernet, слот для карт памяти microSDHC, разъём TPM 1.2, интерфейсы RS-232 и RS-485, восьмиканальный аналоговый интерфейс с разрядностью оцифровки 12 бит и интерфейс DIO. Эта экономичная платформа предназначена для того, чтобы стать центром управления «умного дома».

Постоянный URL: http://servernews.ru/902014
27.08.2014 [12:30], Алексей Степин

Cray выпустила новый суперкомпьютер CS-Storm

Компания Cray анонсировала новое семейство высокопроизводительных вычислительных систем CS-Storm. Новинка входит в линейку суперкомпьютеров Cray CS и представляет собой решение на базе графических процессоров NVIDIA. CS-Storm обладает достаточно гибкой конфигурацией: в базовом варианте одна стойка CS-Storm может вмещать до 22 модулей типоразмера 2U, каждый из которых, в свою очередь, может содержать в себе до двух 12-ядерных центральных процессоров Intel Xeon E5-2600 v2 и до восьми карт NVIDIA Tesla K40, что обеспечивает производительность на уровне 250 терафлопс на каждую стойку.

Согласно данным Cray, по энергоэффективности CS-Storm в четыре раза превосходит аналогичные решения, не использующие графические процессоры в качестве вычислительных. Каждый модуль может оснащаться оперативной памятью объёмом до 512 Гбайт, к этому следует прибавить по 12 Гбайт на каждую карту Tesla K40. Соединение узлов может осуществляться посредством интерфейсов QDR или FDR Infiniband, либо Intel True Scale. Каждый узел может содержать до шести накопителей типоразмера 2,5″ с поддержкой горячей замены.

Стандартный узел Cray CS-Storm формата 2U

Стандартный модуль Cray CS-Storm формата 2U

Максимальное энергопотребление полностью укомплектованной стойки CS-Storm составляет 63 киловатта, опционально возможно использование сети с напряжением 480 вольт. При этом система охлаждения полностью воздушная, хотя по желанию заказчика возможна установка и жидкостных теплообменников. Вес стойки без опциональных теплообменников составляет примерно 1150 килограммов, а габариты 225 × 76 × 125 сантиметров.

CS-Storm поставляется в комплекте с фирменным программным обеспечением Cray, позволяющим использовать его для решения самого широкого спектра задач, требующих огромной вычислительной мощности. Фирменное ПО специально оптимизировано для работы с GPU. Более полно ознакомиться с Cray CS-Storm можно в соответствующем разделе официального веб-сайта компании. Поставки нового решения Cray уже начаты.

Постоянный URL: http://servernews.ru/900760
18.11.2010 [21:32], Георгий Орлов

Компания AMAX выпустила суперкомпьютер на базе GPGPU

Компания AMAX, один из лидирующих разработчиков в области высокопроизводительной обработки данных (HPC), сообщила о выходе  на рынок суперкомпьютерной системы ServMax AS-5160G, разработанной с применением технологии GPGPU (использование графических процессоров для работы, которая обычно выполняется центральным процессором) на основе архитектуры CUDA компании NVIDIA. В AS-5160G системный модуль формата 3U с 16-ю GPU ServMax AS-3160G скомбинирован с двумя двухпроцессорными серверами, которые могут комплектоваться процессорами Intel или AMD.

 

ServMax AS-5160G

 

Система AS-5160G в итоге представляет собой серверное решение формата 5U с 16-ю GPU и четырьмя CPU наивысшей на данный момент мощности, оптимизированное для работы с приложениями из областей геологоразведки, финансового моделирования, метеорологии и других областей науки и технологии. Обслуживание системы упрощается благодаря фронтальному расположению модулей GPU, которые могут заменяться без выключения системы, и наличию интеллектуального интерфейса управления IPMI. Производительность AS-5160G составляет 16,48 терафлопс в формате одинарной точности при конфигурации с одним графическим модулем. Возможность модульного расширения системы с сохранением базовой архитектуры и добавлением системных модулей AS-5160G обеспечивается также и применением ECC-памяти. AS-5160G превосходит по мощности другие конкурирующие системы, использующие технологию GPGPU на 25%, при этом ее вес, по сравнению с аналогами, меньше на 31%, а объем — на 11%.

Источник:

Постоянный URL: http://servernews.ru/593801
14.08.2010 [09:08], Константин Ходаковский

Dell выходит на рынок GPGPU

История повторяется. В 2000-х AMD представила серверные процессоры Opteron, но крупные компании боялись использовать чипы AMD из-за боязни ухудшения отношений с Intel. Однако IBM и HP решили раскинуть и получили за счёт этого дополнительную прибыль, а Dell оказалась позади.

Теперь, когда революция использования графических ускорителей для расчётов общего назначения (GPGPU) в самом разгаре, один из крупнейших поставщиков компьютеров, наконец, решил выйти на этот новый для неё рынок. Dell в ответ на появление GPGPU-решения IBM iDataPlex dx360 M3, комбинирующего мощь двух процессоров Intel Xeon с двумя ускорителями NVIDIA Tesla с архитектурой Fermi, представила серверное расширение PowerEdge C410x, которое выполнено в формате 3U и обладает 16 слотами PCI Express 2.0 (10 спереди и 6 сзади), предназначенных для установки такого же числа многопотоковых ускорителей Tesla M1050 с 4 Гб памяти на борту или M2050 и M2070 соответственно с 3 и 6 Гб памяти. Последняя видеокарта поступит в продажу до конца третьей четверти года.

Dell PowerEdge C410x

Dell PowerEdge C410x

Dell PowerEdge C410x

Однако заказчики вольны выбирать, чем укомплектовать PowerEdge C410x — это могут быть также высокоскоростные транзисторные накопители или сетевые карты с широкой полосой пропускания. Спектр выбора будет постоянно расширяться по мере того, как различные карты будут проходить процедуру сертификации Dell.

Dell PowerEdge C410x

Можно вообразить, какую мощь предоставляет PowerEdge C410x, если один из 16 ускорителей Tesla M2050 или M2070 обеспечивает скорость вычислений на уровне 1,03 Тфлопс, а с двойной точностью — 0,51. Важно и то, что архитектура Fermi значительно приблизилась к таковой у центральных процессоров, получив многоуровневую иерархию памяти. К тому же, в многопотоковых задачах графические ускорители отрываются от CPU не только в соотношении цена/производительность, но и в показателе энергопотребления, что для серверов очень важная характеристика.

NVIDIA Tesla
NVIDIA Tesla

Но, как понятно любому пользователю мощного ПК, такие системы нуждаются в хорошо продуманной системе охлаждения. И Dell об этом позаботилась.

Dell PowerEdge C410x

Кстати, карты могут изыматься из PowerEdge C410x и подключатся к нему во время работы сервера, это хорошо показано на приведённой видеозаписи.

Источники:

Постоянный URL: http://servernews.ru/593595
Система Orphus