NVIDIA Tesla K10: "вычислительная" версия Kepler

 

Решения, построенные по архитектуре Kepler, уже хорошо зарекомендовали себя в потребительском сегменте, и NVIDIA приняла ожидаемое решение расширить сферу применения графических процессоров нынешнего поколения за пределы игровых ПК. На конференции GPU Technology компания представила ускоритель вычислений Tesla K10, предназначенный для высокопроизводительных компьютерных систем.

Ускоритель несёт на борту два процессора GK104, каждый из которых, в свою очередь, имеет 1536 ядер CUDA и 256-разрядную шину памяти, посредством которой GPU связывается с микросхемами GDDR5 совокупным объёмом 8 Гбайт (на каждый по 4 Гбайт). Таким образом, общая пропускная способность памяти равна 320 Гбайт/с. Быстродействие Tesla K10 в операциях одинарной точности достигает 4,58 терафлопс и 0,19 терафлопс в операциях двойной точности. Система охлаждения платы обдувается воздушными потоками, которые создают вентиляторы серверного шасси.

На четвёртый квартал запланирован выход второго ускорителя - Tesla K20, который основан на процессоре GK110, по всей видимости, специально созданном для вычислений. Снимок кристалла позволяет установить наличие 15 мультипроцессоров SMX или 1980-2880 ядер CUDA.

GK110 может иметь как 384-битный контроллер памяти, так и 512-битный, достоверных данных на этот счёт не приводится. Объём памяти может достигать 6, 12 и 24 Гбайт, но первые версии Tesla K20 получат минимальную ёмкость буфера GDDR5.

На фото ускорителя можно видеть, что плата также лишена собственного вентилятора, что выдаёт её ориентацию на серверные системы. Уровень энергопотребления изделия не должен превышать 300 ватт, на что указывают разъёмы электропитания в задней части платы.

Наконец, для Tesla K20 будут характерны две уникальные функции: динамический параллелизм, упрощающий параллельное программирование за счёт использования GPU для ускорения наиболее распространённых алгоритмов, и Hyper-Q. Последний механизм подразумевает возможность использования ядер CUDA несколькими CPU одновременно, что особенно востребовано для суперкомпьютерных кластеров с MPI.

Материалы по теме:

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Постоянный URL: http://servernews.ru/595909
Поделиться:  
Система Orphus