Материалы по тегу: mcm

09.04.2019 [11:35], Андрей Созинов

NVIDIA RC 18: прототип процессора для глубокого обучения из 36 отдельных кристаллов

Компания NVIDIA работает над созданием нового решения, предназначенного для работы с искусственным интеллектом, которое называется RC 18. Ключевой особенностью данного чипа является то, что он будет представлять собой «склейку» из нескольких кристаллов, то есть станет мультичиповым решением.

Инженеры NVIDIA Research создали прототип процессора, который состоит сразу из 36 модулей. Несмотря на столь большое количество кристаллов, площадь чипа довольно небольшая. Всё дело в том, что кристаллы весьма компактные, хоть и производятся по не самому «тонкому» 16-нм техпроцессу компанией TSMC. Напомним, что по таким же нормам производятся графические процессоры Pascal.

Каждый из 36 модулей состоит из 16 процессорных элементов (Processing Elements, PE), являющихся базовыми процессорными ядрами с архитектурой RISC-V Rocket. Кроме того, у модуля есть буфер памяти и восемь каналов GRS (Ground-Referenced Signaling) для операций ввода/вывода с общей пропускной способностью в 100 Гбайт/с, что весьма немало.

На данный момент RC 18 является скорее экспериментальной разработкой, нежели прототипом некоего готовящегося продукта. Этот многочиповый модуль (Multi-chip module, MCM) предназначен для ускорения глубокого обучения искусственного интеллекта и его главной особенностью является высокий уровень масштабируемости. То есть изменять производительность такого MCM-модуля куда проще, чем чипа с монолитным кристаллом, ведь можно просто добавлять или убирать кристаллы с процессорными элементами.

Чип RC 18 создан для ускорения процесса глубокого обучения, что само по себе не очень интересно для рядовых пользователей. Тем не менее, многие из технологий, которые делают возможным создание и работу данного многочипового модуля, могут найти применение в будущих графических процессорах NVIDIA. Компания ранее уже заявляла о том, что рассматривает варианты создания GPU из нескольких кристаллов. И RC 18 является одним из шагов на пути к этому.

«Этот чип (RC 18 — прим. ред.) обладает таким преимуществом, как способность продемонстрировать сразу множество технологий, — отмечает Билл Дэлли (Bill Dally), глава NVIDIA Research. — Одной из технологий является масштабируемая архитектура для глубокого обучения. Другой является очень эффективная технология интерконнекта на органической основе».

Некоторые из технологий, применённых в RC 18, однажды могут стать ключевыми при создании больших высокопроизводительных графических процессоров из нескольких кристаллов. Например, это может быть ячеистая топология, передача сигналов с малой задержкой с помощью GRS, объектно-ориентированный высокоуровневый синтез (Object-Oriented High-Level Synthesis, OOHLS) и технология GALS (Globally Asynchronous Locally Synchronous).

Заметим, что NVIDIA является не первой компанией, которая планирует создание графического процессора из нескольких кристаллов. Некоторое время назад компания AMD также говорила о том, что её шина Infinity Fabric, используемая в центральных процессорах, может найти применение в области GPU. Однако создание таких графических процессоров сопряжено с рядом трудностей, одна из которых заключается в том, чтобы заставить программное обеспечение воспринимать «склейку» как единый GPU. Иначе получится связка SLI или CrossFire, что для потребительских видеокарт означает не самую высокую эффективность. Но когда-то многочиповые модули могут стать вполне обычным явлением для настольных видеокарт.

Постоянный URL: http://servernews.ru/985537
16.11.2017 [19:00], Иван Грудцын

Планы Intel по развитию семейства CPU Xeon на ближайшие три года

В условиях обострения конкуренции с AMD и намечающегося противостояния с ARM в сегменте Windows-ноутбуков компания Intel приняла решение оптимизировать ассортимент полупроводниковой продукции. Одним из крупных проектов, которые пошли «под нож» оказался Knights Hill — развитие семейства процессоров Xeon Phi на базе кристаллов архитектуры MIC третьего поколения. В прошлом году ведущий разработчик архитектуры Xeon Phi Авинаш Содани (Avinash Sodani) покинул ряды Intel ради Cavium, к тому же встал ребром вопрос дальнейшего финансирования направления в условиях прессинга со стороны NVIDIA. Лебединой песней Larrabee станут процессоры Xeon Phi/Knights Mill, созданные для решения задач глубинного обучения. Их выход планировался в рамках выставки-конференции SC17, но в итоге Intel ограничилась демонстрацией прототипов. Тем не менее релиз Knights Mill всё же прогнозируется до конца текущего года.

Гораздо лучше чувствует себя процессорное семейство Intel Xeon Scalable (Skylake-SP, 14 нм). Сборщикам серверных систем и корпоративным заказчикам предоставлен широкий выбор «платиновых», «золотых», «серебряных» и «бронзовых» CPU Xeon с количеством ядер от 4 до 28 и шестиканальным контроллером оперативной памяти. В следующем году ожидается «косметическое» обновление ассортимента серверных процессоров Intel: чипы Xeon Scalable Performance (Cascade Lake) будут выпускаться по улучшенному 14-нм техпроцессу и, вполне возможно, окажутся совместимы с нынешними платами LGA3647.

Ощутимых изменений следует ждать в 2019–20 гг., с дебютом преемников Xeon Scalable Performance — Ice Lake Scalable Xeon (ISX-SP). Последние будут изготавливаться по улучшенной 10-нм технологической норме, и, согласно ресурсу Heise, получат до 36 вычислительных (x86) ядер, восьмиканальный контроллер оперативной памяти и до 32 Гбайт буферной памяти HBM2 с пропускной способностью 650 Гбайт/с. Приведённое немецким источником значение ПСП микросхем HBM2 выглядит довольно странно, ведь уже сегодня существуют полупроводниковые продукты с 900-1200 Гбайт/с High Bandwidth Memory второго поколения.

У Kaby Lake-G буферный чип HBM2 связан не с центральным, а графическим процессором

У Kaby Lake-G буферный чип HBM2 связан не с центральным, а графическим процессором

Ответвлением ISX-SP станут процессоры Ice Lake Xeon/Knights Cove (ISX-H), которые будут выполнены в виде многочипового модуля (MCM) из двух кристаллов и в итоге займут место Xeon Phi. Старшие представители данного семейства получат в сумме 38 или 44 ядра. Предполагается, что по соотношению производительности и энергопотребления они покажут лучшие результаты в бенчмарке утилиты Linpack, чем обычные ISX-SP. Наконец, на 2021 год запланирован выпуск процессоров Intel Ice Age (для широкого спектра задач) и Knights Run (для HPC-сегмента). Никаких подробностей о них пока не поступало.

Постоянный URL: http://servernews.ru/961628
25.08.2017 [13:59], Иван Грудцын

AMD: многочиповость EPYC экономит 41 % средств

Процессоры AMD с 14-нм архитектурой Zen пока радуют невысокими ценами на фоне конкурирующих решений Intel. Может показаться, что при определении стоимости CPU чипмейкер из Саннивейла прежде всего руководствуется необходимостью во что бы то ни стало отобрать у Intel как можно бóльшую долю рынка. Однако демпинг — не лучшая стратегия для компании, задолжавшей кредиторам порядка $2 млрд. Одним из ключевых факторов ценовой доступности старших процессоров Advanced Micro Devices является их низкая себестоимость, которая, в свою очередь, достигается за счёт модульной (MCM) конструкции. В ходе недавней конференции Hot Chips в г. Купертино (штат Калифорния, США) представителями AMD была озвучена величина экономии на разработку и производство модульных 32-ядерных CPU по сравнению с гипотетическими монолитными процессорами с тем же количеством ядер. Согласно AMD, окончательный вариант дизайна EPYC на 41 % дешевле проектирования и выпуска однокристального решения.

Как подчёркивается на вышеприведённом изображении, однокристальные EPYC могли бы быть на 10 % меньше четырёх чипов Zeppelin (суммарно), но выход годных CPU был бы в таком случае существенно ниже.

Нет сомнений, что производительность «теоретических» монолитных EPYC выше, однако если бы в Саннивейле отдали предпочтение одному крупному кристаллу вместо четырёх поменьше, то и серверы на базе таких процессоров обошлись бы заказчикам значительно дороже. Кроме того, стоит отметить, что использование восьмиядерных чипов Zeppelin в EPYC позволяет в случае необходимости нарастить производство Ryzen, ограничив при этом поставки серверных CPU.

Хотя процессоры EPYC предлагаются компанией AMD не первый день, их обзоров в Сети совсем немного. Большую работу проделали энтузиасты ServeTheHome, протестировав 2P-систему Supermicro на базе дуэта 32-ядерных EPYC 7601. По чистой производительности пара новичков уверенно опередила тандемы Intel Xeon E5-2699 v4 (Broadwell-EP, 22 ядра) и Intel Xeon Gold 6150 (Skylake-SP, 18 ядер). Однако учитывая, что такие крупные поставщики серверного ПО, как Microsoft и Oracle, выставляют счета в зависимости от количества ядер в серверах, стоимость владения высокопроизводительными системами AMD может нивелировать старания создателей EPYC.

Постоянный URL: http://servernews.ru/957550
Система Orphus