Материалы по тегу: xeon phi

18.08.2016 [09:50], Валерий Косихин

IDF 2016: Intel анонсировала Knights Mill — новую архитектуру ускорителей Xeon Phi для задач глубинного обучения

На конференции Intel Developer Forum, которая в данный момент проходит в Сан-Франциско, была названа следующая версия архитектуры MIC (Many Integrated Cores), основанные на которой продукты пополнят семейство ускорителей параллельных вычислений Xeon Phi — Knights Mill.

От Intel давно не поступало новостей касательно планов по развитию этой линейки устройств. На сегодняшний день Intel выпустила два поколения Xeon Phi — Knights Corner в 2013 году и Knights Landing в 2016-м. Согласно предыдущим заявлениям, третье поколение получит кодовое название Knights Hill, а соответствующие чипы будут производиться по технологической норме 10 нм. 

В кратком выступлении, которое Intel посвятила анонсу Knights Mill, не пояснили, как новинка соотносится с прошлыми планами. Возможно, что Knights Mill является промежуточной остановкой на пути к Knights Hill. По другой версии, новый продукт олицетворяет ответвление от основного пути развития, предназначенное для специфической ниши — глубинного обучения.

Глубинное обучение — одно из направлений задач машинного обучения, которое предполагает моделирование абстрактных понятий за счет построения многократно ветвящихся графов. На практике это применяется в программах компьютерного зрения, распознавания объектов, человеческой речи и т.п. Определяющий признак, который сделает Knights Mill подходящей платформой для глубинного обучения — то, что Intel довольно расплывчато обозначила термином «переменная точность». Скорее всего, речь идет о поддержке формата чисел с плавающей запятой FP16 (половинная точность) либо других форматов с еще меньшей разрядностью. FP16 является приоритетным форматом для задач глубинного обучения, поскольку они не требуют более высокой точности, а процессор достигает более высокой пропускной способности при условии, что FP16 поддерживается им «в железе».

Поддержка половинной точности реализована в GPU последнего поколения от AMD и NVIDIA, и ускорители вычислений Tesla на базе архитектуры Pascal специально оптимизированы для высокой скорости в работе с FP16. Появление чипов Knights Mill упрочит позиции Intel в конкуренции с NVIDIA на этом рынке. При этом разработчики указывают на ряд преимуществ архитектуры MIC по сравнению с графическими процессорами.

Xeon Phi, начиная с поколения Kings Landing, существуют в сокетном форм-факторе, который позволяет загружать ОС непосредственно с MIC без необходимости в отдельном CPU традиционной архитектуры. Также, наряду с массивом высокоскоростной набортной памяти MCDRAM (разновидность HBM) Knights Landing, как и его потомок Knights Mill, может напрямую адресовать внешние модули DDR4 SDRAM. NVIDIA Tesla не может похвастаться такими функциями.

Массовое производство чипов Knights Mill намечено на 2017 г. Судя по графику на слайде Intel (который, впрочем, вряд ли отражает какие-либо твердые числа), Knights Mill удвоит показатели быстродействия, характерные для предыдущего поколения Xeon Phi. Это, в свою очередь, сигнализирует о применении техпроцесса 10 нм, и в таком случае не исключено, что Knights Mill — это просто новое название для ранее анонсированной архитектуры Knights Hill.

Постоянный URL: http://servernews.ru/937966
18.08.2016 [09:21], Алексей Степин

IDF 2016: ASRock Rack выпустила новую вычислительную систему на базе Intel Knights Landing

Первые вычислительные ускорители Intel Xeon Phi ведут свою родословную от не увенчавшегося успехом проекта по созданию собственного дискретного графического ускорителя, но новейшие модели под кодовым названием Knights Landing больше напоминают традиционные ЦП с большим количеством ядер и выпускаются в корпусах типа LGA.

На мероприятии IDF 2016, проходящем в Сан-Франциско, где Intel и её партнёры демонстрируют новейшие решения и обсуждают планы на будущее, весьма интересный продукт продемонстрировала компания ASRock Rack, серверное подразделение ASRock. Она представила сервер высокой плотности на базе новых процессоров Xeon Phi Knights Landing — 2U4N-F/X200.

Система, имеющая общий стандартный корпус шириной 19″ и высотой 2U, включает в себя четыре вычислительных модуля, каждый из которых оснащён собственным 72-ядерным чипом Knights Landing X200, шестью модулями DDR4 DIMM, допускающими установку модулей RDIMM/LRDIMM с частотой 2400 или 2133 МГц, соответственно.

В состав каждого модуля входит также подсистема накопителей, которая может включать четыре накопителя в форм-факторе 2,5″ с интерфейсом SATA/SAS либо два накопителя SATA/SAS и два NVMe. Дополнительно имеются два слота PCIe 3.0 x2 и разъём M.2, а также пара контроллеров GbE Intel i350 и поддержка IPMI 2.0 с помощью чипа AST2400. Система обслуживается двойным блоком питания мощностью 1600 ватт, имеющим сертификацию 80 Plus PLATINUM.

Новые процессоры Xeon Phi используют новый процессорный разъём Intel P1, который ранее уже был продемонстрирован на мероприятии Supercomputing 15 в прошлом году. Другое его название, как обычно, исходит из числа контактов — LGA 3647. Intel пока подтверждает использование только этого разъёма для новых Xeon Phi; другие варианты не оглашаются, но мы знаем, что компания ведёт работы над версиями X200 с поддержкой высокоскоростной шины Omni-path.

LGA 3647 крупным планом. В правой части место под разъём Omni-path

LGA 3647 крупным планом. В правой части место под разъём Omni-path

На ранее опубликованных снимках такие Xeon Phi имеют выступ с контактами сбоку, но в ASRock Rack 2U4N-F/X200 используются обычные LGA 3647. Компания утверждает, что её платформа будет поддерживать чипы с Omni-path. Цены на новый 288-ядерный сервер не оглашены, заинтересованным в приобретении новинки компаниям следует обращаться в региональные отделения ASRock. 

Постоянный URL: http://servernews.ru/937959
13.05.2016 [11:30], Сергей Карасёв

Fujitsu создаст самый мощный в Японии суперкомпьютер

Компания Fujitsu получила от Токийского и Цукубского университетов заказ на создание самого высокопроизводительного в Японии вычислительного комплекса.

Новый суперкомпьютер создаётся по проекту Oakforest-PACS. Сообщается, что в его основу лягут 8208 узлов Primergy с чипами Intel Xeon Phi поколения Knights Landing. Отмечается, что общий объём памяти составит около 900 Тбайт. Говорится об использовании интерконнекта 100 Gbps Omni-Path.

Суперкомпьютер Oakforest-PACS будет смонтирован в Объединённом центре передовых высокопроизводительных вычислений (JCAHPC). Ввод системы в строй намечен на декабрь нынешнего года. Ожидается, что производительность комплекса достигнет 25 петафлопсов (квадриллионов операций с плавающей запятой в секунду).

Согласно нынешней редакции рейтинга Тор-500, самым быстрым суперкомпьютером в мире является созданная в Китае система Tianhe-2. Этот комплекс, смонтированный в Национальном суперкомпьютерном центре в Гуанчжоу, обладает быстродействием в 33,86 петафлопса. Пиковая производительность составляет 54,9 петафлопса.

На втором месте в списке Тор-500 находится система Titan, установленная в Оукриджской национальной лаборатории Министерства энергетики США. Этот комплекс показывает быстродействие в 17,59 петафлопса, а пиковая производительность достигает 27,11 петафлопса.

Таким образом, новый суперкомпьютер Oakforest-PACS сможет претендовать на место в первой тройке рейтинга, если, конечно, до конца года в нём не произойдут кардинальные изменения. 

Стоит также отметить, что самым мощным российским вычислительным комплексом является установленный в МГУ имени М.В. Ломоносова суперкомпьютер «Ломоносов-2» производства компании «Т-Платформы». Эта система демонстрирует быстродействие в 1,85 петафлопса, в то время как пиковая производительность достигает 2,58 петафлопса. В рейтинге Тор-500 «Ломоносов-2» занимает 35-ю позицию.

Между тем, уже ведутся работы по созданию сверхмощной вычислительной системы, производительность которой должна будет превысить отметку в 1 экзафлопс, или 1000 петафлопсов. Такой суперкомпьютер, в частности, проектируют Соединённые Штаты. Система будет содержать сотни миллионов вычислительных ядер, а её запуск намечен на 2023 год.

Постоянный URL: http://servernews.ru/932840
18.04.2016 [12:21], Алексей Степин

Рабочие станции Colfax Ninja комплектуются сопроцессорами Intel Knights Landing

Новые рабочие станции, разработанные компанией Colfax, представляют весьма существенный интерес, поскольку для ускорения различных расчётов в них установлены не традиционные ускорители CUDA или OpenCL (NVIDIA Quadro и AMD FirePro, соответственно), а 72-ядерные сопроцессоры Intel Xeon Phi последнего поколения под кодовым названием Knights Landing, причём, используются они в качестве центральных процессоров и несут на борту 16 Гбайт интегрированной памяти MCDRAM. Поддерживается новейший набор инструкций AVX-512. Предварительный заказ можно оформлять уже сейчас, поставки самих станций начнутся позже, но будьте готовы к тому, что дешёвыми они не будут.

В частности, настольный вариант под названием Ninja Developer Platform Pedestal будет стоить от $4983. В базовой конфигурации имеются: SSD ёмкостью 240 Гбайт, жёсткий диск объёмом 4 Тбайт и 96 Гбайт оперативной памяти, обслуживаемые шестиканальным контроллером DDR4. А максимальная версия обойдётся в $7577 и получит пару высокопроизводительных твердотельных накопителей объёмом 1,6 Тбайт и пару жёстких дисков по 6 Тбайт. Станции этой модели имеют жидкостное охлаждение. Опции расширения включают в себя наличие слотов PCI Express 3.0: два полноценных x16 и одного x4. Базовая сетевая подсистема представлена двумя портами GbE, но, разумеется, при необходимости возможна установка и более скоростных сетевых интерфейсов. В комплекте поставляется лицензионное ПО для разработки Intel Parallel Studio XE Professional Edition.

Ещё дороже обойдётся стоечный вариант Ninja Developer Platform Rack — своеобразный четырёхлезвийный мини-суперкомпьютер в серверном корпусе. Начальная цена — $19703, в этой базовой конфигурации параметры лезвия те же, что и у настольного варианта. Продвинутый вариант с 3,2 Гбайт объёма, представленного SSD, обойдётся уже в $25581. Опции расширения здесь немного другие: помимо слота PCI Express 3.0 x16 возможно использование райзера с 20 линиями шины, причём, на каждый из четырёх узлов. Платформа разработки здесь уже Parallel Studio XE Cluster Edition. Новые системы Colfax работают под управлением операционной системы CentOS 7.2; пока неясно, будет ли поддерживаться среда Windows, но пока Intel не рекомендует использовать ОС Microsoft в 72-ядерной системе на базе Knights Landing. Назначение новых систем — разработка и тестирование приложений для будущих суперкомпьютеров на базе нового поколения Xeon Phi. Один из таких суперкомпьютеров по имени Cori в ближайшем будущем должен вступить в строй в Беркли, в национальном научно-исследовательском вычислительном центре энергетики (NERSC).

Постоянный URL: http://servernews.ru/931592
15.04.2016 [12:38], Геннадий Детинич

Intel представила настольные суперкомпьютеры «Ninja» на CPU Knights Landing

В ноябре прошлого года компания Intel официально представила новые ускорители вычислений — 14-нм 72-ядерные процессоры в линейке Xeon Phi, которые известны под кодовым именем Knights Landing. Мы не ошиблись, именно процессоры, хотя новинки можно также использовать в качестве ускорителей для решения специфических задач. Модели Xeon Phi поколения Knights Landing выпускаются не только в виде PCIe-карточек, но также в одиночном исполнении со своим собственным процессорным разъёмом и могут работать как обычные процессоры серверного назначения.

Основные факты о процессорах (Intel)

Основные факты о процессорах Knights Landing (Intel)

Массовое производство процессоров Knights Landing было перенесено на первый квартал 2016 года. «Эпидемия» переносов не миновала 14-нм Xeon Phi, как и их настольных и мобильных собратьев компании Intel — очень уж тяжело дался переход с 22 на 14-нм нормы производства. В настоящий момент компания Intel уже осуществляет товарные поставки процессоров линейки Knights Landing и, что замечательно, подготовила версии рабочих станций на моделях Xeon Phi, которые будут на ура восприняты разработчиками.

Настольная и стоечная системы на процессорах (Colfax)

Настольная и стоечная системы «Ninja Developer Platform» на процессорах Knights Landing (Colfax)

На днях партнёр компании Intel — компания Colfax — начала принимать предварительные заявки на настольную систему «Ninja Developer Platform» на процессоре Knights Landing. Такая система с жидкостным охлаждением и младшим процессором Knights Landing обойдётся заказчику в $4 982. Двухюнитовая полка с четырьмя процессорами будет стоить уже $19 703. Но наибольший интерес, конечно, представляет компактный системный корпус — это фактически суперкомпьютер на столе, который позволит за сравнительно небольшие деньги познакомиться с возможностями новой вычислительной платформы компании Intel.

Процессор Knights Landing со стороны теплораспределительной крышки

Процессор Knights Landing со стороны теплораспределительной крышки

В состав рабочей станции и стоечного блока 2U входит оперативная память, объём которой выбирает заказчик, и дисковая подсистема. Предустановленная на компьютеры операционная система — CentOS 7.2. В комплект поставки входят также программные инструменты и руководство пользователя, включая одногодичную лицензию на использование Intel Parallel Studio XE Professional Edition. Для компании Intel это первый опыт по широкому распространению полностью укомплектованных и готовых к работе систем класса суперкомпьютеров, хотя компания NVIDIA достаточно давно по подобной схеме распространяет продукцию класса Tesla.

Постоянный URL: http://servernews.ru/931476
17.03.2016 [14:09], Алексей Степин

Новый сервер GIGABYTE вмещает до восьми ускорителей GPGPU

Компания GIGABYTE объявила о доступности нового сервера G25N-G51 в форм-факторе 2U, предназначенного для рынка супервычислений (HPC). Чем же выделяется с виду ничем не примечательная модель в обычном стоечном корпусе? А интересна она специальной конфигурацией модулей расширения PCI Express, позволяющей устанавливать до восьми ускорителей на базе графических процессоров AMD/NVIDIA или плат Intel Xeon Phi. На снимке хорошо видны эти боковые тоннели со сквозной вентиляцией, рассчитанные на то, что у карт, которые туда устанавливаются, собственных вентиляторов не будет.

Установка восьми ускорителей NVIDIA Tesla K80 позволяет нарастить вычислительную мощность до 16 графических процессоров. Если в обычном частотном режиме эти карты обеспечивают производительность 1,87 терафлопса в FP64, то итоговый результат внушает — почти 30 терафлопс чистой вычислительной мощи. Система сертифицирована и для работы с серией AMD FirePro. В случае с восемью FirePro S9170 итоговая мощность может достигать свыше 20 терафлопс при вычислениях двойной точности. Конфигурация с Xeon Phi по цифрам выглядит не столь впечатляюще, но в некоторых случаях она может оказаться предпочительной. По всей видимости, допустима и смешанная конфигурация.

Между прочим, поддержка таких конфигураций означает способность системы справиться почти с 2,5 киловаттами тепла, ведь каждая из карт Tesla K80 имеет теплопакет 300 ватт, да и решения других компаний в этом NVIDIA почти не уступают. Обычных процессорных разъёмов LGA 2011-3 у GIGABYTE G25N-G51 два, заявлена поддержка всего семейства Xeon E5-2600 v3. Система также имеет 24 слота RDIMM/LRDIMM ECC и два интерфейса 10 GbE SFP+, обслуживаемые чипами Intel 82599ES. Дисковая подсистема представлена двумя 2,5″ отсеками для накопителей NVMe и шестью отсеками для традиционных 2,5″ SSD или жёстких дисков. Питается система от дублируемого блока питания мощностью 2 киловатта.

Постоянный URL: http://servernews.ru/930049
14.12.2015 [16:00], Алексей Степин

Новые серверные процессоры Intel Xeon E5-2600 v4 появятся в первом квартале 2016 года

Одно время считалось, что в секторе серверных платформ корпорация Intel пропустит архитектуру Broadwell, дабы совершить сразу скачок к более совершенной микроархитектуре Skylake, отлично показавшей себя в потребительском сегменте. Но столь грандиозным планам не суждено было осуществиться, и компания вернулась к запасному варианту с Broadwell-EP. Первые образцы этих процессоров, как уже сообщалось, довольно свободно циркулируют в китайских торговых сетях, но вообще, официальный анонс линейки Xeon E5-2600 v4 состоится в первом квартале 2016 года, до начала которого осталось уже совсем немного времени.

Новые процессоры сохранят совместимость с платформой Grantley-EP, и теперь стало известно большинство характеристик будущих 12 моделей Intel Xeon E5-2600 v4. Разумеется, речь идёт о неофициальных источниках, поэтому в списке технических параметров есть определённые пробелы — в частности, далеко не для всех чипов указаны теплопакеты и частоты в турборежиме. Да и количество ядер неизвестно для таких моделей, как E5-2678 v4 и E5-2666 v4. Что мы знаем точно, так это увеличение частоты памяти DDR4, с которой контроллер может работать в стандартном режиме, до 2400 МГц — ранее стандартом считалось 2133 МГц.

Под надписью «Intel Confidential» скрывается Xeon E5-2698 v4

Под надписью «Intel Confidential» скрывается вполне рабочий и полнофункциональный 20-ядерный Xeon E5-2698 v4

Напоминаем, что процессоры Intel Xeon с архитектурами Haswell-EP/EX, Ivy Bridge-EP/EX и, наконец, Broadwell-EP/EX станут последними из могикан на платформе LGA 2011. Сама платформа будет вытесняться Intel в пользу новой платформы Purley, основой которой станут процессоры с архитектурами Skylake и Cannonlake. Правда, появится эта платформа лишь во второй половине 2017 года. Надо сказать, что в серии Broadwell-EP мы увидим и процессоры E5-1600 v4, предназначенные для однопроцессорных систем. Количество ядер в этих моделях будет ограничено восемью и, по сути, это будут серверные варианты HEDT-чипов Broadwell-E, скорее всего, использующие те же кристаллы.

Платформа Broadwell-EP 4S с четырьмя процессорными разъёмами получит новые процессоры Xeon E5-4600 v4 во втором квартале следующего года. Примерно в этот же промежуток времени Intel выпустит и чипы Xeon E7-4800 v4 и Xeon E7-8800 v4. Они сохранят совместимость с платформой Brickland. А в третьем квартале состоится, пожалуй, самый интересный анонс: Intel представит серию процессоров Xeon Phi X200. Как уже известно, серия Knights Landing в большей мере напоминает классические процессоры, нежели ускорители со своей ОС на борту. Новые Xeon Phi будут использовать ядра с архитектурой Silvermont, многослойную высокоскоростную память и выпускаться с применением 14-нанометрового техпроцесса. Количество x86-совместимых ядер достигнет 72, а благодаря архитектурным особенностям Knight's Landing поставит рекорд многопоточности — 288 потоков на процессор.

Постоянный URL: http://servernews.ru/925113
15.07.2015 [07:25], Александр Будик

ISC 2015: суперкомпьютерные технологии Intel

В ходе конференции International Supercomputer Conference 2015, которая проходит во Франкфурте, компания Intel продемонстрировала свои новейшие технологии супервычислений. Крупнейший чипмейкер также предоставил немного больше подробностей о 72-ядерном Xeon Phi следующего поколения, рассказал об альянсе с компанией Hewlett-Packard, в рамках которого партнёры займутся продвижением HPC-систем для разных ценовых сегментов.

Anandtech

Anandtech

Как отметил директор по маркетингу и отраслевому развитию Intel Хьюго Сале (Hugo Saleh), участники конференции имели возможность ознакомиться с последними HPC-инновациями компании. Intel особое внимание уделила разработчикам, показывая, как можно модернизировать код для полного раскрытия потенциала новых аппаратных технологий. Компания активно продвигает создание экосистемы программного обеспечения, которую она называет Modern Code Developer Community. К концу 2015 года это сообщество, по прогнозам Intel, будет насчитывать более 400 тысяч участников, которые будут уметь правильно разрабатывать параллельный код.

Anandtech

Anandtech

Intel уже имеет программные инструменты для разработки параллельного кода, необходимого для реализации возможностей своего суперкомпьютерного оборудования. Теперь же она стремится научить как можно больше девелоперов писать современные программы для эффективного решения задач параллельного программирования для HPC.

Anandtech

Anandtech

Что касается Xeon Phi с кодовым именем Knights Landing, то этот продукт будет коммерчески доступен позже в этом году. Чип получит до 16 Гбайт многоканальной DRAM-памяти, которая будет интегрироваться прямо на кристалле. Интересно отметить, что Intel таки сумела наладить производство чипов с таким большим количеством ядер. И если первые версии Xeon Phi имели до 62 ядер, то в чипах нового поколения компания сможет разблокировать все 72 ядра. Новинка будет характеризоваться производительностью более 3 Тфлопс. Для технологии межсоединений Intel также придумала название — Omni-Path Fabric 100 Series, что будет отличать её от следующих итераций.

Постоянный URL: http://servernews.ru/917110
14.07.2015 [18:59], Сергей Карасёв

ISC 2015: суперкомпьютеры и кластерные системы в экспозиции Cray

Корреспонденты 3DNews познакомились с экспозицией компании Cray на международной суперкомпьютерной конференции ISC 2015.

Cray демонстрирует высокопроизводительные вычислительные системы нового поколения — суперкомпьютеры XC40 и суперкомпьютерные кластеры CS400.

В основу этих комплексов положены процессоры Intel Xeon серии E5-2600 v3 (Haswell-EP), которые могут насчитывать до 18 вычислительных ядер. Поддерживается работа с оперативной памятью DDR4. В ядро Haswell-EP включена поддержка набора инструкций AVX2, который позволяет увеличить производительность операций с плавающей запятой вплоть до 100 % по сравнению с первой версией.

В суперкомпьютерах Cray XC40 реализована фирменная технология DataWarp. Её задача заключается в увеличении быстродействия приложений и снижении полной стоимости владения систем, обрабатывающих задачи с высокой интенсивностью операций ввода/вывода.

Среди преимуществ систем XC40 и CS400 производитель выделяет масштабируемость и поддержку сопроцессоров Intel Xeon Phi. Заказчики смогут сформировать на основе названных решений платформы, полностью удовлетворяющие потребностям в вычислительных ресурсах. 

Постоянный URL: http://servernews.ru/917100
12.04.2015 [20:45], Сергей Карасёв

США запретили Intel поставлять чипы Xeon для китайских суперкомпьютеров

Правительственные структуры Соединённых Штатов приняли решение наложить запрет на поставки в Китай процессоров Intel, применяющихся в системах высокопроизводительных вычислений.

Сообщается, что отныне Intel не может отгружать чипы Xeon и Xeon Phi четырём китайским учреждениям, имеющим отношение к созданию и эксплуатации суперкомпьютеров Tianhe-1A и Tianhe-2. Причина — подозрения в том, что эти мощные комплексы используются в рамках исследовательских проектов, связанных с ядерными взрывчатыми веществами.

Нужно отметить, что Tianhe-2 на сегодня является самым быстрым суперкомпьютером в мире: он обладает быстродействием в 33,86 петафлопса (квадриллиона операций с плавающей запятой в секунду). А пиковая производительность достигает 54,9 петафлопса. Причём основой Tianhe-2 служат именно процессоры Xeon и сопроцессоры Xeon Phi.

В списке «неугодных» научных организаций КНР оказались: Национальный университет оборонных технологий, а также Национальные суперкомпьютерные центры в Гуанчжоу, Чанше и Тяньцзине.

В августе прошлого года Министерство торговли США уведомило Intel о том, что для поставок изделий Xeon названным китайским структурам необходима экспортная лицензия. Intel подала заявку на её выдачу, но получила отказ. В решении американского ведомства говорится, что деятельность четырёх китайских организаций «угрожает безопасности или интересам внешней политики США».

Таким образом, теперь суперкомпьютерным центрам Китая придётся искать иные пути получения процессоров Intel или перейти на решения другого производителя. В КНР ситуацию пока никак не комментируют. 

Постоянный URL: http://servernews.ru/912497
Система Orphus