Материалы по тегу: процессоры

07.12.2017 [19:25], Алексей Степин

Президенту PEZY Computing предъявлены обвинения в мошенничестве

Об уникальных японских процессорах PEZY-SC мы рассказываем читателям не первый год. Впервые о них мы поведали в 2016 году во время конференции ISC 2016, а на ISC 2017 компания-разработчик представила PEZY-SC2 — ещё более быструю версию предыдущей архитектуры. Процессор, кроме того, использовал уникальную технологию внутричиповых соединений TCI на базе индуктивных пар. Однако дела у компании идут далеко не гладко. Президент PEZY Computing Мотоаки Сайто (Motoaki Saito) и ещё один сотрудник компании Дайсукэ Сузуки (Daisuke Suzuki) были арестованы во вторник пятого декабря.

Согласно официальной версии, главная вина подозреваемых заключается в получении мошенническим путём государственных средств на сумму 431 млн иен (порядка 3,8 млн долларов США). Если верить предъявленным обвинениям, схема мошенничества довольно проста: компания, как это нередко бывает, получала субсидирования от государства, в частности, от организации NEDO (New Energy and Industrial Technology Development Organization), но в итоге себестоимость разработок PEZY была обманным путём завышена, и разницу в сумме руководители использовали в личных целях. Именно это и является составом преступления по мнению местных правоохранительных органов.

Сбудутся ли теперь амбициозные планы PEZY?

Сбудутся ли теперь амбициозные планы PEZY?

Сумма почти в 4 миллиона долларов США не выглядит маленькой, поскольку семилетний капитал самой PEZY оценивается примерно в 940 млн иен (около $8,4 млн), а планы у компании самые наполеоновские: уже в следующем году был запланирован выпуск 7-нм чипа PEZY-SC3 с 8192 ядрами, а на 2020 год был назначен настоящий монстр — PEZY SC4, использующий уже 5-нм техпроцесс и располагающий 16384 ядрами. В настоящее время PEZY-SC2 являются основой гибридного суперкомпьютера Gyoukou производительностью 19,4 петафлопс, который, согласно последним отчетам, занимает четвёртую строчку рейтинга Top 500. Используется этот уникальный процессор и в других японских кластерных системах. Как скажется судебный процесс над главой компании на её весьма амбициозных планах — пока неясно.

Постоянный URL: http://servernews.ru/962581
06.12.2017 [14:20], Сергей Карасёв

Облачная платформа Microsoft Azure начнёт использовать чипы AMD EPYC

Корпорация Microsoft начала использовать процессоры AMD семейства EPYC 7000 в составе своей масштабной облачной платформы Azure.

В основе работы Azure лежит запуск виртуальной машины для каждого экземпляра приложения. Разработчик определяет необходимый объём для хранения данных и требуемые вычислительные мощности (количество виртуальных машин), после чего платформа предоставляет соответствующие ресурсы.

Сообщается, что для виртуальных машин нового поколения (Lv2-Series VM) корпорация Microsoft выбрала чипы AMD EPYC. Речь, в частности, идёт об изделии EPYC 7551, которое насчитывает 32 вычислительных ядра с возможностью обработки до 64 потоков инструкций. Тактовая частота составляет 2,2 ГГц, максимальная частота в турбо-режиме — 3,0 ГГц (для одного ядра).

Отмечается, что названный чип имеет 8 каналов памяти и 128 полос шины PCIe 3.0, благодаря чему обеспечивает возможности, которые ранее были доступны только для серверов двухразъёмной архитектуры. Благодаря процессорам EPYC совокупная стоимость владения серверными платформами значительно снижается.

«IT-организации по всему миру сталкиваются с ограниченностью бюджета и пространства, и недостаточно используемые серверы делают ситуацию ещё хуже. Сегодня те же центры обработки данных нуждаются в высокой производительности, а сервер с одним разъёмом создан для увеличения загрузки и снижения затрат на приобретение», — отмечает AMD. 

Постоянный URL: http://servernews.ru/962469
03.12.2017 [19:00], Алексей Степин

Intel продвигает платформу Purley на российском рынке ЦОД

Официально платформа Intel Purley была представлена в июле текущего года, хотя избранные зарубежные партнёры компании получили доступ к ней намного раньше. Сама Intel неоднократно говорила о том, что это не просто очередной анонс в духе «быстрее, выше, сильнее». Речь идёт о перебалансировке платформы в целом. Собственно говоря, серверные решения не ограничиваются одними только CPU. В арсенале у Intel есть собственные SSD, новые накопители 3D XPoint, FPGA, различные акселераторы (в том числе встроенные теперь и в PCH), а также целое семейство ускорителей Xeon Phi и Nervana. И это не считая солидного набора библиотек для всего этого. Однако в данной заметке речь пойдёт о внедрении новой платформы на территории РФ, чему корпорация Intel посвятила отдельное мероприятие. 

Увы, пока что публично рассказать о полевых испытаниях Intel Purley согласились рассказать немногие (Мы уже не первый месяц ждём информацию от одного из крупнейших IT-конгломератов РФ - прим. ред.), так что заметка будет посвящена работе с Optane в МГУ и тестированию Xeon-SP в МТС. Ранее мы уже рассказывали обо всех ключевых компонентах Intel Purley, так что здесь ограничимся лишь кратким описанием технологий и примеров. 

Optane SSD DC P4800X были анонсированы ещё весной. Надо отдать новинке должное: хотя по показателям линейной производительности она может и уступать решениям Samsung, зато задержки при обращении к устройству снизились до 10 микросекунд и даже ниже. Немаловажно и то, что показатель задержки остаётся постоянным, что в ряде случаев весьма критично. Помимо этого, P4800X обеспечивает и отличную пропускную способность на коротких очередях, чем классические SSD обычно похвастаться не могут, хотя и оставляют далеко позади традиционные HDD. Использование нового типа памяти также позволило существенно поднять надёжность — примерно в три раза. Завяляется, что при равном объёме и прочих условиях Optane SSD DC P4800X сможет обеспечить до 30 дневных перезаписей в течение расчётного срока, тогда как у серверного NAND SSD этот показатель будет равен примерно 10 перезаписям в день.

Сейчас накопители на базе Optane не отличаются ни дешевизной, ни большими объёмами хранения данных, так что Intel предполагает два сценария использования DC P4800X: кеширующий накопитель для массива на традиционных SSD или прозрачное расширение памяти. В последнем случае, что интересно, управляющее программное обеспечение включается до загрузки операционной системы, и такая связка с точки зрения ОС является абсолютно прозрачной: небольшой гипервизор перехватывает и перераспределяет обращения к памяти. Тип ОС, по сути, не имеет значения. Впрочем, это пока скорее переходный этап, так как в дальнейшем появится полноценная реализация NVDIMM. 

Называется эта технология Intel Memory Drive Technology (MDT). Конечно, память Optane не столь быстра как традиционная DRAM, но здесь всё зависит от сценария нагрузки. К примеру, при матричном умножении можно получить выигрыш порядка 1,1х за счёт оптимизации размещения данных, а вот в базе данных MySQL производительность может составить 80 % от производительности системы класса «всё в памяти» (Big DRAM). Но при этом вариант с MDT существенно дешевле, что делает технологию отличной альтернативой.

Конечно, пропускная способность DDR4 на порядок выше, нежели у накопителей Optane (порядка 25 Гбайт/с на канал против примерно 2 Гбайт/с на диск), но, как показывают результаты исследований сотрудников химического факультета МГУ им. М. В. Ломоносова и Intel, ограничивающим фактором производительность DC P4800X становится редко. Более того, технология MDT лучше ведёт себя в системах с архитектурой NUMA — а к таковым можно причислить практически все современные многопроцессорные платформы, поскольку контроллеры памяти у каждого процессора свои, а общаются между собой ЦП посредством отдельной шины.

Конечно, разработка приложений под MDT имеет свою специфику — в частности, шаблоны обращения к памяти должны быть предсказуемыми, чтобы можно было с упреждением подгрузить порцию данных в DRAM из накопителя Optane. Наилучшие результаты достигаются в приложениях вычислительного характера, где на каждое обращение к памяти приходится много процессорных тактов; в противном случае DC P4800X всё же может стать узким звеном, как это было описано в примере с MySQL в предыдущем абзаце. Крайне желательно также одновременное использование более половины доступных процессорных ядер в системе.

Для сравнительных тестов MDT применялись следующие системы: обе машины были оснащены двумя процессорами Intel Xeon E5-2699 v4 (44 ядра, 88 потоков совокупно, 2,2 ГГц). Но система с MDT получила лишь 256 Гбайт памяти DDR4 ECC, которую дополнили 4 накопителя Optane ёмкостью 320 Гбайт каждый (8‒10 Гбайт/с суммарно). В то же время, система типа Big DRAM была оснащена 1536 Гбайт DDR4 ECC. Тестовая программа состояла из следующих пунктов:

  • Расчёт полиномов;
  • Перемножение матриц (GEMM);
  • LU-факторизация;
  • PARDISO (Intel Math Kernel Library);
  • Быстрое преобразование Фурье (FFT).

В итоге в тесте GEMM система с MDT даже после оптимизации теста практически не уступила Big DRAM (0,9x), а в неоптимизированном тесте и вовсе оказалась впереди (1,1x). В LU-факторизации (один из тестов Linpack) после оптимизации эффективность MDT составила 90 % от эффективности Big DRAM. В тесте FFT при размере задачи до 200 % от объёма DRAM система с MDT демонстрировала эффективность на уровне 80‒130 %, но при увеличении задачи до 250 % от объёма DRAM эффективность упала до 40 %, что, очевидно, связано с постоянным использованием накопителя Optane.

А вот в задаче Intel MKL PARDISO (разреженные задачи линейной алгебры) технология MDT оказалась эффективнее классической вне зависимости от размеров данных. В целом, для неоптимизированных задач Intel оценивает эффективность MDT в диапазоне от 20 % до 180 %, а в приложениях, где главным параметром является ПСП, этот показатель оценен примерно в 50 %, что всё равно неплохо с учётом стоимости равного MDT-системе по объёму массива «чистого» DRAM.

Стоит также рассказать и о том, что новая серверная архитектура Intel уже успела пройти проверку в компании МТС, крупном телекоммуникационном провайдере. Клиентов у мобильного оператора более 100 миллионов, только розничных торговых точек более 5500, так что можно представить себе, какая ИТ-инфраструктура стоит за этими масштабами. В МТС есть особое подразделение, которое занимается Data Science — обработкой огромных массивов данных, которые ежесекундно собираются компанией, и их анализом. Отчёты предназначены и для внутреннего использования, и для сторонних заказчиков.  

Для теста была выбрана следующая цель: оптимизация планирования рабочего времени (WFM) сотрудников салонов связи. Задача не такая простая, как кажется на первый взгляд: у сотрудников может быть гибкий график работы; кто-то может неожиданно заболеть; есть определённые правила относительно минимального числа сотрудников в каждый момент времени в салоне; есть, в конце концов, трудовое законодательство. Даже погода за окном влияет на работу салона. Оценка расписаний зависит от правил, установленных в системе WFM. У каждого правила есть свой «вес», всего в системе анализа насчитывается около 30 правил. Новая платформа для этой задачи содержала два процессора Intel Xeon Gold 6148 (40 ядер, 80 потоков суммарно, 2,4 ГГц, стоимость одного чипа примерно $3075), а вот соперником выступил настоящий тяжеловес: четыре процессора Xeon E7-4890 v2 (60 ядер, 120 потоков суммарно, 2,8 ГГц, стоимость одного чипа $6619). 

Для эксперимента случайным образом отобрали 30 офисов, для каждого из которых было установлено по 10 вариантов расписания, всего же итераций эксперимента было 10. Результат оказался неожиданным. Четырёхпроцессорный монстр с треском проиграл новичку, оснащённому всего двумя процессорами, да ещё и с меньшим общим количеством ядер. Если у старой системы время работы алгоритма превысило 50 секунд, то новинка на базе Xeon Gold управилась менее, чем за 30 секунд. С учётом меньшего энергопотребления (300 ватт на 2 процессора против 620 ватт на 4 процессора) результат весьма достойный. 

Кроме того, на презентации свои доклады представили сотрудники РСК и Selectel. Первая занимается разработкой и внедрением суперкомпьютерных решений на территории России (и не только) и известна своими рекордами по созданию высокоэнергоэффективных систем и систем с высокой плотностью. На мероприятии РСК рассказала о сравнительном тестировании новых узлов «РСК Торнадо» на базе Skylake-SP c узлами на базе Westmere-EX. Как и в примере с МТС, двухсокетное решение на новой платформе оказалось значительно эффективнее четырёхсокетного на старой. К слову, удивляться такой разнице между поколениями не стоит — крупные вычислительные системы обновляются не каждый год, а эксплуатируются минимум 3-4 года после внедрения. 

Что касается Selectel, то мы уже подробно рассказывали об инициативе Selectel Lab. Этот облачный провайдер первым в России предложил заказчикам решения Intel Purley, а в рамках Lab каждый может бесплатно протестировать процессоры Intel Xeon Scalable Processor, ускорители Intel Xeon Phi Knights Landing, FPGA-ускорители на базе Intel Arria 10GX, а также накопители Intel Optane P4800X.

Постоянный URL: http://servernews.ru/962283
23.11.2017 [15:00], Сергей Карасёв

Intel раскрыла данные об уязвимости в подсистеме Management Engine

Intel опубликовала бюллетень безопасности касательно проблемы, выявленной в модуле Management Engine (ME): корпорация признала, что уязвимость затрагивает широчайший перечень процессоров разного класса.

О проблеме рассказала компания Positive Technologies. Чип Intel ME является частью микросхемы системного хаба (PCH). Через PCH осуществляется почти всё общение процессора с внешними устройствами, поэтому Intel ME имеет доступ практически ко всем данным на компьютере. Исследователям удалось найти ошибку, которая позволяет выполнять неподписанный код внутри PCH на любой материнской плате для процессоров семейства Skylake и выше. Подробности можно узнать в нашем материале.

Главная опасность заключается в том, что злоумышленники могут устанавливать в коде Intel ME особые «закладки» (например, шпионское ПО), которые большинство традиционных средств защиты не обнаружат. Более того, система останется полностью работоспособной, а пользователь даже не узнает, что находится под наблюдением.

Итак, в бюллетене Intel говорится, что проблема затрагивает следующие семейства процессоров:

  • Intel Core шестого, седьмого и восьмого поколений;
  • Intel Xeon E3-1200 v5 и v6;
  • Intel Xeon Scalable;
  • Intel Xeon W;
  • Intel Atom C3000;
  • Intel Apollo Lake Atom E3900;
  • Intel Apollo Lake Pentium;
  • Intel Celeron N и J Series.

Корпорация Intel создала специальный инструмент, который поможет администраторам систем под управлением Windows и Linux определить, уязвимо ли их оборудование. 

Постоянный URL: http://servernews.ru/961929
22.11.2017 [23:35], Алексей Степин

Cavium празднует ещё одну победу ARM в серверном сегменте

Архитектура x86 с нами давно. Когда-то её уделом были лишь персональные компьютеры, но в последние годы подавляющее большинство серверных систем и прочих решений класса HPC строятся именно на базе процессоров Intel или AMD. Времена господства таких архитектур, как DEC Alpha или MIPS давно позади, хотя, к примеру, IBM POWER всё ещё сопротивляется активному натиску со стороны Intel Xeon и AMD Opteron/EPYC: в свежем рейтинге TOP500 всего 24 машины из 500 используют отличную от x86 архитектуру.

Но по ряду причин x86 даже с 64-битными расширениями не является оптимальной и особенно в том случае, когда речь заходит о соотношении производительности и энергопотребления. Последнее автоматически тянет за собой и повышенное тепловыделение, что в условиях увеличения плотности размещения узлов в ЦОД и суперкомпьютерах представляет собой серьёзную проблему. У x86 есть и ещё один конкурент — это архитектура ARM, которую долгое время никто всерьёз в качестве серверной не воспринимал.

Широко известный слайд, демонстрирующий эволюцию архитектур суперкомпьютеров

Широко известный слайд, демонстрирующий эволюцию архитектур суперкомпьютеров

Однако ARM это не просто рабочая лошадка в секторе планшетов и смартфонов. Всё зависит от реализации, и некоторые варианты процессоров на базе этой архитектуры обладают весьма серьёзными возможностями. К числу таких чипов относится Cavium ThunderX2. Этот новый чип на базе ARMv8-A был продемонстрирован разработчиками ещё на ISC 2017. Характеристики его выглядят вполне солидно: здесь и 54 ядра с частотой 3 ГГц, и поддержка двухсокетных конфигураций, и шестиканальный контроллер памяти, и 24 порта SATA (и, вероятно, SAS).

Блок-схема ThunderX2

Блок-схема ThunderX2

Нельзя забывать и про встроенную поддержку Ethernet 25G, наличие 32 Мбайт общего кеша L2, интегрированные аппаратные средства шифрования и контроллер PCI Express 3.0. При этом теплопакет, по данным Cavium, не превышает 95 ватт. К сожалению, у нас пока нет возможности проверить это утверждение. Но можно представить себе, какой величины достиг бы этот показатель в случае 54-ядерного Xeon, даже в варианте Skylake. Проникновение ARM в сегмент HPC, впрочем, быстрым назвать нельзя, хотя Cavium вполне заслуженно хвалится своими успехами на этом поприще.

Процессоры Cavium используют пусть и свой, но вполне привычный разъём типа LGA

Процессоры Cavium используют пусть и свой, но вполне привычный разъём типа LGA

Одна из национальных лабораторий Министерства энергетики США — Аргоннская национальная лаборатория — объявила, что планирует установку нового кластера производства Hewlett Packard Enterprise, а основой этого кластера станут именно процессоры Cavium ThunderX2. Надо полагать, что в такой организации, как Министерство энергетики, хорошо понимают всю важность экономичности суперкомпьютеров. Кластер под названием Comanche Wave будет состоять из 32 узлов. В числе прочего его задачей будет оценка применимости ARM в сфере супервычислений и разработка соответствующего программного обеспечения, включая ARM-версию компилятора LLVM.

Потенциальный конкурент Xeon и EPYC: взгляд вблизи

Потенциальный конкурент Xeon и EPYC: взгляд вблизи

Именно Аргоннская лаборатория активно поддерживает альтернативные процессорные архитектуры и славится своими разработками для платформ PowerPC и IBM Blue Gene/Q, так что выбор места установки нового кластера не вызывает удивления. Интересно отметить, что Cavium, по сути, смогла перехватить кусок пирога буквально под носом у Intel, которой не удалось заключить контракт на установку суперкомпьютера Aurora на базе процессоров Xeon Phi Knights Hill. Лишь в 2021 году «синие» повторят попытку с процессорами x86, которые будут доступны к тому моменту. Впрочем, не факт, что это будет именно x86.

Постоянный URL: http://servernews.ru/961897
21.11.2017 [13:21], Геннадий Детинич

Marvell и Cavium объявили о планах по слиянию бизнеса

В понедельник 20 ноября подтвердились слухи о намерении компании Marvell Technology Group Ltd поглотить компанию Cavium. Официальным пресс-релизом компания Marvell Technology сообщила, что советами директоров обеих компаний достигнута обоюдная договорённость о заключении сделки. В дальнейшем она должна быть одобрена акционерами компаний и регулирующими органами. Сумма сделки составит $6 млрд. За каждую акцию Cavium будет отдано $40 и 2,1757 акций Marvell Technology. По итогам торгов на 3 ноября за каждую акцию Cavium, тем самым, предложено по $80.

От контроллеров для SDD и HDD..

От контроллеров для SSD и HDD ...

Для покупки Cavium компания Marvell Technology вынуждена привлечь заёмные средства в объёме $1,75 млрд: $850 млн у Goldman Sachs Bank USA и $900 млн у Bank of America Merrill Lynch. Завершение сделки ожидается к середине календарного 2018 года. Руководить Marvell Technology будет по-прежнему Мэтт Мёрфи (Matt Murphy), а бывший директор Cavium Саид Али (Syed Ali) войдёт в совет директоров Marvell в качестве стратегического советника.

..до серверов на процессорах ARM

... до серверов на процессорах ARM

Слияние Marvell и Cavium приведёт к появлению на рынке компании стоимостью $16 млрд с годовым оборотом свыше $3,4 млрд. В первые полтора года совместной деятельности, прогнозируют в Marvell, от эффекта слияния будет выручено дополнительно от $150 до $170 млн. Сообщается, что бизнес Cavium комплиментарный бизнесу Marvell. Сама Marvell привнесёт в объединённую компанию опыт по разработке беспроводных коммуникационных решений, контроллеров для HDD и SSD и ряда сетевых решений. Компания Cavium добавит в копилку знаний Marvell многоядерные процессоры с поддержкой команд ARM, фирменные сетевые решения, сетевые решения для СХД и решения для защиты данных.

Постоянный URL: http://servernews.ru/961795
12.11.2017 [13:37], Сергей Карасёв

Qualcomm работает над платформой Firetrail — новыми чипами для серверов

Компания Qualcomm Datacenter Technologies, подразделение Qualcomm Incorporated, уже проектирует серверные процессоры следующего поколения.

На днях, напомним, Qualcomm объявила о начале массовых поставок чипов Centriq 2400 для масштабируемых центров обработки данных и облачных платформ. Эти изделия насчитывают до 48 вычислительных ядер, а при производстве применяется 10-нанометровая технология. Количество транзисторов достигает 18 млрд.

Новый проект серверных процессоров Qualcomm получил кодовое имя Firetrail. Информации об этой аппаратной платформе пока, к сожалению, немного. Отмечается лишь, что основой чипов послужат ядра Saphira с архитектурой ARM.

Наблюдатели полагают, что при производстве Firetrail будет применяться технология с нормами 7 нанометров. Хотя есть вероятность, что Qualcomm выберет усовершенствованную 10-нанометровую методику.

Компания Qualcomm отмечает, что в настоящее время наблюдается тенденция перемещения вычислительных ресурсов и IT-инфраструктур в облачную среду. Процессоры серии Centriq 2400 и будущие решения Firetrail при использовании в дата-центрах обеспечат повышенную энергетическую эффективность, что позволит снизить общую стоимость владения.

Более подробную информацию о платформе Firetrail разработчики, по всей видимости, раскроют в следующем году. 

Постоянный URL: http://servernews.ru/961397
09.11.2017 [13:07], Сергей Карасёв

Начались коммерческие поставки 10-нм серверных чипов Qualcomm Centriq 2400

Компания Qualcomm Datacenter Technologies, подразделение Qualcomm Incorporated, объявила о старте коммерческих поставок первых в мире 10-нанометровых серверных процессоров — решений семейства Centriq 2400.

О разработке чипов Centriq 2400 стало известно ещё в декабре прошлого года. Позднее Qualcomm раскрыла детали об этих изделиях. И вот теперь настало время массовых поставок процессоров.

В основу Centriq 2400 положены 64-битные вычислительные ядра с кодовым именем Falkor, обладающие поддержкой команд ARMv8. Количество таких ядер в составе чипов может достигать 48. Максимальная тактовая частота — 2,6 ГГц.

При изготовлении изделий применяется 10-нанометровая технология Samsung  FinFET. Процессоры насчитывают до 18 млрд транзисторов. Каждая пара ядер снабжена 512 Кбайт общей кеш-памяти L2, а объём кеша L3 у чипов достигает 60 Мбайт.

В состав Centriq 2400 вошли 6-канальный контроллер памяти с поддержкой DDR4-2667 МГц ECC (до двух модулей на канал), 32 линии PCI Express 3.0, интерфейсы SATA, USB и пр.

Процессоры ориентированы на современные облачные платформы и центры обработки данных. Более подробную информацию о технических характеристиках можно найти здесь.

Что касается стоимости, то изделие Qualcomm Centriq 2460, насчитывающее 48 вычислительных ядер, обойдётся заказчикам в 1995 долларов США. 

Постоянный URL: http://servernews.ru/961262
02.11.2017 [12:12], Алексей Степин

Qualcomm готовит почву для серверного процессора Centriq

Компанию Qualcomm представлять не надо — множество смартфонов оснащены именно процессорами этого разработчика, и многие пользователи не без оснований считают их лучшими, ставя данную серию выше моделей Samsung Exynos или MediaTek. С другой стороны, архитектура ARM пусть и очень медленно, но всё же проникает на корпоративный рынок, а именно — в сектор серверных решений. Известны проекты таких компаний, как Cavium, Applied Micro и даже AMD. Не стоит удивляться тому, что Qualcomm, имея огромный опыт в разработке процессоров с архитектурой ARM, тоже решила откусить кусочек от готовящегося пирога. Уже в течение двух лет существуют слухи о серверном процессоре Qualcomm, но теперь эти слухи переходят в разряд фактов. Последние несколько месяцев представители компании довольно охотно рассказывали о новом процессоре класса SoC под названием Centriq 2400.

Шестиканальный контроллер памяти обещает отсутствие нехватки ПСП

Шестиканальный контроллер памяти обещает отсутствие нехватки ПСП

Так, теперь известно, что этот чип будет производиться с использованием 10-нанометрового техпроцесса, и главной целевой аудиторией этого продукта станут поставщики облачных услуг и владельцы крупных ЦОД, для которых очень важную роль играют такие параметры, как энергопотребление и энергоэффективность процессоров. Замах Qualcomm взяла серьезный: если верить заявлениям, система на базе одного процессора Centriq сможет предложить уровень производительности, эквивалентный решениям на базе пары процессоров Xeon с архитектурой Skylake. В отличие от Intel, Qualcomm не обязана тянуть за собой тяжкое наследие совместимости с процессорами настольного класса и использует в своей разработке всё лучшее, что было воплощено в чипах для смартфонов и планшетов. Centriq 2400 должен получить 24 процессорных ядра с кодовым названием Falkor. Это архитектура собственной разработки Qualcomm, но отвечающая всем требованиям стандарта ARMv8.

Выглядит Cenriq практически так же, как и обычные Xeon, Opteron или EPYC

Выглядит Cenriq практически так же, как и обычные Xeon, Opteron или EPYC

На диаграмме слово Duplex присутствует не зря, поскольку в целом можно говорить о 48 однопоточных ядрах, но в будущем компания планирует наращивать и количество ядер, и количество потоков на ядро. Интересен также тот факт, что Intel отказалась от кольцевой внутренней шины в новых Xeon, а Qualcomm, наоборот, пришла к этой идее. Контроллер памяти DDR4 у Centriq шестиканальный и дополненный, к тому же, средствами аппаратного сжатия данных. Имеется встроенная поддержка сетевых стандартов 10 и 100 GbE, 32 линии PCIe (скорее всего, 3.0) и функций южного моста, а также развитая подсистема управлением питанием. В рамках Open Compute Project компания уже разработала две референсные платформы формата 1U — с одним либо с двумя процессорными разъёмами под Centriq. Пока это практически всё, что известно о Сentriq 2400. Кое-что было опубликовано нами ранее, но пока мы не знаем тактовых частот и сроков начала массовых поставок. Однако судя по имеющимся сведениям, Qualcomm решила заняться развитием серверной ветки ARM всерьёз и надолго.

Постоянный URL: http://servernews.ru/960898
28.10.2017 [20:49], Алексей Степин

NEC представила новую платформу SX-Aurora TSUBASA с векторными ускорителями

Векторные процессоры NEC Aurora были представлены ещё на ISC 2017. Уже тогда была продемонстрирована возможность использования таких чипов в качестве сопроцессоров на платах расширения с разъёмом PCI Express. Назывались такие платы Vector Engine. От образцов к серийному производству путь оказался недолог: уже 26 октября компания объявила о доступности новых систем SX-Aurora TSUBASA. Это название с японского можно перевести как «крылатая». Как и предполагает концепция NEC SX, основную работу выполняют векторные процессоры, но в этой системе они используются исключительно в виде плат расширения.

Процессор с архитектурой x86 выполняет только вспомогательные задачи, в терминологии компании-разработчика он называется Vector Host. На его плечи ложатся управление подсистемой ввода-вывода, обработка вызовов ОС и прочие вспомогательные вычисления, в том числе скалярные. Основная вычислительная мощь SX-Aurora TSUBASA кроется именно в ускорителях Vector Engine. Каждый чип Vector Engine имеет 8 ядер и развивает производительность порядка 2,45 терафлопс, что в пять раз больше векторных систем NEC SX-ACE, относящихся к предыдущему поколению. Поскольку шина PCI Express может стать узким местом, на борту каждого процессора имеется некоторый объём быстрой многослойной памяти HBM2, которая играет роль своеобразного кеша. Шесть сборок гарантируют ПСП на уровне 1,2 Тбайт/с. Сами платы могут иметь как пассивное, зависящее от хост-системы охлаждение, так и активное с собственным вентилятором на борту. Теплопакет по имеющимся данным составляет около 300 ватт — вполне на уровне современных видеокарт.

Серверы серии TSUBASA могут содержать в своём составе от 1 до 8 карт Vector Engine вплоть до 64 ускорителей на стойку. Эта стойка, изображённая на первом снимке, уже сама по себе считается суперкомпьютером. В сравнении с самым мощным ускорителем NVIDIA (7,8 терафлопс) векторный процессор NEС развивает всего 31 % его мощности, зато по показателю ПСП заметно опережает своего соперника (1,2 Тбайт/с против 900 Гбайт/с). Кроме того, в ряде задач специализированная архитектура NEC показывает себя более эффективной. Поскольку архитектура NEC не имеет аналогов, компания поставляет своим клиентам не только аппаратные комплексы, но и соответствующие программные решения: компиляторы, библиотеки MPI и прочее системное ПО. Используется даже уникальная файловая система NEC Scalable Technology File System и диспетчер задач NEC Network Queuing System V. Гарантируется бинарная совместимость с машинами NEC SX предыдущего поколения.

Постоянный URL: http://servernews.ru/960659