Материалы по тегу: cpu

13.11.2020 [18:00], Алексей Степин

Южная Корея близка к созданию собственного процессора для суперкомпьютеров

Мощные многоядерные процессоры, могущие служить основой суперкомпьютерных комплексов и кластерных систем могут разрабатывать, а тем более производить, не так уж много стран. Но любое государство, претендующее на независимость в IT, хорошо понимает, что в современном мире такая возможность может оказаться ключевой. Именно поэтому создан консорциум European Processor Initiative, именно для этого КНР, Япония и Россия разрабатывают свои многоядерные чипы. Теперь в игру вступает и Южная Корея.

Концепция процессора для сферы супервычислений может отличаться кардинально: так, Европа и Япония предпочитают архитектуру ARM, Европа присматривается и к RISC-V, а Россия делает основную ставку на VLIW (семейство «Эльбрус»). Японские процессоры Fujitsu A64FX тоже основаны на ARM, но заметно отличаются от всех остальных чипов: набор инструкций SVE, HBM-память и встроенный интерконнект.

Южнокорейский институт электроники и телекоммуникаций (ETRI), ведущий свой проект совместно с ARM, объявил о том, что стал ещё на шаг ближе к созданию собственного уникального процессора класса HPC. Уникальность южнокорейской разработки в том, что она должна обеспечивать как высокую производительность в традиционных суперкомпьютерных задачах, обычно использующих вычисления двойной точности (FP64), так и невысокий уровень энергопотребления в «низкоточных» задачах (инференс, машинное обучение и тому подобные сценарии).

Спецификации, поставленные перед южнокорейскими разработчиками, довольно серьёзны: финальный вариант процессора должен обеспечивать 2,5-кратное превосходство над классическими ускорителями (обычно на базе графических чипов), но при этом быть на 60% экономичнее них. Это должно достигаться за счёт уникальной реализации управления питанием и тактовыми частотами отдельных компонентов процессора. Речь идёт как об аппаратной составляющей, так и о разработке собственного программного стека, позволяющего тонко манипулировать режимами работы нового ЦП.

Заявлена возможность интеграции собственных блоков ускорителей, совместимых с уже существующими фреймворками за счёт поддержки OpenMP и OpenCL. Процессор в полной мере сохранит классический режим вычислений с двойной точностью. Текущий прототип получил название K-AB21, причём AB означает «Artificial Brain» (искусственный мозг) — разработчики заявляют, что за счет активного использования матричных ядер (XPU) им удалось достичь производительности 16 Тфлопс на процессор. Это обещает до 1600 Тфлопс на стойку. Процессор с такой производительностью должен открыть Южной Корее дорогу к собственным суперкомпьютерам экзафлопсного класса.

Компоновкой K-AB21 отчасти напоминает Fujitsu A64FX, поскольку также предусматривает наличие пула HBM2 в виде четырёх сборок, однако это не единственная его память. HBM выступает скорее в роли ещё одного уровня кеша, а основной объём составляют модули DDR5. Вычислительная часть состоит из классических ARM-ядер Zeus и многопоточных масштабируемых ядер XPU собственной разработки ETRI. Их-то разработчики и называют «матричными ядрами», поскольку работа с матричной математикой главная задача этих ядер.

Группы таких ядер, называемые доменами XEMC на схеме (всего их в каждом процессоре 4), имеют свой MMU, а также собственные подсистемы кешей и программируемых блоков логики с поддержкой SMT. За соединение частей процессора между собой отвечает внутренняя сеть с ячеистой (mesh) топологией. Текущая реализация K-AB21 также включает в себя шесть контроллеров шины PCI Express 5.0, каждый на 16 линий.

В настоящее время разработчики заняты финализацией отдельных элементов дизайна K-AB21, но в целом разработка близка к завершению. Полноценная реализация «в кремнии» ожидается к концу 2021 года, что для проекта такого масштаба достаточно быстро и позволит Южной Корее вовремя войти в эру суперкомпьютеров экза-класса.

В настоящее время самым мощным южнокорейским кластером является Nurion, занимающий 17 место в Top500. Однако это система Cray CS500 на базе Intel Xeon Phi 7250, которая целиком базируется на технологиях США, а выпуск собственного HPC-процессора позволит Южной Корее стать более независимой в этом аспекте.

Постоянный URL: http://servernews.ru/1025344
10.11.2020 [23:39], Владимир Мироненко

AMD представила процессоры Ryzen Embedded V2000 с архитектурой Zen 2

Компания AMD представила процессоры Ryzen Embedded нового поколения на основе 7-нм архитектуры Zen 2, предназначенные для промышленного и коммерческого сегментов и ориентированные на корпоративных заказчиков, которым требуется лучшая в своем классе производительность при более низких показателях TDP.

Новая серия AMD Ryzen Embedded V2000 предлагает в BGA-исполнении до восьми ядер Zen 2, графику Radeon (до 7 блоков) и 20 линий PCIe 3.0. Как и ожидалось, серия включает четыре модели, две из которых — V2748 и V2546 — имеют более высокое значение TDP и более высокие показатели тактовой частоты, а чипы V2718 и V2516 отличаются более низким энергопотреблением и меньшей тактовой частотой. Все CPU поддерживают двухканальную память DDR4-3200 ECC.

AMD Ryzen Embedded серии V2000 обеспечивают по сравнению с предыдущим поколением двойное превосходство в многопоточной производительности (на Ватт), до 30 % более высокую однопоточную производительность и прирост до 40 % для графической производительности. Помимо превосходства по сравнению с предыдущим поколением в скорости работы, новые процессоры оснащены расширенными функциями безопасности, помогающими защитить от несанкционированного доступа к памяти или критически важному программному обеспечению.

GPU в новых SoC поддерживают DirectX 12 и Vulkan, а также могут (де-)кодировать видео и поддерживают до четырёх дисплеев с разрешением 4K и частотой 60 Гц. Для одиночного дисплея максимальное разрешение составляет 4096x2160. Доступно четыре видеовыхода HDMI 2.1 или DP 1.4, а также четыре порта USB 2.0 и четыре порта USB 3.1 Gen2. Для накопителей имеется два порта SATA-3. Среди интерфейсов также имеются GPIO, I2C, LPC, SMBus, SPI, UART, SOUNDWIRE.

Компания гарантирует доступность Ryzen Embedded V2000 заказчикам в течение следующих десяти лет. Первыми по запуску продуктов на процессорах серии AMD Ryzen Embedded V2000 станут компании Advantech, ASRock Industrial, iBase, Sapphire и другие партнёры AMD по экосистеме. Отмечается, что новинки являются заметным прорывом в этом сегменте, где преобладают четырёхъядерные чипы.

Постоянный URL: http://servernews.ru/1025051
05.11.2020 [15:14], Владимир Мироненко

Marvell отказывается от серверных ARM-процессоров ThunderX3?

Весной этого года Marvell анонсировала ThunderX3, одни из самых многообещающих серверных процессоров с ядрами ARM. Однако уже летом Marvell объявила, что сосредоточится на создании специализированных ARM-чипов, что поставило под вопрос будущее ThunderX3. А согласно последним слухам, у этого продукта начались более серьёзные проблемы.

Как сообщает ресурс PROHARDVER!, за последнюю неделю сразу несколько источников в отрасли сообщили о проблемах, связанных с разработкой кастомных ядер ARM. Сообщается, что рынок гиперскейлеров, на который была ориентирована новая стратегия Marvell, всё ещё с недоверием относится к чипам с кастомными ядрами ARM. Ситуация довольно странная, потому что на уровне архитектуры совместимость ПО сохраняется при отличиях в дизайне ядер. Хотя если когда-либо начнётся массовая миграция на ARM, то для всех поставщиков было бы оптимальным предлагать одинаковый дизайн ядер.

Конечно, в долгосрочной перспективе цель крупной компании состоит в том, чтобы не закупать процессоры у кого-либо, а разработать собственный дизайн чипа, в который можно было бы перенести одно из лицензируемых ядер Neoverse без изменений. Amazon AWS давно предлагает инстансы на собственных процессорах Graviton, а теперь переносит на ARM и другие сервисы. Но в то же время крупным игрокам нужны относительно дешевые аналоги: Microsoft пробует всё те же ThunderX, а Oracle собирается внедрить Ampere.

Marvell, как сообщается, не может справиться с этой проблемой в настоящее время. Более того, поступили сообщения об увольнении более ста инженеров, а главного архитектора ThunderX компания лишилась ещё весной. Косвенно эти данные на прошлой неделе подтвердил ресурс SemiAccurate. Это также может повлиять на разработку процессоров ThunderX4 следующего поколения, хотя ещё не всё может быть потеряно.

Несбывшиеся планы

Несбывшиеся планы

Основные затраты по проектированию чипа приходятся на процесс подготовки к производству. Однако гораздо удобнее разрабатывать IP-блоки, включая процессорные ядра, особенно если этого будет достаточно, чтобы создать собственные чипы ARM и точно настроить их. Это направление, конечно, гораздо менее прибыльное, но все же лучше, чем «обнулить» бизнес-направление целиком. Marvell может заняться оценкой потребностей отдельных компаний и тех, кто думает о переходе на собственные чипы, затем заключить с ними договор, чтобы помочь разработать оптимальный процессор.

ThunderX3 является наглядным доказательством способности компании создать производительный и энергоэффективный чип. Не говоря уже о том, что ряд IP-блоков Marvell, а не только процессоры, будут доступны для заинтересованных компаний. Кроме того, портфель Marvell может быть дополнен решениями Inphi. Это реальная альтернатива даже для крупных компаний, создающих гипермасштабируемые центры обработки данных, потому что есть источник, который может предоставить множество IP-блоков за пределами ARM, которые также необходимы для создания эффективного серверного решения.

Постоянный URL: http://servernews.ru/1024604
26.10.2020 [20:34], Илья Коваль

Российские процессоры «Эльбрус-32С» проектируются под нормы 6-7 нм

Генеральный директор АО «МЦСТ», разработчика отечественных процессоров «Эльбрус», в интервью журналу «Эксперт» рассказал о планах компании по разработке процессоров следующего поколения.

В частности, было сказано о том, что в этом году компания начнёт работу над процессором «Эльбрус-32С», который, судя по маркировке, принятой в данном семействе чипов, должен получить 32 ядра. Данная модель станет самым быстрым CPU серии и будет ориентирована на высокопроизводительные вычисления (HPC) и системы хранения данных (СХД). Разработку планируется завершить к 2025 году; выпускаться процессоры будут на базе техпроцесса 6-7 нм.

Инжеренерный образец процессора «Эльбрус-16С»

Инжеренерный образец процессора «Эльбрус-16С»

На данный момент наиболее мощным процессором МЦСТ является модель «Эльбрус-8СВ». На их основе создаются серверные системы, СХД и суперкомпьютеры. Младшие процессоры с меньшим числом ядер используются в клиентских и встраиваемых решения. Материалы о них можно найти на нашем сайте по соответствующему тегу. В интервью также приведена любопытная цифра о суммарном количестве произведённых процессоров — это 20 тыс. штук. Правда, явно не говорится, о каких именно моделях идёт речь.

Прямо сейчас в разработке у МЦСТ находится процессор «Эльбрус-16С», инженерные образцы которого были получены в начале октября, а также «Эльбрус-12С». Оба чипы выполнены по нормам 16 нм, а завершение их разработки запланировано на 2021 год. 16-ядерная модель будет работать на частоте 2 ГГц и обеспечит производительность до 750 ГФлопс на операциях двойной точности и до 1,5 ТФлопс для одинарной точности. Решения на основе данных CPU появятся в 2022-2023 годах.

Постоянный URL: http://servernews.ru/1023852
14.10.2020 [16:00], Игорь Осколков

Intel Xeon Ice Lake-SP получат функции полного шифрования памяти, новые возможности SGX и аппаратную защиту платформы

Первые партии Intel Xeon Scalable третьего поколения, известные как Ice Lake-SP должны появиться в конце этого года, а массовый запуск, судя по всему, будет уже в следующем. Тем не менее, Intel постепенно делится информацией о грядущих новинках. Сегодня компании рассказала о новых функциях, направленных на повышение защиты и безопасности.

Первый анонс касается расширения возможностей Intel Software Guard Extensions (SGX) и AES-шифрования памяти. Сама по себе технология SGX не новая и уже довольно давно присутствовала в клиентских процессорах, а также в Xeon E. Intel SGX позволяет создавать выделенные, зашифрованные анклавы в оперативной памяти, куда имеет доступ только приложения (Ring 3), а ОС, гипервизор и прочие компоненты такого доступа не имеют. Для общения с памятью используется отдельный набор из 18 команд.

В Ice Lake-SP получили два значительных улучшения. Во-первых, операции собственно (де-) шифрования теперь имеют аппаратную реализацию, что значительно ускоряет процесс. Во-вторых, суммарный объём анклавов тоже заметно вырос — до 512 Гбайт на сокет или до 1 Тбайт для типовой двухсокетной машины. В старых CPU объём был 64-256 Мбайт, так что в такие анклавы приходилось складывать только наиболее ценные данные. Второе важное нововведение — поддержка полного прозрачного шифрования всей оперативной памяти Total Memory Encryption (TME), тоже с аппаратным ускорением.

Увы, Intel пока не делится подробностями об особенностях реализации новых функций. В частности, нет данных о том, каково максимальное количество анклавов и, соответственно, отдельных ключей шифрования может быть в системе, а также о том, как новые функции сочетаются с памятью Optane PMem, которая имеет собственный механизм принудительного шифрования в каждом модуле. Вероятно, в текущем виде в реальной системе придётся отказаться от одной из технологий.

Появление новых технологий шифрования памяти важно для концепции конфиденциальных вычислений (Confidential Computing), которая крайне актуальна для стремительно набирающих в условиях пандемии облачных сред — шифрования и изоляция данных в многопользовательской среде критически важна. Такие возможности в том или ином виде уже предлагают или изучают все крупные облачные провайдеры. А поддержка «старых» SGX присутствует в Microsoft Azure c 2015 года. Правда, Intel пока находится в догоняющих — AMD EPYC 7002 с аппаратным ускорением шифрования памяти SME и SEV появились больше года назад и постепенно проникают в облака.

Частично о нововведениях Intel уже рассказывала на Hot Chips 32. И сегодня ещё раз напомнила, что в Ice Lake-SP будет целый ряд новых инструкций для ускорения шифрования, генерации ключей, подписей, хеширования и так далее. Все они нужны для типовых операций, которые используются в наиболее распространённом ПО . Как и прежде, Intel активно сотрудничает с разработчиками, чтобы поддержка новых функций была готова к моменту выходу Ice Lake-SP на массовый рынок. Она даже организовала консорциум Confidential Computing Consortium.

Наконец, последняя новинка — Intel Platform Firmware Resilience (Intel PFR), система защиты от низкоуровневых атак на платформу в целом (по стандарту NIST-800-193). Она включает отдельную FPGA, которая контролирует работу других компонентов: микросхемы памяти BIOS и BMC, системные шины, Intel ME и прочее firmware, включая прошивку блоков питания. PFR позволяет определить и предотвратить вмешательство в низкоуровневые компоненты, а использование FPGA позволит конечным производителям кастомизировать системы под нужды конкретных заказчиков и индустрий в целом.

Постоянный URL: http://servernews.ru/1022927
07.10.2020 [14:27], Сергей Карасёв

Инженерный образец российского процессора «Эльбрус-16С»: 16 ядер, 2 ГГц, 8 каналов DDR4-3200 и 750 Гфлопс FP64

На форуме Микроэлектроника-2020 продемонстрирован инженерный образец перспективного российского процессора «Эльбрус-16С» с архитектурой «Эльбрус» шестого поколения. Разработкой данного чипа занимаются специалисты АО «МЦСТ» при поддержке Министерства промышленности и торговли Российской Федерации (Минпромторг).

Источник фотографий: imaxai.ru

Источник фотографий: imaxai.ru

Конфигурация «Эльбруса-16С» включает 16 вычислительных ядер и восемь каналов оперативной памяти DDR4-3200 ECC, а также 40 Мбайт L3-кеша. Предусмотрено наличие сетевых контроллеров 10 Gigabit Ethernet и 2,5 Gigabit Ethernet, 32 линий PCI-Express 3.0 и четырёх каналов SATA 3.0.

Отмечается, что «Эльбрус-16С» станет первым процессором на основе российских технологий, для которого предусмотрена 16-нанометровая методика производства. Более того, это первый универсальный чип «Эльбрус» с аппаратной поддержкой виртуализации и первый микропроцессор семейства, штатно работающий на частоте 2 ГГц.

Общее число транзисторов в чипе составит 12 млрд. Изделие сможет использоваться в составе четырёхпроцессорных систем с общим объёмом оперативной памяти до 16 Тбайт. Процессор обеспечивает быстродействие до 1,5 ТФлопс на операциях одинарной точности и до 750 ГФлопс на операциях двойной точности.

Разработка решения «Эльбрус-16С» началась в 2018 году, закончить её планируется в 2021 году. «Подтверждение готовности к серийному производству ожидается в конце 2021 года. Процессор будет соответствовать требованиям к российским интегральным схемам 2-го уровня в рамках постановления правительства Российской федерации от 17 июля 2015 г. № 719», — отмечает АО «МЦСТ».

Постоянный URL: http://servernews.ru/1022401
25.09.2020 [21:31], Илья Коваль

Серверные архитектуры Arm Neoverse N2 и V1 всё-таки относятся к поколению ARMv8, а не ARMv9

Анонс новых платформ Neoverse V1 (Zeus) и N2 (Perseus) на этот раз оказался несколько скупым. Разработчики рассказали об основных возможностях и сферах применения будущих чипов, но при этом даже опосредованно не указали, к какому поколению их архитектура относится. Что, в свою очередь, привело к подозрениям, что они являются первыми представителями ARMv9.

Спешим обрадовать (или расстроить), что это не так. Ресурс Phoronix обратил внимание на первую серию подготовительных патчей, которые Arm начала рассылать буквально через несколько дней после презентации, что само себе не слишком типично и косвенно указывает на относительно скорый выход первых продуктов на базе новых дизайнов компании.

И в них указывается, что Neoverse N2 относится к поколению ARMv8.5-A, а V1 «приписан» к ARMv8.4-A. Также указывается поддержка SVE/SVE2, работа с числами FP16/Bfloat16 и матричные операции с INT8. Таким образом, можно предположить, что ARMv9 появится не раньше 2022 года и станет основной для Poseidon. На текущий момент в действительно массовом производстве находятся чипы на базе ARMv8.2-A, а решения с ARMv8.3-A появятся в конце этого и начале следующего года.

Постоянный URL: http://servernews.ru/1021563
25.09.2020 [19:53], Владимир Мироненко

NUVIA, обещающая побороть AMD и Intel в серверах, получила $240 млн для производства первых чипов

Стартап NUVIA, основанный бывшими топ-менеджерами Apple, сообщил о завершении раунда финансирования серии B в размере $240 млн. До этого NUVIA провёл раунд финансирования серии A, в результате которого было привлечено $53 млн инвестиций от Dell Technologies Capital и ещё нескольких фирм из Кремниевой долины.

Нынешний раунд финансирования возглавила инвестиционная фирма Mithril Capital, соучредителем которой является один из первых инвесторов Facebook Inc. Питер Тиль (Peter Thiel), в партнёрстве с основателями Marvell Technology Group Сехатом Сутарджа (Mithril Capital) и Вейли Дай (Weili Dai), а также фондами и аккаунтами под управлением BlackRock, Fidelity Management & Research Company и Temasek при участии Atlantic Bridge, Redline Capital, Capricorn Investment Group, Dell Technologies Capital, Mayfield, Nepenthe LLC и WRVI Capital.

Базирующаяся в Санта-Кларе (штат Калифорния) NUVIA была основана в прошлом году с целью разработки ARM-процессоров для ЦОД, которые будут быстрее и энергоэффективнее существующих решений x86-64 от AMD и Intel, доминирующих на рынке. В этом должен помочь опыт команды бывших сотрудников Apple в создании мощных чипов для устройств с питанием от батарей.

Руководители NUVIA заявили, что финансирование поможет компании завершить разработку своих чипов, первый из которых, по их ожиданиям, поступит к клиентам к 2022 году. Компания нацелена на клиентов, которые управляют крупными ЦОД, в основном использующими чипы Intel и AMD. NUVIA не раскрывает потенциальных клиентов, хотя и сообщила, что сотрудничает с Dell Technologies Inc, чьё подразделение венчурного капитала произвело в неё инвестиции.

NUVIA также отказалась сообщить, присоединится ли Тиль или кто-либо из Mithril к её правлению в связи с успешным раундом финансирования. Ранее сообщалось, что NUVIA работает над созданием SoC Orion, в составе которого будет ARM-процессор Phoenix.  Следует отметить, что Питер Тиль — член правления Facebook, одного из крупнейших покупателей микросхем для центров обработки данных.

Впрочем, есть и неприятные новости. В начале сентября компания покинул вице-президент по программному обеспечению Джон Мастерс (Jon Masters), который вернулся в Red Hat, где до этого проработал 14 лет и отвечал за разработку для ARM-платформ. Он присоединился к Nuvia в ноябре прошлого года, как раз после первого раунда финансирования. А вот второго раунда по каким-то причинам не дождался.

Постоянный URL: http://servernews.ru/1021557
23.09.2020 [16:00], Алексей Степин

Intel представила новые 10-нм индустриальные процессоры: от Atom x6000E до Core i7 Tiger Lake

На мероприятии Intel Industrial Summit компания показала новые решения для периферийных вычислений и промышленных систем: платформу Atom x6000E, а также новые процессоры Pentium и Celeron серий N/J и индустриальные версии Core i3/i5/i7 11-го поколения известного как Tiger Lake. Для x6000E, Pentium и Celeron используется классический, «старый» 10 нм, а кристаллы Tiger Lake производятся с использованием «нового» 10 нм, так называемого SuperFIN.

Платформа Intel Atom x6000E (Elkhart Lake) универсальна и позволяет решать широкий круг задач. Она может применяться в производящей промышленности и энергетике, в системах управления «умного города», в здравоохранении и медицине и во многих других отраслях, где требуется обработка достаточно серьёзных входных потоков данных в реальном времени. При этом платформа отвечает самым строгим требованиям безопасности.

По сравнению с предыдущими процессорами Atom аналогичного назначения в серии x6000E однопоточная производительность возросла в 1,7 раза, многопоточная — в 1,5 раза, а производительность графической подсистемы вдвое. Для повышенной временной точности в новинках реализована поддержка технологий Intel Time Coordinated Computing (TCC) и Time-Sensitive Networking (TSN).

Как и полагается современной SoC для периферийных вычислений, в составе x6000E имеются блоки критографических ускорителей, а для IoT имеется интегрированный микроконтроллер ARM Cortex-M7, отвечающий за работу Intel Programmable Services Engine (Intel PSE). Он работает независимо от остальных блоков и предоставляет возможности удалённого управления SoC, обработки низкоскоростного ввода-вывода от различных сенсоров, запуск приложений реального времени и синхронизацию. Есть также и чисто аппаратные средства обеспечения ИТ-безопасности, объединённые под именем Intel Safety Island.

Также в целях обеспечения надёжности реализован широкий спектр средств удалённого мониторинга и управления, как в режиме in-band, так и в out-of-band. Включение, выключение, сброс и перезагрузку можно выполнять даже если система в целом не отвечает. Модели Atom x6427FE и x6200FE отвечают стандартам функциональной безопасности IEC 61508 и ISO 13849, они прошли соответствующую сертификацию, так что использовать их можно и в системах жизнеобеспечения, в комплексах управления АЭС или нефтеперабатывающего предприятия.

Серия Intel Atom x6000E включает в себя процессоры с двумя или четырьмя ядрами, их частотный диапазон составляет от 1,0 до 1,9 ГГц, в турборежиме частота может временно увеличиваться до 3,0 ГГц. Аналогичные частотные формулы имеют и Pentium/Celeron, базирующиеся на ядрах Tiger Lake (11 поколение). Контроллер памяти может работать либо с LPDDR4x (4×32 бита, максимум 4267 Мт/с, 16 Гбайт при 3200 МГц, всего до 64 Гбайт) или DDR4 (2×64 бита, 3200 Мт/с, максимум 32 Гбайт, всего до 64 Гбайт), есть поддержка in-band ECC для обычных модулей без ECC. Объём кеша составляет 1 Мбайт у самой младшей модели, во всех остальных случаях он равен 1,5 Мбайт.

В соответствии с современными требованиями к графике, новинки Atom поддерживают подключение до трёх независимых дисплеев с разрешением 4K при 60 Гц, для этого служат интерфейсы Display Port 1.3 и HDMI 2.0b. Также поддерживается подключение экранов по eDP или MIPI DSI. Сам графический движок Intel UHD Graphics может иметь конфигурацию с 16 или 32 исполнительными блоками, работающими на частоте до 400 МГц, а в турборежиме — и до 800 МГц. Они поддерживают различные режимы вычислений для работы в качестве инференс-системы. Новые SoC Intel выполнены в едином корпусе FCBGA1493, однако под крышкой скрываются два кристалла — вычислительный и PCH.

У более мощных процессоров с ядрами Tiger Lake графика тоже намного мощнее, она представлена блоками Iris Xe, которых в составе чипа может быть до 96, к тому же новая графическая архитектура лучше подходит для систем принятия решений (инференс) и задач машинного зрения. Такая графическая подсистема может одновременно обрабатывать до 40 потоков видео в формате 1080p при 30 кадрах в секунду, а выводить — либо четыре потока 4K, либо два, но уже в 8K.

Подобные мощности позволяют использовать Tiger Lake в системах, для которых требуется детерминированная, строго синхронизированная по времени работа, либо в гибких системах машинного зрения с ИИ-компонентами. Безопасности способствует возможность полного шифрования содержимого оперативной памяти.

Коммуникационные возможности новых промышленных процессоров Intel также соответствуют требованиям времени: новые SoC несут на борту три MAC-контроллера, способных работать на скорости 2,5 Гбит/с, причём, в моделях с поддержкой TSN обеспечивается режим реального времени с минимальными задержками. Также общение «с внешним миром» происходит посредством 8 линий PCI Express 3.0, четырех портов USB 3.1 и 10 портов USB 2.0. Имеется два порта для подключения флеш-накопителей с интерфейсом UFS 2.0. В референсной платформе Intel реализована и поддержка UART и JTAG (разъём MIPI-60).

У более мощных Tiger Lake из серий i3/i5/i7 возможности несколько иные: встроенных MAC два, один из которых работает в режиме 1GbE, другой поддерживает cкорость 2,5GbE, в некоторых моделях дополнен поддержкой Time-Sensitive Networking. Поддерживается подключение дискретного сетевого контроллера I225LM/IT. Что касается беспроводной части, то имеется поддержка Wi-Fi со скоростями до 1,73 Гбит/с, а также Bluetooth 5.0. Для расширения инференс-способностей поддерживается подключение дополнительного ускорителя Intel из серии Movidius. Также реализованы стандарты PCIe 4.0 (четыре линии) и Thunderbolt/USB 4 (четыре порта).

Теплопакеты достаточно скромные: от 4,5 до 12 Ватт у Atom, до 28 Ватт у Tiger Lake. Улучшенный техпроцесс позволяет последним быть существенно быстрее аналогичных Core 8 поколения, в зависимости от характера нагрузки это до 23% (однопоточная) или до 19% (многопоточная), а графическая подсистема и вовсе практически в три раза быстрее за счёт новой архитектуры.

Новые процессоры имеют широкий спектр программной поддержки. В первую очередь, это, естественно, Microsoft Windows 10 IoT Enterprise и Yocto Project Linux, разрабатываемая сообществом Yocto совместно с Intel. Поддерживается также запуск Ubuntu, Wind River Linux LTS и Android 10 (только 64-битная версия). Для Tiger Lake также заявлена совместимость с Wind River VxWorks.

В качестве загрузчика может использоваться как обычный BIOS/UEFI, так и открытые Intel Slim Bootloader и coreboot. Часть, отвечающая за подсистемы безопасности и реального времени, работает под управлением Zephyr RTOS, также открытой. В число партнёров Intel, отвечающих за код BIOS, входят American Metatrends, Thundersoft, Byosoft, Insyde и Phoenix.

Для создания ПО компания предлагает расширенный комплект разработчика: инструменты для реализации Time Coordinated Computing, Intel Media SDK, набор Intel для OpenVINO, Intel System Studio и Intel Context Sensing SDK. Intel понимает всю важность рынка периферийных вычислений, за которым, судя по всему, будущее промышленности: любая производственная задача будет неизбежно порождать серьёзные потоки данных и требовать от системы управления минимальных задержек. Именно поэтому периферийные вычислительные устройства, к которым относятся и новые процессоры Intel, столь важны. Неудивительно, что компания уделяет много внимания как аппаратным возможностям, так и программным компонентам в новой платформе.

Постоянный URL: http://servernews.ru/1021151
22.09.2020 [20:32], Игорь Осколков

От периферии до облаков: Arm представила серверные платформы Neoverse V1 Zeus и N2 Perseus с поддержкой SVE, PCIe 5.0, DDR5 и HBM

Компания Arm объявила о расширении своего портфолио серверных решений семейства Neoverse, представив сразу два варианта платформы. Новая серия V и её первенец V1 под кодовым именем Zeus вместе с N2 (Perseus) получат поддержку SIMD-расширений SVE и формата bfloat16, а также интерфейсы PCIe 5.0, DDR5 и HBM.

Однако отличия между ними весьма существенны. В Neoverse V1 в отличие от N2 Arm отказывается от традиционной оптимизации сразу по трём направлениям — энергопотребление, производительность и площадь кристалла — и делает упор на мощность. Вероятно, основой для них станут вариации Cortex-X1. Эти чипы будут потреблять больше энергии и будут физически больше, но взамен предложат значительное увеличение размеров буферов, кешей, окон и очередей. Показатель IPC для одного потока будет увеличен на впечатляющие 50% в сравнении с Neoverse N1.

А новые техпроцессы 5 и 7 нм позволят повысить частоты будущих процессоров. Так что они потенциально смогут соревноваться с грядущими платформами x86-64 не только по показателю производительность на Ватт, но и в чистой производительности. Поспособствует этому и долгожданное официальное появление векторных инструкций Scalable Vector Extension (SVE) в составе самого ядра. Их отличительной чертой (от SSE/AVX) является нефиксированная ширина — производители конкретных SoC могут реализовать поддержку от 128 до 2048 бит с шагом в 128 бит. При этом SVE-код будет работать на любом из них, просто скорость обработки данных будет разной.

Конкретно в V1 Arm заложила два блока SVE-256. Это явно хуже пары SVE-512 в Fujitsu A64FX, единственном «кремнии», который уже поддерживает новые инструкции, но всё равно в два раза лучше, чем у N1 с двумя «старыми» 128-бит NEON. Так что мы вполне можем увидеть в будущем ориентированные на высокопроизводительные вычисления решения от других компаний. Этому поспособствует и поддержка памяти HBM2e. Опять-таки, в A64FX она была нужна именно для того, чтобы SVE-блоки не «голодали». Кроме того, обновлённые спецификации SVE включают и поддержку формата bfloat16, актуального для нейронных сетей.

Arm Neoverse V1 формально доступен уже сейчас. Первыми процессорами на базе этой архитектуры должны стать 72-ядерные SiPearl Rhea, которые вместе с другими чипами, уже на базе открытой архитектуры RISC-V, лягут в основу будущих европейских суперкомпьютеров. Таким образом Евросоюз надеется получить большую независимость от технологий США. Впрочем, объявленная сделка между NVIDIA и Arm может расстроить эти планы. Следующим крупным лицензиатом V1 может стать Ampere, которая готовится выпустить в 2022 году процессоры Siryn.

Что касается архитектуры Neoverse N2, то она появятся уже в следующем году, а лицензирование начнётся в конце этого. Она также получит поддержку SVE и bfloat16, но в виде двух 128-бит блоков. Будет внедрена поддержка HBM3, CXL 2.0 и CCIX 2.0. В N2 Arm придерживается своего традиционного подхода, так что прирост IPC в однопотоке составит «всего лишь» до 40% в сравнении с N1, но при этом сохранятся те же уровень энергопотребления и площадь ядра. Можно предположить, что основной для неё станет Cortex-A78.

Именно N2 должна стать наиболее массовой платформой благодаря масштабируемости. Arm видит различные варианты дизайнов будущих SoC. От 8 до 16 ядер с TDP 20-35 Вт пойдут в экономичные решения на самой границе сети, варианты на 12-36 ядер с TDP от 30 до 80 Вт могут стать основой периферийных вычислений, а сборки с числом ядер от 32 до 192 и с TDP от 80 до 350 Вт займут место в мощных серверах, включая облачные. Пока что единственным более-менее массовым решением на базе Neoverse N1 владеет Amazon — в мае в AWS появились инстансы на базе 64-ядерных Graviton2.

После 2022 года выйдет следующее поколение Neoverse под кодовым именем Poseidon. Про него пока говорится в общих чертах, что оно станет производительнее на 30%, получит улучшения по части векторных инструкций и машинного обучения, обзаведётся поддержкой будущих версий CCIX и CXL, а также предложит более плотную упаковку ядер.

Постоянный URL: http://servernews.ru/1021265
Система Orphus