Материалы по тегу: разработка

17.09.2020 [15:23], Алексей Степин

Microchip представила первый комплект разработчика на базе RISC-V стоимостью менее $500

Помимо вездесущей x86 и популярной ARM понемногу набирает обороты архитектура RISC-V; как считают разработчики Linux, к 2030 году только эта троица будет доминировать на рынке массовых процессоров общего назначения. Но если x86 и ARM имеют за собой огромную поддержку в виде средств разработки, то для RISC-V подобные средства только создаются. Вчера Microchip, крупный производитель микроэлектроники, анонсировал первый в индустрии комплект разработки на базе ПЛИС, использующий набор инструкций RISC-V.

В свете недавних новостей, касающихся NVIDIA и ARM, будущее RISC-V может выглядеть достаточно перспективно: этот набор инструкций является открытым и бесплатным. Кроме того, на него делают ставки такие группы, как Европейский консорциум EPI. Но платформа RISC-V очень нуждается в доступных, стандартизированных средствах разработки, которые позволят отработать все нюансы архитектуры и избежать таких ошибок, которые в дальнейшем могут нанести этим процессорам серьёзный ущерб, как это случилось с уязвимостями Spectre и Meltdown.

Прекрасным средством отработки процессорных архитектур являются ПЛИС, и представив новый комплект, Microchip сделала ставку на ПЛИС PolarFire. Эта SoC характеризуется низким потреблением и доступностью, но при этом в серии имеются устройства с количеством логических элементов от 100 до 500 тысяч. Экономичность микросхем данной серии может на 50% превосходить показатели аналогичных по классу устройств других производителей. Новинка получила название Icicle Development Kit, она выпущена в рамках инициативы Mi-V RISC-V Partner Ecosystem.

Применение Icicle позволит разработчикам создавать и отлаживать практически любые, в том числе и программные, решения на базе RISC-V. Это могут быть ОС реального времени, дебаггеры, компиляторы, аппаратные и программные системы безопасности, наконец, просто «системы-на-модуле» (SoM). Как заявил вице-президент FPGA-отдела Microchip, Брюс Вейер (Bruce Weyer), новая платформа разработчика существенно снизит барьер входа в мир RISC-V. Как отмечают представители самой инициативы RISC-V, новинка со стоимостью менее $500 очень впечатляет. С учётом того, сколько обычно стоят комплекты разработки, эта цена весьма невысока.

При этом набор Icicle имеет 250 тысяч логических элементов, поддержку PCIe, разъём mikroBUS, пару портов RJ45 (Ethernet), разъемы micro-USB, CAN, JTAG, а также интерфейсы SD и стандартную «гребёнку» GPIO (совместима с Raspberry Pi). В конструкции используются проверенные и сертифицированные компоненты, такие как контроллеры PHY (VSC8662XIC) и USB (USB3340-EZK-TR), а также токовые датчики PAC1934T-I/JQ. Приобрести комплект Icicle Kit (MPFS-ICICLE-KIT-ES) можно уже сейчас, стоимость стартует с отметки $489.

Постоянный URL: http://servernews.ru/1020885
09.09.2020 [20:09], Алексей Степин

S2C Prodigy Quad 10M: эмулятор SoC и CPU на базе Intel Stratix 10 GX 10M

FPGA всегда выручали разработчиков, когда требовалась гибкость в конфигурировании, но именно сегодня ПЛИС выходят на новый уровень и находят применение во всё большем количестве сценариев — в «умных» сетевых адаптерах, в системах машинного обучения, в прототипировании новых процессоров и во многих других. Одной из популярных серий ПЛИС является Intel Stratix, а сейчас S2C, известный разработчик средств прототипирования, представил новый комплекс на базе Stratix 10 GX.

ПЛИС удобны, в числе прочего, тем, что позволяют сэмулировать практически любую процессорную архитектуру. Конечно, такой «процессор» будет работать намного медленнее полностью реализованного в кремнии, но зато программируемость матриц позволяет производить отладку и усовершенствование архитектуры ещё на этапе проектирования. Существуют даже эмуляторы игровых консолей, реализованные полностью на ПЛИС и воспроизводящие все ошибки и особенности оригинальных приставок, которые часто использовались создателями игр для достижения какого-либо эффекта. Это наиболее точный способ эмуляции аппаратных решений.

Но разработка современных процессоров и SoC требует большого количества логических ячеек, поскольку такие архитектуры намного сложнее архитектур прошлого. И такой известный разработчик систем прототипирования, как S2C, предложила своё видение «аппаратного эмулятора», заложив в его основу сверхмощные матрицы Intel Stratix 10 GX 10M. Это одна из самых мощных в мире ПЛИС, с более чем 10 миллионами логических элементов и 48 трансиверами, каждый из которых развивает 17,5 Гбит/с, а внутренние части микросхемы связаны шиной EMIB, и межкристальная скорость составляет 6,5 Тбит/с.

S2C создаёт полные комплексы прототипирования на базе ПЛИС Xilinx или Intel

S2C создаёт полные комплексы прототипирования на базе ПЛИС Xilinx или Intel

Новинка S2C носит название Prodigy Logic System Quad 10M. Она довольно компактна, но тем не менее, включает в себя четыре микросхемы Stratix 10 GX 10M. Таким образом, общее количество элементов в системе достигает 40,8 миллионов, а количество слайсов DSP — почти 14 тысяч. Компания говорит об эквиваленте 300 миллионов элементов ASIC, это число выглядит весьма внушительно. Заявляется также о самом выгодном соотношении удельной стоимости в пересчёте на ячейку.

Система содержит встроенный отладочный модуль (Prodigy Multi-Debug Module), способный работать в различных режимах. За счёт наличия 4608 высокоскоростных линий ввода-вывода обеспечивается подключение различных дочерних карт, так что система полностью модульная. Уже на старте поставок компания S2C говорит о совместимости более чем с 90 прототипами дизайнов и бесшовной интеграции с уже имеющимися средствами разработки, такими как Prodigy Player Pro и Prodigy ProtoBridge.

Основное назначение Quad 10M — разработка SoC нового поколения, особенно делается упор на беспроводные сети пятого поколения. Заказать S2C Prodigy Logic System Quad 10M можно уже сейчас, для этого можно воспользоваться формой заказа на сайте разработчика.

Постоянный URL: http://servernews.ru/1020226
04.09.2020 [21:07], Илья Коваль

ORNL вкладывается в OpenACC для суперкомпьютеров с GPU AMD и NVIDIA

Ок-Риджская национальная лаборатория (Oak Ridge National Laboratory, ORNL), владелец одних из самых производительных суперкомпьютеров в мире, выделила средства на улучшение программной поддержки таких машин. В лаборатории есть Summit (IBM POWER + NVIDIA Volta), бывший лидер TOP500, который сейчас занимает второе место в рейтинге. А недавно был демонтирован Titan, место которого займёт Frontier (AMD EPYC + Radeon Instinct).

Актуальные машины, текущая и будущая, являются гетерогенными и при этом базируются на четырёх принципиально разных архитектурах. Желание ORNL упростить разработку и обеспечить переносимость кодов в этой ситуации понятно. Лаборатория сделала ставку на открытые стандарты и технологии и наняла Mentor Graphics, ныне дочернюю компанию Siemens, для улучшения набора компиляторов GCC. Естественно, все наработки будут выложены в открытый доступ (в силу лицензии), от чего выиграют и другие разработчики и пользователи HPC-систем.

Основной фокус будет на улучшении программирования GPU-ускорителей и упрощения переноса на них тяжёлых задач. Для это предполагается значительно улучшить в GCC поддержку OpenACC вкупе с реализацией последней версии OpenMP для распараллеливания программ. Кроме того, Mentor Graphics займётся имплементацией Fortran 2018 в GCC. Сумма контракта между ORNL и исполнителем не раскрывается.

Сроки исполнения также не указываются, но можно предположить, что работа должна быть по большей части завершена к моменту запуска суперкомпьютера Frontier в 2021 году. Кроме того, есть надежда, что финансы, полученные для реализации Frontier, помогут AMD развить собственные средства разработки для CPU и GPU, которые смогут в конечном итоге составить достойную конкуренцию программным продуктам Intel и NVIDIA.

Постоянный URL: http://servernews.ru/1019923
25.08.2020 [20:54], Владимир Мироненко

Сложность миграции в облака резко растёт по мере продвижения процесса

При перемещении рабочих нагрузок компании в облако уровень сложности начинает довольно резко возрастать после того, как были перенесены более простые приложения. Данная зависимость объясняется тем, что первыми перемещаются приложения и базы данных, которые являются более современными, то есть лучше спроектированы и созданы с учётом возможности переноса.

Далее следуют приложения, не так хорошо спроектированные или построенные на старых платформах, которые могут не иметь соответствующего аналога в публичном облаке. Хотя на ум сразу приходят устаревшие приложения, но это могут быть любые сервисы, требующие значительного рефакторинга для правильной работы в публичном облаке.

На графике ниже синяя линия отображает рост количества приложений, перенесенных в облако в течение определённого промежутка времени, а оранжевая линия отражает рост степени сложности перемещения этих приложений. Это смоделированный набор приложений; однако концепция, согласно которой сложность увеличивается по мере того, как вы мигрируете, распространяется на крупные и малые предприятия, переходящие в публичное облако.

По мере того, как многие предприятия приближаются к середине процесса миграции, степень сложности значительно возрастает, как показано на диаграмме, и это снижает скорость миграции. Возникает вопрос, как же предприятие сможет вывести оставшиеся приложения из корпоративного центра обработки данных?

InfoWorld предлагает два подхода, которые, похоже, работают. Первый предполагает обращение к поставщикам управляемых услуг (Managed Services Provider, MSP). MSP предлагают больше аналогов для более трудновоспроизводимых платформ и облешчает переход в публичное облако. Прибегнув к услугам MSP, можно сосредоточиться на исправлении или прекращении работы приложений на своей квазиоблачной платформе.

Второй подход заключается в создании собственного набора инструментов разработчика, чтобы более продуктивно исправлять приложения и базы данных. Это намного более трудоёмкий подход, но потенциально более выигрышный. Кроме того, создание новых служб с помощью таких наборов позволит сразу же заложить возможность миграции или использования гибридной модели.

Постоянный URL: http://servernews.ru/1019066
07.08.2020 [12:32], Владимир Мироненко

NVIDIA выпустила инструментарий для разработчиков HPC SDK

Компания NVIDIA объявила о выходе комплекта инструментов для разработки программного обеспечения для высокопроизводительных вычислений HPC SDK, анонсированного ранее в этом году на конференции GTC 2020. NVIDIA HPC SDK призван упростить развёртывание рабочих нагрузок HPC не только на графических чипах NVIDIA, но и на CPU.

SDK содержит компиляторы C++ и Fortran на основе программной инфраструктуры LLVM, включая поддержку автоматического ускорения с помощью графического процессора кода на C++ 17 (также известного как C++1z) с использованием параллельных алгоритмов и встроенных функций Fortran, что ранее было недоступно в Standard C++ без применения дополнительных библиотек или расширений языка.

NVIDIA HPC SDK также поддерживает OpenMP, открытый стандарт для распараллеливания программ на языках Си, Си++ и Fortran, и программный стандарт для параллельного программирования OpenACC, математические библиотеки, оптимизированные для NVIDIA, интерфейс для параллельного программирования NVSHMEM на базе OpenSHMEM, а также другие общие библиотеки и инструменты разработки/отладки.

SDK можно загрузить с сайта developer.nvidia.com. Первый выпуск — NVIDIA HPC SDK версии 20.7, полностью ориентированный на Linux, со сборками для x86_64, OpenPOWER и AArch64.

Постоянный URL: http://servernews.ru/1017667
18.06.2020 [12:14], Андрей Крупин

Выпущен новый SDK для микропроцессора Baikal-T1

Компания Baikal Electronics объявила о доступности для скачивания обновлённого SDK (Software Development Kit) для микропроцессора BE-T1000 (кодовое наименование Baikal-T1). Новый релиз набора инструментов для разработчиков получил индекс SDK-T-5.4.

В его состав вошли ядро Linux 5.4.43, драйвер XGbE, рекомендации по сборке прикладных библиотек и утилит ffmpeg, libvpx, x264. Также сообщается о добавлении поддержки сокетов AF_XDP в драйвер Gigabit Ethernet, устранении зависаний ядра при обработке прерываний и ошибки с некорректным выводом частоты DDR3 в U-Boot. Кроме того, специалистами Baikal Electronics были исправлены мелкие ошибки в скриптах сборки, удалена интегрированная среда разработки приложений Eclipse и внесены прочие изменения. Загрузить SDK-T-5.4 можно по этой ссылке (428 Мбайт).

Впервые российские «системы-на-кристалле» BE-T1000 появились в розничной продаже в апреле 2018 года. Чипы выполнены на архитектуре MIPS. Они содержат два вычислительных ядра P5600 с тактовой частотой до 1,2 ГГц. Имеется контроллер памяти DDR3-1600 ECC; заявлена поддержка интерфейсов 1/10 Gb Ethernet, PCIe 3.0, портов SATA 3.0 и USB 2.0.

Процессоры предлагаются, в частности, в составе оценочных плат BFK 3.1. Плата предназначена для разработки системного и прикладного программного обеспечения, проектирования и прототипирования аппаратных решений, а также для анализа и оценки технических характеристик «Байкал-Т1». Подробные сведения о комплексе BFK 3.1 с SoC отечественной разработки можно найти в нашем обзоре.

Постоянный URL: http://servernews.ru/1013680
12.06.2020 [20:10], Алексей Степин

Разработчикам ПО предложен бесплатный удалённый доступ к серверам Эльбрус

Любая платформа не имеет смысла без программного обеспечения, а программная часть должна учитывать архитектурные особенности системы для достижения наибольшей эффективности. Российские процессоры Эльбрус уникальны, а значит, инициатива компании-разработчика, МЦСТ, открывшей «сетевую лабораторию» поможет разработчикам ПО.

Российские процессоры Эльбрус используют архитектуру VLIW. Они также имеют механизм динамической бинарной трансляции, что позволяет запускать ПО для архитектуры x86, но ценой потери производительности. Вот почему разработка нативных программ, непосредственно работающих в системе с Эльбрус, или портирование так важны для успеха платформы.

Наиболее продвинутые модели процессоров Эльбрус имеют 8 ядер (Эльбрус-8C/CB), и в планах МЦСТ есть модели с 16 ядрами. Разработчики осознают всю важность программной части платформы, поэтому на базе Центра исследований и разработок МЦСТ и ИНЭУМ была открыта «сетевая лаборатория», включающая в себя несколько систем на базе этих процессоров, к которым можно получить удалённый доступ, причём бесплатный. Максимальный срок составляет 3 месяца, но он может быть продлён. 

При этом доступна не только текстовая консоль (через SSH), но и графическая, за счёт проброса X11 или VNC. Стенды являются многопользовательскими, поэтому права системного администратора не предоставляются, но в случае необходимости можно обратиться за получением уровня суперпользователя. А если требуется монопольный доступ к системе, её можно получить во временное пользование физически.

Для получения сетевого доступа достаточно заполнить заявку и копию открытого ключа в формате OpenSSH на адрес user@mcst.ru, а бланк заявки можно скачать с сайта МЦСТ. Отдельно оговаривается, что заявитель должен предоставить описание своего проекта, обязан изучить документацию и не может публиковать результаты без предварительного согласования. 

Постоянный URL: http://servernews.ru/1013303
03.06.2020 [23:12], Алексей Степин

InAccel предлагает инструментарий для доступа к ресурсам ПЛИС с помощью браузера

Иметь в своём распоряжении аппаратные ресурсы ПЛИС (FPGA) — всего лишь полдела. Нужно ещё располагать удобными инструментами, позволяющими эти ресурсы задействовать. Компания InAccel предлагает новый способ: использовать возможности ПЛИС-ускорителей с помощью браузера и браузерных приложений.

Один из вариантов ускорителя Xilinx Alveo

Один из вариантов ускорителя Xilinx Alveo

Изначально компания Xilinx представила открытый набор библиотек Vitis Library. Он позволял буквально «из коробки» использовать выпускаемые Xilinx программируемые матрицы совместно с уже имеющимися приложениями практически без вмешательства или же с минимальным вмешательством в их код. В список Vitis Library входили библиотеки для обычных вычислений, статистики, линейной алгебры и библиотеки обработки сигналов (DSP), а также ряд специфических библиотек, вроде поддержки машинного зрения и финансовых расчётов.

Веб-браузеры в наше время применяются очень широко. Даже программное обеспечение недавно запущенного космического корабля Dragon 2 использует связку HTML5 + JavaScript, правда, только для интерфейса; системы класса mission critiral всё же написаны на C++.

Компания InAccel решила совместить преимущества современных браузеров с преимуществами ПЛИС. Пока выпущена демоверсия разработанной InAccel технологии, но она уже работает с платами Xilinx серии Alveo.

Новый фреймворк основан на Jupyter Hub, платформе, позволяющей создавать среды для научных задач, работающие в облаке и не требующие процедур инсталляции и поддержки от конечных пользователей. Частью комплекса является Jupyter Notebook, веб-приложение, позволяющее создавать различные документы, сочетающие в себе выполняемый код, уравнения, визуализации и описательные тексты; этими документами можно делиться с коллегами в онлайн-режиме.

С помощью фреймворка InAccel теперь пользователи Jupyter Hub смогут пользоваться всеми преимуществами ПЛИС, такими, как низкая латентность и высокая производительность в специфических задачах. Система способна работать как локально, с использованием плат Alveo, так и в облаке, включая таких провайдеров, как AWS, Azure и Alibaba Cloud. Имеется пробный доступ для тех, кто желает протестировать новую технологию. Полный список библиотек VitAll можно найти на сайте компании.

Постоянный URL: http://servernews.ru/1012576
02.06.2020 [13:42], Андрей Крупин

Опубликовано руководство по программированию на платформе «Эльбрус»

Компания МЦСТ (Московский центр SPARC-технологий) разместила в отрытом доступе руководство по эффективному программированию на платформе «Эльбрус».

Руководство предназначено для разработчиков, занимающихся созданием, портированием и оптимизацией приложений для вычислительной платформы «Эльбрус» с использованием языков программирования C и C++.

В опубликованном документе изложены основы архитектуры платформы и приёмы работы с компилятором LCC, приведено описание языка ассемблера и системы команд процессоров «Эльбрус», представлены техники по оптимизации и повышению производительности ПО за счёт распараллеливания исполнимого кода на уровне инструкций. Отдельное внимание уделено инструментам для анализа производительности кода на платформе «Эльбрус».

Руководство распространяется по лицензии Creative Commons BY 4.0 и представлено в форматах PDF и HTML. Скачать документ можно по ссылке mcst.ru/elbrus_prog.

Постоянный URL: http://servernews.ru/1012445
27.05.2020 [18:36], Алексей Степин

Национальные лаборатории Сандия получат систему на базе ARM-процессоров Fujitsu A64FX

Компания Fujitsu продолжает развивать успешно начатое наступление на рынок супервычислений. Ранее сообщалось о вводе в строй новейшего суперкомпьютера Fugaku, использующего разработанные этой компанией процессоры A64FX.

Сейчас стало известно, что Национальные лаборатории Сандия (Sandia National Labs) станут первым подразделением Министерства энергетики США, которое получит систему на базе новейших процессоров Fujitsu.

Процессоры A64FX сочетают в себе достоинства ЦП и ГП: они обладают собственной быстрой памятью и поддерживают «широкие векторы»

Процессоры A64FX сочетают в себе достоинства ЦП и ГП: они обладают собственной быстрой памятью и поддерживают «широкие векторы»

Этой системой станет Fujitsu PRIMEHPC FX700 — за поставку, наладку и монтаж отвечает компания Penguin Computer. В числе преимуществ данной архитектуры называется отсутствие проблем с пропускной способностью подсистем памяти — системы на базе A64FX не обязаны «протискивать» данные через шину PCIe или NVLink между традиционными процессорами и ускорителями на базе ГП.

Процессоры A64FX универсальны и поддерживают широкий спектр вычислительных режимов

Процессоры A64FX универсальны и поддерживают широкий спектр вычислительных режимов

Процессоры A64FX обладают интегрированной подсистемой памяти на базе сборок HBM2. Объём достаточно велик, 32 Гбайт на процессор, при этом пропускная способность составляет 1024 Гбайт/с, что заведомо выше, нежели у PCIe 4.0 x16 (16 Гбайт/с в каждую сторону) или NVLink 2.0 (150 Гбайт/с в каждую сторону). Кроме того, A64FX имеют распространённую ARM-архитектуру и программирование под эти системы существенно проще, нежели под гетерогенные комплексы типа «ЦП + ГП».

Как мы уже отмечали, с энергоэффективностью у A64FX дела обстоят отлично: процессоры Fujitsu демонстрируют лучшую удельную производительность, нежели гетерогенные системы с ускорителями NVIDIA Tesla V100. Про x86 говорить не приходится — тот же Fugaku в пересчете на ватт энергии производит почти в три раза больше вычислений.

Задачей Sandia National Labs станет оценка эффективности приложений Министерства энергетики США, выполняемых на процессорах A64FX; учёные поделятся достигнутыми результатами с Fujitsu и Penguin Computer.

A64FX созданы с учётом масштабируемости: возможно создание систем с более чем 150 тысячами процессорных узлов

A64FX созданы с учётом масштабируемости: возможно создание систем с более чем 150 тысячами процессорных узлов

В тестировании будут использованы так называемые mini- и proxy-версии — компактные, управляемые и снабжённые средствами мониторинга варианты крупного программного обеспечения. Отметим, что они также будут иметь открытый код, что должно облегчить работу по оптимизации и адаптации различного ПО под архитектуру A64FX и конкретные задачи.

Глава проекта Vanguard по оценке новых технологий в супервычислениях, Джеймс Ларос (James Laros) отметил, что новая система Fujitsu-Penguin окажет существенную помощь в исследовании архитектуры ARM в мире HPC и создании ориентированного на неё программного обеспечения. Первой ARM-платформой в распоряжении лабораторий стала система Astra на базе процессоров ThunderX2.

В машинах A64FX используется 6D-топология межсоединений на базе шины TOFU (6,35 Гбайт/с измеренная пропускная способность, задержки ~0,5 микросекунды)

Межузловые соединения реализованы на базе шины TofuD (6,35 Гбайт/с измеренная пропускная способность, задержка ~0,5 микросекунды)

Национальные лаборатории Сандия не отказываются от архитектуры x86: 20 мая организация опубликовала видеоролик, посвящённый монтажу суперкомпьютера Attaway на базе Intel Xeon Gold 6140. За эту систему также отвечает компания Penguin Computer. А более подробно об архитектуре Fujitsu A64FX и решениях на её основе может рассказать эта презентация.

Постоянный URL: http://servernews.ru/1011996
Система Orphus