Материалы по тегу: isc

21.02.2020 [00:02], Андрей Созинов

XMOS представила процессор Xcore.ai для «умного» Интернета вещей

Компания XMOS представила собственный ИИ-процессор Xcore.ai, предназначенный для применения в области Интернета вещей с искусственным интеллектом (AIoT). Новинка позиционируется как гибкий и экономичный процессор, обладающий производительным ИИ-модулем, цифровым сигнальным процессором (DSP) и контроллерами управления и ввода-вывода.

IoT и искусственный интеллект являются одними из самых популярных направлений за последнее десятилетие, и развиваются они очень стремительно. В последнее время появились тенденции к объединению ИИ и IoT в так называемые системы AIoT, где сама система Интернета вещей будет цифровой «нервной системой», а ИИ — мозгом, отвечающим за принятие решений и контроль за системой.

Xcore.ai представляет собой масштабируемый многоядерный универсальный AIoT-процессор третьего поколения. Чип Xcore первого поколения представлял собой что-то похожее на FPGA с гибким контроллером ввода-вывода и значительными возможностями для управления. Во втором поколении появился DSP, а в последнем третьем поколении были добавлены возможности машинного обучения.

Процессор Xcore.ai построен из двух блоков, сочетающих в себе RISC-ядро и 512 Кбайт памяти SRAM с возможностью расширения внешней LPDDR. Во втором и третьем поколении архитектуры Xcore каждый процессор имеет исполнительный блок с двойным выходом, который способен выполнять команды с частотой вдвое выше частоты конвейера. Исполнительные блоки разделены на восемь параллельных аппаратных потоков, каждый из которых способен выполнять программные задачи, обрабатывать операции ввода-вывода и управления, а также работать как DSP и с нейронными сетями.

Xcore построена на стандартном RISC-подобном наборе команд и поставляется с инструкциями для хранения и загрузки информации в SRAM. Новинка поддерживает как 32-разрядные целые числа, так и числа с плавающей запятой. Платформа Xcore обеспечивает поддержку различных физических интерфейсов, включая USB, MIPI (на приём), а посредством GPIO (128 линий) может обмениваться данными через SPI, QSPI, MII, I2S, I2C, PDM и многие другие интерфейсы.

За счёт масштабируемости архитектуры Xcore у пользователей есть возможность объединять несколько процессоров Xcore.ai для создания более мощных систем. Для связи между процессорами используется интерконнект Xconnect, обеспечивающий пропускную способность до 2 Гбит/с.

Также отметим, что Xcore полностью программируется на языке C с использованием стандартных инструментов, вроде компилятора LLVM и фреймворка Tensorflow Lite, а также данная архитектура может работать со многим ПО, вроде операционной системы freeRTOS.

В конце стоит отметить, что по словам производителя, процессор Xcore.ai во много раз превосходит ядро Cortex M7 по части искусственного интеллекта, возможностей подключения и производительности DSP.

Постоянный URL: http://servernews.ru/1004186
05.09.2019 [08:19], Сергей Карасёв

Оптическая библиотека Panasonic LB-DH7 получила обновление ПО RAIDIX RASP

Компании Panasonic и RAIDIX представили обновление для роботизированной библиотеки LB-DH7, предназначенной для долгосрочного хранения больших объёмов информации.

Panasonic LB-DH7 — это масштабируемое устройство накопления данных на оптических дисках. Для хранения файлов служат специальные картриджи, каждый из которых содержит двенадцать оптических дисков нового поколения Archival Disc.

Система создана по модульному принципу, что позволяет наращивать ёмкость и скорость работы библиотеки в зависимости от потребностей, а также облегчает обслуживание и ремонт. В состав системы входят базовый модуль и модули расширения, каждый из которых рассчитан на 76 картриджей ёмкостью 3,6 Тбайт.

В соответствии с новой аппаратной архитектурой решения выпущен новый релиз программного обеспечения RAIDIX RASP (RAIDIX Archival Solution for Panasonic), который объединяет методы хранения «горячих» и «холодных» данных в единое целое. Это ПО позволяет синхронизировать библиотеки архивного хранения и существующую IT-инфраструктуру компании, а также предоставляет удобный интерфейс управления всей системой в целом.

Роботизированная платформа хранения Panasonic LB-DH7 должна заинтересовать прежде всего архивные фонды, музеи, библиотеки, исследовательские организации и компании, которым требуется длительное надёжное хранение информации.

Постоянный URL: http://servernews.ru/993493
21.06.2017 [17:36], Иван Грудцын

Фото и подробные характеристики ускорителя AMD Radeon Instinct MI25

Параллельно с официальным анонсом процессоров EPYC компания AMD поведала подробности об ускорителях для систем глубинного обучения Radeon Instinct. Особый интерес представляет модель MI25, основанная на графическом процессоре Vega. Впервые об адаптере калифорнийский разработчик заговорил в декабре прошлого года, сообщив лишь отдельные его параметры. Утверждалось, что производительность Radeon Instinct MI25 составляет 12,5 Тфлопс в вычислениях одинарной точности (FP32) и 25 Тфлопс в вычислениях половинной точности (FP16), а энергопотребление — в пределах 300 Вт.

Впоследствии спецификация MI25 была изменена и уточнена. Оценка «чистой» производительности была немного уменьшена — до 12,3 Тфлопс FP32 и 24,6 Тфлопс FP16. Кроме того, паспортное энергопотребление утверждено на уровне 300 Вт, а не «до 300 Вт». Как и предполагалось, Radeon Instinct MI25 получил 64 мультипроцессорных кластера по 64 потоковых процессора в каждом (всего 4096 шт.) и 16 Гбайт буферной памяти HBM2 с поддержкой алгоритма контроля ошибок. Пропускная способность подсистемы VRAM равна 484 Гбайт/с, что соответствует частоте около 470 (1880) МГц при 2048-битной шине памяти. Частота ядра составляет приблизительно 1500 МГц, тогда как тот же чип у Radeon Vega Frontier Edition тактуется на 1600 МГц.

Ускоритель MI25 оснащён интерфейсом подключения PCI Express 3.0 x16, занимает два слота расширения в высоту и 267 мм в длину. Охлаждение у карты пассивное, поскольку предполагается, что её радиатор будут продувать высокооборотистые серверные вентиляторы. Согласно AMD, ускоритель может работать в среде 64-разрядных ОС семейства Linux с приложениями, написанными на ISO C++, OpenCL, CUDA и Python. Срок гарантии на Radeon Instinct MI25 составляет три года.

По оценке AMD, соотношение производительности и энергопотребления у MI25 значительно лучше, чем у старших моделей NVIDIA Tesla семейства Pascal.

На выставке-конференции ISC 2017 во Франкфурте нашему корреспонденту удалось запечатлеть Radeon Instinct MI25 крупным планом. Как видно на фото, для стабильной работы карта требует подключения 6- и 8-контактного кабелей PCI-E Power. Её чёрный кожух имеет рельефную поверхность. Видеовыходы не предусмотрены — ими располагает родственный MI25 ускоритель Radeon Vega Frontier Edition.

Постоянный URL: http://servernews.ru/954311
21.06.2017 [15:50], Сергей Карасёв

В рейтинге «зелёных» суперкомпьютеров лидируют системы с ускорителями NVIDIA Tesla

Опубликован свежий рейтинг Green500 — список мощнейших вычислительных систем мира, составленный с точки зрения энергетической эффективности.

На вершине Green500 располагается суперкомпьютер TSUBAME3.0, принадлежащий Токийскому технологическому институту (Япония). Этот комплекс обладает производительностью около 2 петафлопсов. Энергетическая эффективность при этом составляет 14,11 гигафлопса на ватт. В общем рейтинге Top500 эта система находится на 61 позиции.

С другой стороны, самый мощный в мире суперкомпьютер Sunway TaihuLight — лидер списка Top500 — в рейтинге Green500 располагается на 17 строке. Этот комплекс обладает быстродействием в 93 петафлопса, в то время как энергетическая эффективность равна 6,05 гигафлопса на ватт.

Из других участников рейтинга стоит выделить обновлённую швейцарскую систему Piz Daint. Этот суперкомпьютер с быстродействием 19,59 петафлопса и энергетической эффективностью 10,39 гигафлопса на ватт находится на третьем месте в рейтинге Top500 и на шестой позиции в списке Green500.

Любопытно, что все лидеры «зелёного» рейтинга Green500 оборудованы ускорителями NVIDIA Tesla. При этом в их составе используются процессоры Intel Xeon.

Самый мощный российский суперкомпьютер «Ломоносов-2» с производительностью 2,10 петафлопса обладает энергетической эффективностью 1,95 гигафлопса на ватт. Это 135 строка в списке Green500. В рейтинге Top500 система находится на 59 позиции.

Постоянный URL: http://servernews.ru/954305
21.06.2017 [10:00], Сергей Карасёв

Опубликована седьмая редакция рейтинга суперкомпьютеров HPCG

Представлена седьмая редакция нового мирового рейтинга HPCG, созданного для более точной оценки реальной производительности самых мощных в мире суперкомпьютеров.

О бенчмарке HPCG мы уже подробно рассказывали. Коротко напомним предысторию его появления. Созданный в 1993 году мировой рейтинг производительности самых мощных суперкомпьютеров Top500 был основан на разработанном в то же время тесте LINPACK (High Performance LINPACK, HPL). Однако в последние годы этот рейтинг и тест HPL стали подвергаться всё большей критике. Эксперты говорят, что тест LINPACK не соответствует профилю реальной загрузки вычислительных систем.

В 2013 году составителями рейтинга Top500 был предложен новый тест для ранжирования суперкомпьютеров — High Performance Conjugate Gradient (HPCG), который, как предполагается, позволяет точнее оценить производительность вычислительных систем на более широком спектре реальных приложений. Первый список HPCG был представлен в июне 2014 года — он содержал 15 позиций. С тех пор рейтинг публикуется дважды в год. Нынешняя редакция включает уже 111 позиций.

Первую строку в списке занимает система K computer — японский суперкомпьютер производства компании Fujitsu, запущенный в 2011 году в Институте физико-химических исследований в городе Кобе. В рейтинге Top500 этот комплекс находится на восьмом месте.

На второй строке списка HPCG располагается китайская система Tianhe-2 (MilkyWay-2) — такой же результат она демонстрирует в рейтинге Top500. «Бронза» по версии HPCG досталась нынешнему лидеру Top500 — суперкомпьютеру Sunway TaihuLight. С полным списком HPCG можно ознакомиться здесь.

Постоянный URL: http://servernews.ru/954279
21.06.2017 [09:30], Иван Грудцын

NVIDIA анонсировала PCI-E версию ускорителя Tesla V100

В мае NVIDIA положила начало эры 12-нм графических решений Volta, представив HPC-ускоритель Tesla V100 с интерфейсом NVLink 2.0 (300 Гбайт/с). Новый оптимизированный для NVIDIA техпроцесс TSMC, новые структурные блоки Tensor для матричных вычислений, огромный кристалл с 21 млрд транзисторов — разработчик постарался, чтобы V100 запомнили надолго.

Повод для очередного упоминания об ускорителе Tesla V100 у нас достаточно веский — официальный дебют его версии с интерфейсом подключения PCI Express 3.0 x16. Судя по набору характеристик, новинка немногим уступает основному адаптеру. По сути, кроме использования разъёма PCI-E 3.0 и немного меньшей boost-частоты ядра (около 1370 МГц), других ограничений не предусмотрено, и V100 готов усилить рабочие станции и серверы заказчиков уже в ближайшем будущем.

С положительной стороны PCI-E модификация Tesla V100 отличается от «старшей сестры» меньшим энергопотреблением — 250 Вт против 300 Вт. Это позволяет использовать как жидкостные, так и воздушные системы охлаждения с невысоким уровнем шума. Графическое ядро ускорителя — GV100 — включает в себя 5120 потоковых процессоров и 640 блоков матричных вычислений (Tensor). Микросхемы памяти HBM2 объёмом 16 Гбайт (4 × 4 Гбайт) работают на частоте 900 МГц, пропускная способность подсистемы памяти увеличена на 25 % по сравнению с Tesla P100 (Pascal) — с 720 до 900 Гбайт/с. Производительность Tesla V100 достигает 7 Тфлопс в вычислениях двойной точности, 14 Тфлопс — одинарной и 28 Тфлопс — половинной. Для матричных вычислений цифра ещё выше — 112 Тфлопс.

Тем временем нашему корреспонденту на выставке-конференции ISC 2017 в Германии удалось запечатлеть на фото обновлённый сервер DGX-1 и рабочую станцию DGX Station. Обе системы оборудованы картами V100 и предназначены для ресурсоёмких вычислений, связанных с решением задач в области искусственного интеллекта.

Сервер NVIDIA DGX-1 оснащён восемью ускорителями Tesla V100, двумя 20-ядерными процессорами Intel Xeon E5-2698 v4, 512 Гбайт оперативной памяти, четырьмя 1,92-Тбайт SSD в RAID 0, проводным сетевым интерфейсом 10-Гбит Ethernet (2 порта) и 3,2-кВт блоком питания. Рекомендованная цена системы для рынка США составляет $149 000.

У рабочей станции DGX Station всего вполовину меньше (кроме накопителей — их по-прежнему четыре). Цена, соответственно, не шестизначная, а пятизначная — $69 000. Процессор Xeon E5-2698 v4 и квартет карт Tesla V100 охлаждаются СЖО. Уровень шума на фоне DGX-1 невысок.

Постоянный URL: http://servernews.ru/954273
19.06.2017 [12:20], Сергей Карасёв

Лидерство в новом рейтинге суперкомпьютеров Top500 сохранил китайский комплекс

Сегодня, 19 июня, обнародована 49 редакция рейтинга мощнейших вычислительных систем мира Top500: ознакомиться с обновлённым списком можно на официальном сайте проекта.

Лидирующую позицию продолжает удерживать китайский суперкомпьютер Sunway TaihuLight, насчитывающий 10 649 600 вычислительных ядер. Его быстродействие составляет 93 петафлопса (квадриллиона операций с плавающей запятой в секунду), а пиковая производительность теоретически может достигать 125 петафлопсов.

На второй строке располагается ещё один «китаец» — комплекс Tianhe-2 (MilkyWay-2). Он обладает быстродействием в 33,86 петафлопса, тогда как пиковая производительность достигает 54,9 петафлопса.

На третье место вырвалась швейцарская система Piz Daint. Этот суперкомпьютер подвергся модернизации, в результате которой быстродействие достигло 19,59 петафлопса. Показатель пиковой производительности — 25,33 петафлопса.

Таким образом, в тройке лидеров теперь отсутствуют системы из Соединённых Штатов. Самый мощный американский комплекс Titan отныне довольствуется четвёртой позицией: его быстродействие — 17,59 петафлопса.

Самым быстрым российским суперкомпьютером остаётся «Ломоносов-2», установленный в Московском государственном университете (МГУ). Его производительность достигает 2,10 петафлопса, пиковая производительность — 2,96 петафлопса. Это соответствует 59 позиции в нынешнем рейтинге.

Суммарное быстродействие всех входящих в рейтинг систем теперь составляет 749 петафлопсов — это на треть больше прошлогоднего результата. На системы с чипами Intel (Xeon и Xeon Phi) приходится 464 суперкомпьютера из 500. Ещё 21 комплекс полагается на процессоры IBM Power, шесть — на чипы AMD Opteron.

Постоянный URL: http://servernews.ru/954158
07.10.2016 [11:58], Алексей Степин

Adapteva представила 1024-ядерный процессор для рынка специализированных вычислений

Ещё в 2010 году исследователи Intel заявили, что создание 1000-ядерного процессора вскоре сможет стать реальной возможностью. Сегодня, в 2016 году, мы знаем, что их предсказания полностью осуществились: уже выпущен тестовый образец 1000-ядерного чипа KiloCore, а недавно компания Adapteva отрапортовала о выпуске 1024-ядерного процессора под названием Epiphany V. Создатели считают, что их детище способно опередить в ряде задач последние модели серверов и игровых систем, базирующиеся на традиционных технологиях.

Сам процессор Epiphany V, однако, ни в коей мере не предназначен для игр. С его параллелизмом он нацелен на использование в таких областях, как машинное зрение и машинное обучение, а также отлично подходит для использования в системах полностью автоматического вождения. Как сказал Андреас Олофсон (Andreas Olofsson), основатель Adapteva, на базе Epiphany V энтузиаст вполне сможет построить ПК, работающий под управлением Linux, но чип всё-таки предназначается не для этого. Он также отметил, что данный чип обладает лучшими показателями производительности на ватт и квадратный миллиметр, нежели любой современный x86-совместимый процессор. Архитектура Adapteva подразумевает использование когерентности кешей; некий объём разделяемой памяти (64 Мбайт SRAM) доступен всем ядрам.

В основе Epiphany V лежит 64-битная архитектура RISC, производство его уже начато, и массовое тестирование в крупномасштабных системах начнётся в течение ближайших нескольких месяцев. Новый 1024-ядерный процессор выпускается с использованием 16-нм технологических норм FinFET, разработанных и используемых компанией TSMC. Аналогичный техпроцесс применяется в производстве NVIDIA Pascal. Площадь ядра новинки составляет 117 мм2, на этом пространстве размещается 4,56 миллиарда транзисторов. К сожалению, в открытой продаже Epiphany V приобрести будет нельзя, но Apdapteva планирует активно работать с партнёрами в области коммерческого внедрения нового чипа. О внутренней архитектуре Epiphany V пока известно немного, скажем лишь, что он поддерживает такие стандарты программирования, как OpenCL, что должно облегчить его внедрение в коммерческих приложениях.

Постоянный URL: http://servernews.ru/940577
26.06.2016 [18:04], Сергей Юртайкин

ISC 2016: фоторепортаж со стенда Huawei

Компания Huawei воспользовалась конференцией ISC 2016, чтобы продемонстрировать ряд своих IT-продуктов для дата-центров. Среди них — серверы и твердотельные накопители.

Сервер FusionServer X6800 высокой плотности, ориентированный на работу с облачными вычислениями и большими данными, включает широкий спектр узлов с различными спецификациями для гибкой работы сервисных приложений, ресурсов вычисления, хранения и I/O.

Также Huawei привезла во Франкфурт высокопроизводительный накопитель ES3000, оснащённый интерфейсом PCIe 3.0. В зависимости от версии устройство может вмещать до 3,2 Тбайт данных и обладать производительностью считывания данных до 800 тыс. IOPS и пропускной способностью до 3,2 Гбайт/с.

Кроме того, был показан блейд-сервер FusionServer E9000, базирующийcя на процессорах Intel Xeon E5-2600 v4 (их может быть до 64-х). Новинка поддерживает установку до 96 твердотельных накопителей NVMe и сетевую технологию IB EDR 100 Гбит/с.

Наконец, Huawei показала флагманский стоечный сервер нового поколения FusionServer RH8100. Он может включать до 8 процессоров серии Intel Xeon E7-8800, 60 функций RAS, до 12 Тбайт оперативной памяти DDR3 и 16 накопителей PCIe. Продукт подходит для критически важных услуг, извлечения и анализа данных.

Постоянный URL: http://servernews.ru/935181
26.06.2016 [16:16], Дмитрий Мякин

ISC 2016: ассортимент серверов HPE Apollo

После разделения корпорации HP на два бизнеса выпуск серверов и суперкомпьютеров сосредоточился в руках Hewlett Packard Enterprise (HPE). Корреспонденты 3DNews посетили экспозицию этой компании на выставке ISC 2016 во Франкфурте, чтобы поближе познакомиться с предлагаемыми ею решениями для рынка высокопроизводительных вычислений (HPC).

Суперкомпьютер HPE Apollo 8000, впервые представленный широкой публике ещё в 2014 году, позиционируется производителем как первая в мире HPC-система с применением исключительно водяной системы охлаждения. Она смонтирована на стойках, каждая из которых вмещает до 144 двухпроцессорных серверов (до 72 двухпроцессорных серверов с ускорителями NVIDIA Tesla либо Intel Xeon Phi), благодаря чему данное HPC-решение обладает высокой масштабируемостью.

GPU-сервер высокой плотности HPE Apollo 6500 высотой 2U построен на базе процессора Intel Xeon E5-2600 v4 и рассчитан на установку в него до восьми графических ускорителей уровня NVIDIA Tesla K80. Его поставки начнутся во второй половине текущего года.

Серверы серии HPE Apollo 2000 относятся к решениям повышенной плотности и могут устанавливаться в стандартное 2U-шасси в количестве до четырёх штук. Модули построены на базе двух процессоров Xeon E5-2600 и способны иметь «на борту» до 512 Гбайт оперативной памяти.

Семейство платформ HPE Apollo 4000 ориентировано, прежде всего, на создание систем хранения и обработки больших массивов данных. На ISC 2016 оно было представлено четырьмя моделями — Apollo 4200, Apollo 4510, Apollo 4520 и Apollo 4530, имеющих одинаковые вычислительные ресурсы, но различающихся масштабами поддерживаемых хранилищ.

Постоянный URL: http://servernews.ru/935175
Система Orphus