Материалы по тегу: ascend

17.04.2024 [12:56], Сергей Карасёв

Exascend представила SSD серии PR4 с защитой от радиации: M.2, E1.S и U.2 ёмкостью до 15,36 Тбайт

Компания Exascend анонсировала SSD повышенной надёжности семейства PR4, предназначенные для эксплуатации в экстремальных условиях, включая космическое пространство. В серию вошли изделия в форматах M.2 2280/2242, E1.S и U.2 с интерфейсом PCIe 4.0 (NVMe 1.4).

Накопители выполнены по технологии Neutron Shield 2.0, которая обеспечивает защиту от радиации. Средства Dual Power Loss Protection (PLP) отвечают за сохранность данных при внезапном отключении питания. Устройства соответствуют стандарту MIL-STD-810, что означает защиту от ударов, вибрации и других воздействий. Специальное покрытие ограждает от негативного воздействия влаги. Диапазон рабочих температур простирается от -40 до +85 °C.

Применены 176-слойные чипы флеш-памяти 3D TLC. Изделия M.2 имеют вместимость от 960 Гбайт до 7,68 Тбайт. Заявленная скорость последовательного чтения и записи данных достигает соответственно 3200 и 3000 Мбайт/с. Показатель IOPS (операций ввода/вывода в секунду) при работе с блоками по 4 Кбайт — до 400 тыс. при произвольном чтении и до 50 тыс. при произвольной записи. Устройства E1.S также имеют ёмкость от 960 Гбайт до 7,68 Тбайт, а SSD формата U.2 — от 960 Гбайт до 15,36 Тбайт. У накопителей этих двух типов скорость чтения составляет до 3500 Мбайт/с, скорость записи — до 3000 Мбайт/с. Значение IOPS при чтении и записи — до 500 тыс. и 55 тыс. соответственно.

 Источник изображения: Exascend

Источник изображения: Exascend

В новинках реализованы технологии Exascend Adaptive Thermal Control и SuperCruise, оптимизирующие производительность путём интеллектуального управления температурным режимом и использования специальных алгоритмов записи. Говорится о поддержке TCG Opal 2.0 и шифрования AES-256. Значение MTBF (средняя наработка на отказ) — 2 млн часов. Накопители способны выдерживать до 0,6 полных перезаписи в сутки (показатель DWPD) на протяжении трёх лет. Энергопотребление в активном режиме не превышает 8 Вт, в режиме простоя — 1 Вт. Предоставляется трёхлетняя гарантия.

Постоянный URL: http://servernews.ru/1103392
04.03.2024 [20:32], Руслан Авдеев

NVIDIA признала в Huawei потенциального соперника на ниве ИИ-ускорителей

Китайская Huawei вновь попала в центр внимания СМИ после того, как глава NVIDIA признал её достижения в сфере ИИ-решений. По данным SCMP, хотя в отношении Китая Соединённые Штаты ввели жёсткие санкции, Huawei смогла предложить в материковом Китае альтернативу высокопроизводительным ускорителям NVIDIA.

Ускоритель Ascend 910B уже доступен в Поднебесной и, по данным отраслевых экспертов, его производительность сравнима с характеристиками NVIDIA A100. По мнению экспертного сообщества, новинка выпускается ведущим контрактным производителем полупроводников Китая — компанией SMIC, тоже находящейся под американскими санкциями. Выпуск осуществляется в соответствии с 7-нм техпроцессом. В самой Huawei слухи о своих ускорителях не комментируют, хотя и признают, что ИИ является ключевой частью стратегии компании.

Хотя ещё в 2019 году против Huawei введены США жёсткие санкции, компания сумела «перегруппироваться», нашла новых поставщиков в Китае, а летом прошлого года представила свой первый за несколько лет 5G-смартфон — Mate 60 Pro на базе флагманского 7-нм чипсета Kirin 9000, без лишнего шума разработанном под санкциями. Уже тогда «возрождение» Huawei оказалось в центре внимания СМИ, политиков и бизнеса. ИИ-чип Huawei появился приблизительно в то же время, а китайский поисковый гигант Baidu заказал сразу 1600 таких ускорителей. К нему присоединились и другие компании из КНР, занимающиеся ИИ-проектами и обучением больших языковых моделей (LLM).

 Источник изображения: Huawei

Источник изображения: Huawei

В прошлом месяце глава NVIDIA Дженсен Хуанг (Jensen Huang) признал значимость конкурента, назвав в одном из интервью Huawei «очень, очень хорошей компанией». По его словам, Huawei, испытывая проблемы с доступом к современным технологиям, тем не менее, может объединять в кластеры многочисленные ускорители собственной разработки, чтобы повысить производительность обработки ИИ-задач. Пока, по данным китайских источников, новые чипы можно заказать, но с поставками наблюдаются некоторые трудности.

По имеющимся сведениям, сервер с восемью ускорителями Ascend 910B стоит около ¥1,5 млн или немногим более $208 тыс. — приблизительно за столько же на местном чёрном рынке можно приобрести контрабандный сервер с NVIDIA A100. Эксперты не спешат комментировать возможную конкуренцию Huawei и NVIDIA, ограничиваясь замечаниями о том, что американская сторона имеет большой опыт ещё со времён разработки игровых GPU и предлагает целую экосистему на базе CUDA. Вероятно, Huawei придётся вложить средства в развитие программной экосистемы или делегировать это другим компаниям, сосредоточившись на разработке «железа». Но конкуренция с NVIDIA в любом случае не будет лёгкой.

Постоянный URL: http://servernews.ru/1101188
03.12.2023 [23:28], Сергей Карасёв

Одноплатный компьютер Orange Pi AIpro получил процессор Huawei Ascend с ИИ-ускорителем

Анонсирован одноплатный компьютер Orange Pi AIpro для создания всевозможных устройств с ИИ-функциями. Это могут быть дроны, системы видеонаблюдения и анализа естественного языка, AR/VR-гаджеты, средства автоматизации, робототехнические комплексы и пр.

Традиционно в одноплатных компьютерах Orange Pi применяются процессоры Rockchip или Allwinner. Однако в случае AIpro задействован неназванный чип Huawei Ascend с четырьмя 64-битными ядрами и встроенным ИИ-ускорителем, обеспечивающим производительность до 8/20 TOPS на операциях INT8 (FP16).

 Источник изображения: Orange Pi

Источник изображения: Orange Pi

Объём оперативной памяти LPDDR4X-3200 может составлять 8 или 16 Гбайт. Возможна установка флеш-модуля eMMC 5.1 вместимостью 32, 64, 128 или 256 Гбайт, карты microSD и SSD формата M.2 2280 (SATA или NVMe). В оснащение включены сетевой контроллер 1GbE, адаптеры Wi-Fi 5 (диапазоны 2,4 и 5 ГГц) и Bluetooth 4.2. Размеры составляют 107 × 68 мм, вес — 82 г.

 Источник изображения: Orange Pi

Источник изображения: Orange Pi

Присутствуют два интерфейса HDMI 2.0 с поддержкой видео 4K@60, два порта USB 3.0 Type-A, гнездо RJ-45, стандартный 3,5-мм аудиоразъём и два порта USB Type-C, один из которых служит для подачи питания. Могут быть задействованы интерфейсы MIPI DSI (2 линии) и MIPI CSI (2 × 2 линии). Кроме того, имеется 40-контактная колодка GPIO с поддержкой UART, I2C, SPI, I2S, PWM.

Для Orange Pi AIpro заявлена совместимость с Ubuntu и openEuler. Новинку можно заказать по цене около $126 за версию с 8 Гбайт ОЗУ и $162 за модификацию с 16 Гбайт памяти. Поставки начнутся 5 января 2024 года.

Постоянный URL: http://servernews.ru/1096882
27.08.2019 [11:00], Геннадий Детинич

Huawei Ascend 910: китайская альтернатива ИИ-платформам NVIDIA

Глубокое машинное обучение ― это сравнительно новая область приложения для вычислительных архитектур. Как всё новое, ML заставляет искать альтернативные пути решения задач. В этом поиске китайские разработчики оказались на равных и даже в привилегированных условиях, что привело к появлению в Китае мощнейших ИИ-платформ.

Как всем уже известно, на конференции Hot Chips 31 компания Huawei представила самый мощный в мире ИИ-процессор Ascend 910. Процессоры для ИИ каждый разрабатывает во что горазд, но все разработчики сравнивают свои творения с ИИ-процессорами компании NVIDIA (а NVIDIA с процессорами Intel Xeon). Такова участь пионера. NVIDIA одной из первых широко начала продвигать свои модифицированные графические архитектуры в качестве ускорителей для решения задач с машинным обучением.

Гибкость GPU звездой взошла над косностью x86-совместимой архитектуры, но во время появления новых подходов и методов тренировки машинного обучения, где пока много открытых дорожек, она рискует стать одной из немногих. Компания Huawei со своими платформами вполне способна стать лучшей альтернативой решениям NVIDIA. Как минимум, это произойдёт в Китае, где Huawei готовится выпускать и надеется найти сбыт для миллионов процессоров для машинного обучения.

Мы уже публиковали анонс наиболее мощного ускорителя для ML чипа Huawei Ascend 910. Сейчас посмотрим на это решение чуть пристальнее. Итак, Ascend 910 выпускается компанией TSMC с использованием второго поколения 7-нм техпроцесса (7+ EUV). Это техпроцесс характеризуется использованием сканеров EUV для изготовления нескольких слоёв чипа. На конференции Huawei сравнивала Ascend 910 с ИИ-решением NVIDIA на архитектуре Volta, выпущенном TSMC с использованием 12-нм FinFET техпроцесса. Выше на картинке приводятся данные для Ascend 910 и Volta, с нормализацией к 12-нм техпроцессу. Площадь решения Huawei на кристалле в 2,5 раза больше, чем у NVIDIA, но при этом производительность Ascend 910 оказывается в 4,7 раза выше, чем у архитектуры Volta.

Также на схеме видно, что Huawei заявляет о крайне высокой масштабируемости архитектуры. Ядра DaVinci, лежащие в основе Ascend 910, могут выпускаться в конфигурации для оперирования скалярными величинами (16), векторными (16 × 16) и матричными (16 × 16 × 16). Это означает, что архитектура и ядра DaVinci появятся во всём спектре устройств от IoT и носимой электроники до суперкомпьютеров (от платформ с принятием решений до машинного обучения). Чип Ascend 910 несёт матричные ядра, как предназначенный для наиболее интенсивной работы.

Ядро DaVinci в максимальной конфигурации (для Ascend 910) содержит 4096 блоков Cube для вычислений с половинной точностью (FP16). Также в ядро входят специализированные блоки для обработки скалярных (INT8) и векторных величин. Пиковая производительность Ascend с 32 ядрами DaVinci достигает 256 терафлопс для FP16 и 512 терафлопс для целочисленных значений. Всё это при потреблении до 350 Вт. Альтернатива от NVIDIA на тензорных ядрах способна максимум на 125 терафлопс для FP16. Для решения задач ML чип Huawei оказывается в два раза производительнее.

Помимо ядер DaVinci на кристалле Ascend 910 находятся несколько других блоков, включая контроллер памяти HBM2, 128-канальный движок для декодирования видеопотоков. Мощный чип для операций ввода/вывода Nimbus V3 выполнен на отдельном кристалле на той же подложке. Рядом с ним для механической прочности всей конструкции пришлось расположить два кристалла-заглушки, каждый из которых имеет площадь 110 мм2. С учётом болванок и четырёх чипов HBM2 площадь всех кристаллов достигает 1228 мм2.

Для связи ядер и памяти на кристалле создана ячеистая сеть в конфигурации 6 строк на 4 колонки со скоростью доступа 128 Гбайт/с на каждое ядро для одновременных операций записи и чтения. Для соединения с соседними чипами предусмотрена шина со скоростью 720 Гбит/с и два линка RoCE со скоростью 100 Гбит/с. К кеш-памяти L2 ядра могут обращаться с производительностью до 4 Тбайт/с. Скорость доступа к памяти HBM2 достигает 1,2 Тбайт/с.

В каждый полочный корпус входят по 8 процессоров Ascend 910 и блок с двумя процессорами Intel Xeon Scalable. Спецификации полки ниже на картинке. Решения собираются в кластер из 2048 узлов суммарной производительностью 512 петафлопс для операций FP16. Кластеры NVIDIA DGX Superpod обещают производительность до 9,4 петафлопс для сборки из 96 узлов. В сравнении с предложением Huawei это выглядит бледно, но создаёт стимул рваться вперёд.

Постоянный URL: http://servernews.ru/993066
Система Orphus