Материалы по тегу: ascend
|
22.08.2024 [10:59], Сергей Карасёв
Exascend представила SSD на 15,36 Тбайт с SATA-интерфейсом и широким температурным диапазономКомпания Exascend объявила о расширении семейств индустриальных накопителей SA4, SI4 и SE4, в которые входят SSD в различных форм-факторах с интерфейсом SATA-3. Во всех этих сериях появилась SFF-модель вместимостью 15,36 Тбайт на основе чипов флеш-памяти 3D TLC NAND. Все три новинки заключены в корпус толщиной 7 мм. Скорость последовательного чтения информации достигает 560 Мбайт/с, скорость последовательной записи — 535 Мбайт/с. Реализована поддержка TCG Opal 2.01 и AES-256. Средняя наработка на отказ (величина MTBF) достигает 2 млн часов. В устройствах применена технология непосредственной записи в TLC-память (write-to-TLC) для поддержания стабильной скорости чтения и записи: это позволяет компенсировать падение производительности при исчерпании кеша SLC. Имеется встроенная защита от потери питания (PLP). У моделей SA4 и SI4 диапазон рабочих температур простирается от -40 до +85 °C. Показатель IOPS (операций ввода/вывода в секунду) при произвольных чтении и записи данных блоками по 4 Кбайт находится на уровне 97 тыс. и 26 тыс. соответственно. При этом для изделий серии SA4 предусмотрено специальное покрытие для защиты от негативных воздействий окружающей среды. Устройства рассчитаны на 0,6 полных перезаписи в сутки (показатель DWPD) на протяжении трёх лет. Накопитель SE4, в свою очередь, имеет диапазон рабочих температур от 0 до +70 °C. Величина IOPS составляет до 97 тыс. при чтении и до 18 тыс. при записи. Значение DWPD — 0,6 на протяжении пяти лет.
13.08.2024 [20:33], Владимир Мироненко
Huawei готовит к выпуску ИИ-ускоритель Ascend 910C, конкурента NVIDIA H100Huawei Technologies вскоре представит новый ИИ-ускоритель Ascend 910C, сопоставимый по производительности с NVIDIA H100, сообщила газета The Wall Street Journal со ссылкой на информированные источники. По их словам, китайские интернет-компании и операторы в последние недели тестировали этот чип и в настоящее время ByteDance (материнская компания TikTok), поисковик Baidu и государственный оператор связи China Mobile ведут переговоры по поводу его поставок. Судя по озвученным цифрам, заказы могут превысить 70 тыс. шт. на общую сумму около $2 млрд. Huawei намерена начать поставки уже в октябре, сообщили источники, но компания не стала комментировать эти сообщения. Huawei была включена в «чёрный» список Entity List Министерства торговли США в 2019 году, что лишило её возможности производить закупки передовых чипов и оборудования для их выпуска, а также размещать заказы на производство микросхем за пределами Поднебесной. Однако благодаря многомиллиардной государственной поддержке компания стала национальным лидером во многих областях, включая ИИ, и ключевой частью усилий Пекина по «удалению» американских технологий, отметила WSJ. При этом Китай наращивает поддержку отечественного производства полупроводников и в мае выделил $48 млрд в рамках третьего транша национального инвестиционного фонда для этой отрасли.
Источник изображения: huaweicentral.com Из-за санкций США китайским клиентам NVIDIA приходится довольствоваться ИИ-ускорителем H20, разработанным специально для Китая с учётом экспортных ограничений Министерства торговли США, в то время как американские клиенты NVIDIA, такие, как OpenAI, Amazon и Google, вскоре получат доступ к гораздо более производительным чипам, включая GB200. NVIDIA также готовит для Китая чип B20, хотя есть опасения, что и он может попасть под новые ограничения США. По оценкам аналитиков SemiAnalysis, 910C может быть даже лучше, чем B20, и если Huawei сможет наладить выпуск нового чипа, а NVIDIA по-прежнему не сможет продавать китайским клиентам передовые ускорители, то у последней все шансы быстро потерять долю рынка в стране. Согласно подсчётам SemiAnalysis, в 2025 году Huawei может произвести 1,3–1,4 млн ускорителей 910C, если не столкнётся с дополнительными ограничениями США. Аналитики ожидают, что NVIDIA продаст более 1 млн H20 в Китае в этом году на сумму около $12 млрд, т.е. в штучном выражении примерно вдове больше, чем Huawei 910B. По словам источников, в последние недели Huawei начала накапливать запасы HBM-чипов, используемых в ИИ-ускорителях, в связи с опасениями ввода США новых экспортных ограничений. На прошедшей в июне конференции, посвящённой полупроводниковой промышленности, представитель руководства Huawei сообщил, что почти половина больших языковых моделей (LLM), созданных в Китае, была обучена с помощью ускорителей компании. Он также отметил, что в этих задачах 910B превосходит по производительности NVIDIA A100.
17.04.2024 [12:56], Сергей Карасёв
Exascend представила SSD серии PR4 с защитой от радиации: M.2, E1.S и U.2 ёмкостью до 15,36 ТбайтКомпания Exascend анонсировала SSD повышенной надёжности семейства PR4, предназначенные для эксплуатации в экстремальных условиях, включая космическое пространство. В серию вошли изделия в форматах M.2 2280/2242, E1.S и U.2 с интерфейсом PCIe 4.0 (NVMe 1.4). Накопители выполнены по технологии Neutron Shield 2.0, которая обеспечивает защиту от радиации. Средства Dual Power Loss Protection (PLP) отвечают за сохранность данных при внезапном отключении питания. Устройства соответствуют стандарту MIL-STD-810, что означает защиту от ударов, вибрации и других воздействий. Специальное покрытие ограждает от негативного воздействия влаги. Диапазон рабочих температур простирается от -40 до +85 °C. Применены 176-слойные чипы флеш-памяти 3D TLC. Изделия M.2 имеют вместимость от 960 Гбайт до 7,68 Тбайт. Заявленная скорость последовательного чтения и записи данных достигает соответственно 3200 и 3000 Мбайт/с. Показатель IOPS (операций ввода/вывода в секунду) при работе с блоками по 4 Кбайт — до 400 тыс. при произвольном чтении и до 50 тыс. при произвольной записи. Устройства E1.S также имеют ёмкость от 960 Гбайт до 7,68 Тбайт, а SSD формата U.2 — от 960 Гбайт до 15,36 Тбайт. У накопителей этих двух типов скорость чтения составляет до 3500 Мбайт/с, скорость записи — до 3000 Мбайт/с. Значение IOPS при чтении и записи — до 500 тыс. и 55 тыс. соответственно. В новинках реализованы технологии Exascend Adaptive Thermal Control и SuperCruise, оптимизирующие производительность путём интеллектуального управления температурным режимом и использования специальных алгоритмов записи. Говорится о поддержке TCG Opal 2.0 и шифрования AES-256. Значение MTBF (средняя наработка на отказ) — 2 млн часов. Накопители способны выдерживать до 0,6 полных перезаписи в сутки (показатель DWPD) на протяжении трёх лет. Энергопотребление в активном режиме не превышает 8 Вт, в режиме простоя — 1 Вт. Предоставляется трёхлетняя гарантия.
27.08.2019 [11:00], Геннадий Детинич
Huawei Ascend 910: китайская альтернатива ИИ-платформам NVIDIAГлубокое машинное обучение ― это сравнительно новая область приложения для вычислительных архитектур. Как всё новое, ML заставляет искать альтернативные пути решения задач. В этом поиске китайские разработчики оказались на равных и даже в привилегированных условиях, что привело к появлению в Китае мощнейших ИИ-платформ. Как всем уже известно, на конференции Hot Chips 31 компания Huawei представила самый мощный в мире ИИ-процессор Ascend 910. Процессоры для ИИ каждый разрабатывает во что горазд, но все разработчики сравнивают свои творения с ИИ-процессорами компании NVIDIA (а NVIDIA с процессорами Intel Xeon). Такова участь пионера. NVIDIA одной из первых широко начала продвигать свои модифицированные графические архитектуры в качестве ускорителей для решения задач с машинным обучением. ![]() Гибкость GPU звездой взошла над косностью x86-совместимой архитектуры, но во время появления новых подходов и методов тренировки машинного обучения, где пока много открытых дорожек, она рискует стать одной из немногих. Компания Huawei со своими платформами вполне способна стать лучшей альтернативой решениям NVIDIA. Как минимум, это произойдёт в Китае, где Huawei готовится выпускать и надеется найти сбыт для миллионов процессоров для машинного обучения. ![]() Мы уже публиковали анонс наиболее мощного ускорителя для ML чипа Huawei Ascend 910. Сейчас посмотрим на это решение чуть пристальнее. Итак, Ascend 910 выпускается компанией TSMC с использованием второго поколения 7-нм техпроцесса (7+ EUV). Это техпроцесс характеризуется использованием сканеров EUV для изготовления нескольких слоёв чипа. На конференции Huawei сравнивала Ascend 910 с ИИ-решением NVIDIA на архитектуре Volta, выпущенном TSMC с использованием 12-нм FinFET техпроцесса. Выше на картинке приводятся данные для Ascend 910 и Volta, с нормализацией к 12-нм техпроцессу. Площадь решения Huawei на кристалле в 2,5 раза больше, чем у NVIDIA, но при этом производительность Ascend 910 оказывается в 4,7 раза выше, чем у архитектуры Volta. ![]() Также на схеме видно, что Huawei заявляет о крайне высокой масштабируемости архитектуры. Ядра DaVinci, лежащие в основе Ascend 910, могут выпускаться в конфигурации для оперирования скалярными величинами (16), векторными (16 × 16) и матричными (16 × 16 × 16). Это означает, что архитектура и ядра DaVinci появятся во всём спектре устройств от IoT и носимой электроники до суперкомпьютеров (от платформ с принятием решений до машинного обучения). Чип Ascend 910 несёт матричные ядра, как предназначенный для наиболее интенсивной работы. ![]() Ядро DaVinci в максимальной конфигурации (для Ascend 910) содержит 4096 блоков Cube для вычислений с половинной точностью (FP16). Также в ядро входят специализированные блоки для обработки скалярных (INT8) и векторных величин. Пиковая производительность Ascend с 32 ядрами DaVinci достигает 256 терафлопс для FP16 и 512 терафлопс для целочисленных значений. Всё это при потреблении до 350 Вт. Альтернатива от NVIDIA на тензорных ядрах способна максимум на 125 терафлопс для FP16. Для решения задач ML чип Huawei оказывается в два раза производительнее. ![]() Помимо ядер DaVinci на кристалле Ascend 910 находятся несколько других блоков, включая контроллер памяти HBM2, 128-канальный движок для декодирования видеопотоков. Мощный чип для операций ввода/вывода Nimbus V3 выполнен на отдельном кристалле на той же подложке. Рядом с ним для механической прочности всей конструкции пришлось расположить два кристалла-заглушки, каждый из которых имеет площадь 110 мм2. С учётом болванок и четырёх чипов HBM2 площадь всех кристаллов достигает 1228 мм2. ![]() Для связи ядер и памяти на кристалле создана ячеистая сеть в конфигурации 6 строк на 4 колонки со скоростью доступа 128 Гбайт/с на каждое ядро для одновременных операций записи и чтения. Для соединения с соседними чипами предусмотрена шина со скоростью 720 Гбит/с и два линка RoCE со скоростью 100 Гбит/с. К кеш-памяти L2 ядра могут обращаться с производительностью до 4 Тбайт/с. Скорость доступа к памяти HBM2 достигает 1,2 Тбайт/с. ![]() В каждый полочный корпус входят по 8 процессоров Ascend 910 и блок с двумя процессорами Intel Xeon Scalable. Спецификации полки ниже на картинке. Решения собираются в кластер из 2048 узлов суммарной производительностью 512 петафлопс для операций FP16. Кластеры NVIDIA DGX Superpod обещают производительность до 9,4 петафлопс для сборки из 96 узлов. В сравнении с предложением Huawei это выглядит бледно, но создаёт стимул рваться вперёд.
![]() |
|








