Материалы по тегу: pci express 5.0
11.09.2024 [11:05], Сергей Карасёв
SK hynix анонсировала быстрые SSD PEB110 в формате E1.S с интерфейсом PCIe 5.0 и памятью 4D NANDКомпания SK hynix объявила о разработке высокопроизводительных SSD семейства PEB110, предназначенных для применения в дата-центрах. Утверждается, что эти накопители обеспечивают двукратный рост производительности и более чем 30-% улучшение энергоэффективности по сравнению с изделиями предыдущего поколения. Новинки, выполненные в форм-факторе E1.S, оснащены интерфейсом PCIe 5.0. Вместимость составляет 2, 4 и 8 Тбайт. Накопители выполнены на основе 238-слойных чипов флеш-памяти 4D NAND. Говорится о поддержке спецификации OCP 2.5. Кроме того, упомянута технология SPDM (Security Protocol and Data Model): она отвечает за безопасную аутентификацию и мониторинг серверов. Прочие технические характеристики пока не раскрываются. SSD серии PEB110 ориентированы на работу с ресурсоёмкими ИИ-приложениями. В настоящее время устройства проходят квалификацию у потенциальных заказчиков из числа крупных операторов ЦОД. Массовое производство накопителей планируется организовать во II квартале 2025 года. «Новый продукт создан на основе лучшей в своём классе памяти 4D NAND, которая может похвастаться самыми высокими в отрасли показателями производительности, качества и стоимости», — говорит Ан Хён (Ahn Hyun), глава подразделения N-S Committee в составе SK hynix.
05.09.2024 [11:21], Сергей Карасёв
Innodisk представила CXL-модули памяти объёмом 64 Гбайт для ИИ-серверовКомпания Innodisk анонсировала модуль памяти CXL (Compute Express Link), разработанный с прицелом на системы ИИ и облачные дата-центры. Массовые поставки изделия планируется организовать в I квартале 2025 года. Спрос на ИИ-серверы быстро растет. Согласно прогнозам Trendforce, в 2024 году такие системы займут примерно 65 % глобального рынка серверов (в деньгах). По словам Innodisk, сейчас ИИ-системам требуется не менее 1,2 Тбайт оперативной памяти для эффективной работы. Традиционные изделия DDR не всегда способны удовлетворить предъявляемые требования, что приводит к таким проблемам, как недоиспользование ресурсов CPU и увеличение задержек, говорит компания. Модули CXL призваны устранить подобные ограничения. Напомним, CXL — это высокоскоростной интерконнект, обеспечивающий взаимодействие хост-процессора с акселераторами, буферами памяти, устройствами ввода/вывода и пр. Решение Innodisk использует интерфейс PCIe 5.0 x8 и имеет ёмкость 64 Гбайт. Модуль обеспечивает пропускную способность до 32 Гбайт/с. Говорится о совместимости с CXL 1.1/2.0. Устройство выполнено в форм-факторе E3.S 2T и оснащено коннектором EDSFF 2C. Диапазон рабочих температур простирается от 0 до +70 °C. Отмечается, что в случае установки четырёх модулей Innodisk CXL на 64 Гбайт каждый в сервер, который несёт на борту восемь DIMM по 128 Гбайт, общий объём памяти может быть увеличен на четверть, а общая пропускная способность — на 40 %. При этом CXL обеспечивает пулинг памяти, что позволяет оптимизировать совместное использование ресурсов и повысить общую эффективность системы.
31.08.2024 [00:39], Алексей Степин
Новые мейнфреймы IBM z получат ИИ-ускорители SpyreВместе с процессорами Telum II для систем z17 компания IBM представила и собственные ускорители Spyre, ещё больше расширяющие возможности будущих мейнфреймов в области обработки ИИ-нагрузок. Они станут дополнением к встроенным в Telum ИИ-блокам. Spyre представляет собой плату расширения с интерфейсом PCIe 5.0 x16 и теплопакетом 75 Вт. Помимо самого нейропроцессора IBM на ней установлено 128 Гбайт памяти LPDDR5, а производительность в ИИ-задачах оценивается производителем в более чем 300 Топс, т.е. новинки подходят для инференса крупных моделей. Сам чип приозводится с использованием 5-нм техпроцесса Samsung 5LPE и содержит 26 млрд транзисторов, а площадь его кристалла составляет 330 мм2. Spyre включает 32 ядра, каждое из которых дополнено 2 Мбайт быстрой скрэтч-памяти. Отдельно отмечено, что последняя не является кешем. При этом заявлена эффективность использования доступных вычислительных ресурсов — свыше 55 % на ядро. Каждое ядро содержит 78 матричных блоков и раздельные FP16-аккумуляторы, по восемь на «вход» и «выход». Интересно, что ядра Spyre и скрэтч-память используют отдельные кольцевые двунаправленные шины разной разрядности (32 и 128 бит соответственно), причём с оперативной памятью на скорости 200 Гбайт/с соединена именно вторая. Каждый узел (drawer) на базе Telum II способен вместить восемь плат Spyre, которые формируют логический кластер, располагающий 1 Тбайт памяти с совокупной ПСП 1,6 Тбайт/с, но, разумеется, каждая плата будет ограничена 128 Гбайт/с из-за интерфейса PCIe 5.0 x16. Spyre создан с упором на предиктивный и генеративный ИИ, благо в полной комплектации новые мейнфреймы могут нести 96 таких ускорителей и развивать до 30 ПОпс (Петаопс). Новинки рассчитаны на работу в средах zCX или Linux on Z, сопровождаются оптимизированным набором библиотек и совместимы с популярными фреймворками Pytoch, TensorFlow и ONNX. Они станут частью программных платформ IBM watsonx и Red Hat OpenShift. Новые мейнфреймы IBM z17 должны дебютировать на рынке в 2025 году. А в собственном облаке IBM будет также полагаться и на Intel Gaudi 3.
27.08.2024 [12:08], Сергей Карасёв
Стартап FuriosaAI представил эффективный ИИ-ускоритель RNGD для LLM и мультимодальных моделейЮжнокорейский стартап FuriosaAI на мероприятии анонсировал специализированный чип RNGD (произносится как «Renegade»), который позиционируется в качестве альтернативы ускорителям NVIDIA. Новинка предназначена для работы с большими языковыми моделями (LLM) и мультимодальным ИИ. FuriosaAI основана в 2017 году тремя инженерами, ранее работавшими в AMD, Qualcomm и Samsung. Своё первое решение компания выпустила в 2021 году: чип Warboy представляет собой высокопроизводительный ЦОД-ускоритель, специально разработанный для рабочих нагрузок компьютерного зрения. Новое изделие RNGD, как утверждает FuriosaAI, является результатом многолетних инноваций. Чип изготавливается по 5-нм техпроцессу TSMC. ИИ-ускоритель на базе RNGD выполнен в виде карты расширения PCIe 5.0 x16. Он наделён 48 Гбайт памяти HBM3 с пропускной способностью до 1,5 Тбайт/с и 256 Мбайт памяти SRAM (384 Тбайт/с). Показатель TDP находится на уровне 150 Вт, что позволяет использовать устройство в системах с воздушным охлаждением. Для сравнения: у некоторых ускорителей на базе GPU величина TDP достигает 1000 Вт и более. Утверждается, что RNGD обеспечивает производительность до 512 Тфлопс в режиме FP8 и до 256 Тфлопс в режиме BF16. Быстродействие INT8/INT4 достигает 512/1024 TOPS. Карта позволяет эффективно запускать открытые LLM, такие как Llama 3.1 8B. Говорится, что один PCIe-ускоритель RNGD обеспечивает пропускную способность от 2000 до 3000 токенов в секунду (в зависимости от длины контекста) для моделей с примерно 10 млрд параметров. В системе можно объединить до восьми карт для работы с моделями, насчитывающими около 100 млрд параметров. RNGD основан на архитектуре свёртки тензора (Tensor Contraction Processor, TCP), которая, как отмечается, обеспечивает оптимальный баланс между эффективностью, программируемостью и производительностью. Программный стек состоит из компрессора моделей, сервисного фреймворка, среды выполнения, компилятора, профилировщика, отладчика и набора API для простоты программирования и развёртывания. Говорится, что чипы RNGD можно настроить для выполнения практически любой рабочей нагрузки LLM или мультимодального ИИ.
20.08.2024 [22:00], Елена Копытова
В накопителях Western Digital Ultrastar DC SN861 обнаружился SSD-контроллер FADUВо время анонса накопителей Ultrastar DC SN861 компания Western Digital не стала уточнять, какой именно контроллер применён в новых SSD, что привело к предположениям об использование контроллера собственной разработки. Теперь же выяснилось, что в новинках используется решение южнокорейской компании Fadu, передаёт AnandTech. FADU, основанная в 2015 году, специализируется на создании решений для твердотельных накопителей корпоративного класса, к которым относится и Ultrastar DC SN861. Накопитель оснащён контроллером FADU FC5161, который поддерживает 16 NAND-каналов с интерфейсом ONFi 5.0, обеспечивающим скорость передачи данных до 2400 МТ/с. Контроллер также предлагает поддержку спецификации OCP Cloud Spec 2.0, SR-IOV, до 512 пространств имён ZNS, FDP (гибкое размещение данных), защиту от потери питания, сквозную защиту целостности данных и другие функции. FC5161 использует интерфейс PCIe 5.0 (x4 или два x2) и соответствует спецификациями NVMe 2.0 и NVMe-MI 1.2 Скорость последовательного у Ultrastar DC SN861 чтения достигает 13,7 Гбайт/с, последовательной записи — 7,5 Гбайт/с. Производительность на случайных операций накопитель составляет до 3,3 млн IOPS при чтении блоков размером 4К и до 0,8 млн IOPS при случайной записи. Накопители выпускаются в разных объёмах, начиная от 1,6 Тбайт и заканчивая 7,68 Тбайт, с заявленным уровнем надежности 1–3 DWPD в течение 5 лет. SSD доступен в форм-факторах E1.S (15 мм) и U.2 (15 мм). E1.S-вариант поддерживает FDP и оптимизирован для облачных сред, а U.2-модификация ориентирована на корпоративные нагрузки и новые приложения, такие как ИИ. У Ultrastar DC SN861 есть ещё одна отличительная особенность: энергопотребление в режиме ожидания составляет порядка 5 Вт или менее, что относительно немного по меркам накопителей корпоративного класса и, например, на 1 Вт меньше по сравнению с DC SN840. Хотя разница с предшественниками может составлять всего 1 Вт, для гиперскейлеров, которые используют тысячи накопителей, каждый Ватт имеет значение. На данный момент Ultrastar DC SN861 доступен для приобретения избранным крупным заказчикам, например, Meta✴.
09.08.2024 [22:50], Алексей Степин
Звание самого быстрого SSD перешло к Samsung PM1753На мероприятии FMS 2024 компания Samsung показала новые серверные SSD PM1753 и BM1743. Последний был ансонирован месяц назад, а на FMS был впервые показана модификация объёмом 128 Тбайт, ставшая достойным ответом решениям Solidigm, Pascari (Phison) и Western Digital. Несмотря на использование QLC (v7 vNAND), у BM1743 достаточно высокие показатели производительности: линейные скорости чтения и записи составляют 7,5 Гбайт/с и 3,5 Гбайт/с соответственно. На случайных операциях SSD развивает 1,6 млн и 45 тыс IOPS. BM1743 использует форм-фактор U.2 и интерфейс PCIe 4.0, а с последними версиями прошивки он стал заметно экономичнее и потребляет в режиме простоя лишь около 2 Вт. Где-то в 2024–2026 гг. Samsung должна представить массовые решения объёмом 256 Тбайт, а в следующие за ним пару лет довести ёмкость и до 512 Тбайт. В последнем случае, как ожидается, накопители будут представлены исключительно в форм-факторе EDSFF E3.L. К 2035 году компания намеревается выпустить SSD объёмом 1 Пбайт. А вот Samsung PM1753 относится к совсем иному классу решений. Новинка ориентирована на ЦОД нового поколения с инфраструктурой PCI Express 5.0 и будет поставляться в форм-факторах U.2 и E3.S. Предельный объём здесь составляет 32 Тбайт, зато производительность благодаря 16-канальному контроллеру у него приличная: чтение 14,8 Гбайт/с, запись 11 Гбайт/с. Для случайных операций заявлены 3,4 млн и 600 тыс IOPS соответственно. Таким образом, меньше чем за месяц звание самого быстрого SSD перешло от Micron 9550 к Solidigm D7-PS1010, а теперь и к Samsung PM1753, если, конечно, не учитывать формальный рекорд Kioxia CM7-R ещё двухлетней давности. В основе PM1753 лежит девятое поколение TLC V-NAND, обеспечивающее повышенную в 1,6–1,7 раза энергоэффективность в сравнении с решениями предыдущего поколения. В простое PM1753, как обещается, будет потреблять лишь 4 Ватта. Естественно, новинки ориентированы на современные ИИ-инфраструктуры. Интересны и Samsung PM9D3a, представленные в форм-факторах M.2, U.2 и E1.S/E3.S 1T. В первом случае ёмкость ограничена значением 4 Тбайт, более крупные форматы включают в себя модели объёмом до 32 Тбайт. Они используют 8-канальный контроллер с PCIe 5.0, обеспечивающий при записи до 50 тыс IOPS на каждый Тбайт. Производительность при случайном чтении у этой новинки достигает 1,8 млн IOPS, линейные скорости чтения и записи составляют 12 Гбайт/с и 7 Гбайт/с, соответственно. PM9D3a являются первыми накопителями Samsung с технологией Flexible Data Placement (FDP), которая позволяет группировать данные для совместной записи по команде хоста. Эти накопители отличаются высокой гибкостью конфигурирования, улучшенной энергоэффективностью, предсказуемой и настраиваемой производительностью, а также низким TCO. Поэтому нацелены они в первую очередь на гиперскейлеров.
08.08.2024 [11:56], Сергей Карасёв
Solidigm и Phison анонсировали SSD ёмкостью 122 Тбайт, а Western Digital — 128 Тбайт
edsff
hardware
nvme
pci express 4.0
pci express 5.0
phison
qlc nand
solidigm
ssd
u.2
u.3
western digital
Компании Western Digital, Solidigm и Phison анонсировали SSD большой вместимости, предназначенные прежде всего для использования в дата-центрах, ориентированных на задачи ИИ. Во всех изделиях применяются чипы флеш-памяти QLC NAND (четыре бита информации на ячейку). Новинка Western Digital имеет ёмкость 128 Тбайт. Применены 218-слойные чипы Kioxia BiCS8 QLC NAND. Образец устройства продемонстрирован на выставке FMS 2024 (the Future of Memory and Storage). Решение будет предлагаться в форм-факторах U.2/U.3. Прошивка накопителя оптимизирована для обслуживания контрольных точек ИИ — рабочей нагрузки, которая включает в себя всплески последовательной записи, но также требует, чтобы SSD поддерживал приемлемую производительность для одновременных операций чтения. На этих задачах скорость достигает соответственно 6,32 Гбайт/с и 3,13 Гбайт/с. В свою очередь, Solidigm показала на FMS 2024 QLC-накопитель формата U.2, способный хранить 122 Тбайт информации. Работа устройства, оснащённого интерфейсом PCIe 4.0, была показана в составе сервера типоразмера 2U. Достигается скорость последовательного чтения данных до 7186 Мбайт/с и скорость последовательной записи до 3307 Мбайт/с. Показатель IOPS (операций ввода/вывода в секунду) при произвольном чтении блоков по 4 Кбайт — 1,27 млн. Поставки таких SSD планируется организовать в начале 2025 года. Phison представила QLC-накопители Pascari D200V в форматах U.2, E3.S и E3.L. Их ёмкость варьируется от 30,72 до 122,88 Тбайт. Задействован интерфейс PCIe 5.0. Заявленная скорость последовательного чтения составляет до 14 000 Мбайт/с, скорость последовательной записи — до 2100 Мбайт/с. Значение IOPS при произвольном чтении (4 Кбайт) достигает 3 млн, при произвольной записи (16 Кбайт) — 15,6 тыс. Реализована поддержка TCG Opal 2.0 и AES-XTS 256. Диапазон рабочих температур — от 0 до +70 °C.
06.08.2024 [23:55], Алексей Степин
Самый быстрый SSD и подходит для ИИ: Solidigm представила PCIe 5.0 накопители D7-PS1010 и D7-PS1030Компания Solidigm представила серию производительных SSD D7-PS1010 и D7-PS1030 на базе новой 176-слойной флеш-памяти SK hynix. Главным нововведением можно назвать переход на более новую версию интерфейса: если D7-P5x20 использовали PCI Express 4.0, то в D7-PS10x0 используется PCI Express 5.0. Это позволило довести скорость чтения до 14,5 Гбайт/c и, чуть-чуть обогнав Micron 9550 по этому показателю, назвать новинки самыми производительными в мире SSD. Новые накопители ориентированы на сценарии с высокой интенсивностью IO-операций ввода-вывода, характерных, в числе прочего, и для ИИ-нагрузок. Оба модельных ряда представлены в форм-факторах E3.S (7,5 мм) и U.2 (15 мм). В иерархии накопителей Solidigm новинки расположились сразу за D7-P5810, которые используют флеш-память в режиме SLC. Третья цифра в обозначении новых моделей означает число полных перезаписей в день (DPWD) в течение 5 лет. Таким образом, D7-PS1010 представляют собой SSD для смешанных нагрузок с показателем PBW в 28 Пбайт для старшей модели (1 DWPD), а D7-PS1030 покажут большую надёжность в сценариях с активной записью данных (3 DWPD), поскольку гарантированно выдержат до 70 Пбайт записи. Для всех вариантов заявлена наработка на отказ на уровне 2,5 млн часов. Наличие защиты от сбоев по питанию и коррекции ошибок в SRAM позволяет заявить о высоком уровне надёжности (UBER) — по словам производителя, он в 100 раз превышает требования JEDEC. Новинки соответствуют стандартам NVMe v2.0, NVMe-MI v1.2, OCP v2.0r21, TCG-OPAL 2.02, DMTF SPDM 1.1.0 и поддерживают Secure Boot, подписанные прошивки, безопасное стирание, управление жизненным циклом и т.д. Модельный ряд PS1010 стартует с отметки 1,92 Тбайт и заканчивается версией объёмом 15,36 Тбайт, а PS1030 в силу ориентации на повышенную надёжность выпускаются объёмами от 1,6 до 12,8 Тбайт. Показатели линейной скорости записи начинаются с 4,1 Гбайт/с, версии объёмом 3,2/3,84 Тбайт развивают 8,2 Гбайт/с, а наиболее ёмкие варианты — 9,3 Гбайт/с. Производительность на случайных операциях лежит в пределах 2,35–3,1 млн IOPS при чтении и 0,15–0,8 млн IOPS при записи. Новые SSD очень экономичны, удельное соотношение производительности к энергопотреблению, по словам Solidigm, у них на 70 % лучше, нежели у решений иных производителей. При этом производительность новинок в нагрузках с высокой долей случайных операций чтения на 46 % выше, чем у конкурентов. Вкупе с поддержкой GPUDirect это делает D7-PS1010 и D7-PS1030 идеальным выбором при построении ИИ-кластеров, говорит производитель.
06.08.2024 [11:35], Сергей Карасёв
Microchip представила скоростной SSD-контроллер Flashtec NVMe 5016: до 14 Гбайт/с по PCIe 5.0Компания Microchip Technology анонсировала контроллер Flashtec NVMe 5016, предназначенный для создания высокопроизводительных SSD корпоративного класса с интерфейсом PCIe 5.0 (NVMe 2.0+). Такие накопители смогут применяться в том числе в дата-центрах, ориентированных на ресурсоёмкие ИИ-задачи. 16-канальный контроллер Flashtec NVMe 5016, как утверждает разработчик, способен обеспечивать скорость последовательного чтения информации более 14 Гбайт/с. Показатель IOPS (операций ввода/вывода в секунду) при произвольном чтении 4K-блоками достигает 3,5 млн. Контроллер поддерживает как однопортовую конфигурацию PCIe 5.0 x4, так и двухпортовую (два x2). Новинка рассчитана в первую очередь на накопители в форм-факторах E.3 и U.2/U.3. Контроллер может работать с чипами флеш-памяти разного типа, включая QLC, TLC, MLC, SLC NAND (Toggle/ONFI 3200 МТ/с). В качестве буфера можно использовать DDR5-5200. Реализованы средства коррекции ошибок LDPC/ECC и сквозная защита целостности данных. Также в состав контроллера входит ML-движок для интеллектуального управления накопителем. Заявленная энергетическая эффективность при обработке данных составляет 2,5 Гбайт в расчёте на 1 Вт. При производстве Flashtec NVMe 5016 используется 6-нм техпроцесс. По заявлениям Microchip, новый контроллер предназначен для поддержания различных корпоративных приложений, таких как обработка транзакций и финансовых данных, интеллектуальный анализ информации и пр. Есть поддержка ZNS, FDP, виртуализации (PF/VF), SRIOV. Гибкость и масштабируемость изделия помогают снизить общую стоимость владения инфраструктурой хранения данных. Пробные поставки Flashtec NVMe 5016 уже начались. Разработчикам доступны сопутствующие комплекты — решения PM35160-KIT и PMT35161-KIT с различной конфигурацией NAND, а также SDK.
02.08.2024 [13:17], Сергей Карасёв
SSD с «компрессором»: ScaleFlux представила вычислительные NVMe-накопители CSD5000Компания ScaleFlux анонсировала высокопроизводительные вычислительные SSD семейства CSD5000 на базе фирменного контроллера FX5016, предназначенные для поддержания ресурсоёмких рабочих нагрузок, связанных с ИИ, машинным обучением, аналитикой данных и НРС. Устройства будут доступны в исполнениях U.2/U.3, E3.S, E1.S и E1.L. Для обмена данными служит интерфейс PCIe 5.0 (NVMe 2.0b): один порт x4 или два x2. Заявлена поддержка TCG Opal 2.02 и шифрования AES-256, NVMe Thin Provisioned Namespaces Virtualization (48PF/32VF), ZNS, FDP, а также совместимость со спецификациями OCP, в том числе в части телеметрии и мониторинга задержек. Реализовано сжатие информации непосредственно на SSD: разработчик подчеркивает, что это позволяет значительно увеличить долговечность накопителей по сравнению с обычными изделиями. В семейство входят модели вместимостью 3,84, 7,68, 15,36, 30,72, 61,44 и 122,88 Тбайт. С учётом компрессии эффективная ёмкость может достигать приблизительно 256 Тбайт. Заявленная скорость последовательного чтения информации составляет до 14 Гбайт/с, скорость последовательной записи — до 11 Гбайт/с. Показатель IOPS (операций ввода/вывода в секунду) при произвольных чтении и записи данных блоками по 4 Кбайт находится на уровне 3,2 млн и 430 тыс. соответственно. При использовании сжатия 2:1, как утверждает разработчик, скорость последовательной записи возрастает до 13 Гбайт/с, а значение IOPS при произвольной записи — до 1,2 млн. ScaleFlux заявляет, что устройства семейства CSD5000 обеспечивают до 3 раз более высокую производительность в расчёте на ватт затрачиваемой энергии по сравнению с конкурирующими изделиями Samsung и Kioxia, поддерживающими интерфейс PCIe 5.0. Энергопотребление составляет менее 18 Вт в активном режиме и менее 5 Вт в режиме простоя. Средняя наработка на отказ (величина MTBF) — 2 млн часов. |
|