Материалы по тегу: s
|
03.03.2025 [22:08], Татьяна Золотова
DDoS-атаки на API выросли в два раза — под прицелом ритейл и банкиВ IV квартале 2024 года количество DDoS-атак на API увеличилось вдвое по сравнению с тем же кварталом 2023 года. При этом 70 % DDoS-атак на API пришлось на ритейл и банки, об этом сообщает аналитический центр компании StormWall. Проанализировав данные клиентов, эксперты StormWall обнаружили, что за отчетный период 38 % DDoS-атак на API пришлось на ритейл (рост на 26 %), 32 % — на банковскую индустрию (рост на 22 %). На рост инцидентов повлияла потребительская активность в дни распродаж «Черная пятница» и подготовка к Новому году, в том числе возрастающий пик платежей в Новогодние праздники. Как поясняют в компании, DDoS-атаки на API направлены на перегрузку серверов, обрабатывающих запросы к API, путем отправки огромного количества запросов. В итоге компании теряют доступ к сервисам, что приводит к простоям и ухудшению пользовательского опыта, финансовым потерям из-за остановки бизнес-процессов.
Источник изображения: StormWall Атаки на API могут иметь такие последствия, как потеря данных, компрометация системы, изменение логики работы приложения или полный выход из строя системы. Достаточно найти уязвимость или вызвать чрезмерную нагрузку на конкретный эндпойнт. Запросы к API часто выглядят как легитимный трафик, что затрудняет их обнаружение и фильтрацию по сравнению с более очевидными атаками типа HTTP Flood. Противостоять DDoS-атакам на API помогут системы мониторинга трафика для обнаружения аномалий, использование WAF для фильтрации вредоносного трафика, создание резервных копий данных и план действий при инцидентах.
02.03.2025 [18:02], Сергей Карасёв
NVIDIA втихую приобрела разработчика сетевых AIOps-решений Augtera NetworksКомпания NVIDIA, по сообщению Datacenter Dynamics, без лишнего шума приобрела стартап Augtera Networks, занимающийся решениями в области AIOps. Финансовые и прочие условия сделки не раскрываются, но известно, что основатели купленной фирмы присоединились к NVIDIA. Концепция AIOps, или ИИ для IT-операций, предполагает применение ИИ для обслуживания IT-инфраструктуры. Могут быть автоматизированы такие задачи, как мониторинг производительности, планирование рабочих нагрузок, резервное копирование данных и пр. Стартап Augtera Networks был основан в 2016 году. Компания привлекла около $18 млн в качестве посевного раунда финансирования и программы Series A, а в число основных инвесторов вошли Bain Capital Ventures, Acrew Capital, Intel Capital и Dell Capital. Стартап разработал инструменты на базе ИИ для автоматизации сетевых операций. В частности, Augtera Networks создала технологию мониторинга сети, предназначенную для обнаружения аномалий, предотвращения сбоев и обеспечения обозреваемости инфраструктуры в режиме реального времени.
Источник изображения: NVIDIA В рамках сделки разработки Augtera Networks будут переданы команде NVIDIA Spectrum-X. Основатель и генеральный директор стартапа Рахул Аггарвал (Rahul Aggarwal) занял пост старшего директора по системному ПО для ИИ-платформ в NVIDIA. Соучредитель Augtera Networks Бхупеш Котари (Bhupesh Kothari) также перешёл в NVIDIA, заняв одну из руководящих должностей. Отмечается, что у Augtera Networks были контракты с Orange, Vyve Broadband и Colt Technologies. А финтех-компания MX Technologies применяла решения Augtera Networks для мониторинга своей сети дата-центров. Будут ли поддерживаться существующие клиенты после сделки, не уточняется.
01.03.2025 [15:45], Сергей Карасёв
MikroTik представила устройство RDS2216 — гибрид Arm-сервера, NAS и коммутатораКомпания MikroTik анонсировала необычную стоечную систему RDS2216, которая фактически объединяет несколько устройств в корпусе формата 1U. Новинка может выполнять функции сервера с архитектурой Arm, сетевого хранилища данных (NAS) и коммутатора. В основу решения положен процессор Annapurna Labs AL73400 (AWS Graviton). Чип объединяет 16 Armv8-ядер Cortex-A72 с частотой до 2 ГГц. В оснащение входят 32 Гбайт оперативной памяти DDR4 и 128 Мбайт флеш-памяти NAND. Задействован коммутационный чип Marvell Prestera 98DX4310 с частичной L3-разгрузкой. Система располагает двумя портами 10GbE с разъёмами RJ45, четырьмя портами SFP28 25GbE, двумя портами QSFP28 100GbE, а также четырьмя 10GbE-портами SFP+. Плюс к этому предусмотрены разъём 1GbE и консольный порт (RJ45). Имеются два порта USB 3.0 Type-A, а также пара SFF-8644. Сервер может нести на борту до 20 накопителей U.2 NVMe толщиной 7 мм (PCIe 3.0 x2) и поддержкой TCG OPAL. Кроме того, могут быть установлены два внутренних модуля М.2 с интерфейсом SATA. Питание обеспечивают два блока с возможностью горячей замены, а за охлаждение отвечают десять вентиляторов. Диапазон рабочих температур простирается от -20 до +50 °C. В качестве программной платформы применяется RouterOS v7 (Special ROSE Edition). Эта система поддерживает такие функции, как шифрование данных, моментальные снимки, сжатие и совместное использование хранилища по протоколам NFS, iSCSI, SMB, NVMe/TCP. Устройство выполнено в оригинальном оливковом цвете. В продажу MikroTik RDS2216 поступит по ориентировочной цене $1950 без установленных накопителей.
28.02.2025 [01:30], Владимир Мироненко
Российский рынок корпоративного ПО в 2024 году без малого достиг уровня 2021 годаРоссийский рынок корпоративного ПО в 2024 году вырос по сравнению с 2023 годом на 34 % до 199 млрд руб., почти достигнув показателя докризисного 2021 года в 201 млрд руб., пишут «Ведомости» со ссылкой на обзор консалтинговой компании Strategy Partners. К корпоративному софту в Strategy Partners относят публичные облачные сервисы, ПО для частных облачных хранилищ данных (облаков), корпоративную связь, управление данными, налоговый мониторинг и HR-Tech (системы автоматизации в области подбора и управления персоналом), без учёта ОС, средств разработки и кибербезопасности. Согласно базовому прогнозу Strategy Partners, в течение ближайших пяти лет рынок корпоративного ПО в России будет расти в среднем (CAGR) на 24 % в год и в 2030 году составит 727 млрд руб. Продажи технологий для управления персоналом будут увеличиваться в среднем на 34 % в год — до 109 млрд руб. в 2030 году. Темпы роста сегмента ПО для частных облаков составят в среднем 30 % в год и в 2030 году он достигнет 115 млрд руб. Другие ключевые сегменты — публичные облачные сервисы, корпоративная связь, управление данными, налоговый мониторинг — будут расти в среднем на 11–25 % в год. По данным StrategyPartners, российский рынок в 2022–2023 гг. покинуло более 200 иностранных IT-компаний, среди которых наиболее заметными в части корпоративного ПО были американские Google, Microsoft, Oracle, AWS, VMware и немецкая SAP. К крупнейшим игрокам российского рынка корпоративного ПО в Strategy Partners относят «Сбер», «Яндекс», VK Tech, «Астру», Т1, МТС, «СКБ Контур», Selectel, «Ростелеком», Arenadata, «1С-битрикс» и «Редсофт». Глава НЦК ИСУ считает, что оценивать рынки только в деньгах некорректно — нужно также смотреть динамику количества лицензий и пользователей. Цены на корпоративное ПО выросли, но выросла и стоимость специалистов — в этом заключается причина такого псевдороста, считает эксперт. Увеличению российского рынка облачных сервисов способствовал рост спроса на виртуальную инфраструктуру для ИИ и популярность гибридных облаков, утверждает представитель «МТС Web Services». В Cloud.ru назвали одним из драйверов роста рынка спрос со стороны крупного бизнеса на решения для частного облака и создания гибридной инфраструктуры. Глава «Базис» считает ключевыми драйверами роста рынка корпоративного ПО цифровую трансформацию экономики и необходимость достижения технологического суверенитета, а также импортозамещение. Представитель Selectel отметил рост потребности в решениях для построения облаков, так как они необходимы для качественного управления растущей IT-инфраструктурой компаний. Эксперты также указали на явный тренд на «коробочные» IТ-решения и развитие экосистемного подхода, в рамках которого создаются маркетплейсы с готовыми отраслевыми и кросс-отраслевыми решениями. Согласно прогнозу Strategy Partners, в период с 2024 по 2030 год рынок корпоративного ПО дружественных стран, к которым аналитики компании относят Казахстан, Узбекистан, Азербайджан и Турцию, может увеличиться втрое до $6,6 млрд. В Казахстане драйвером роста будет развитие программы «Цифровой Казахстан», включающей переход на электронные госуслуги, цифровизацию промышленности и развитие телеком инфраструктуры. В Узбекистане ключевую роль сыграет эффект низкой базы рынка IT. В Азербайджане сосредоточатся на диверсификации и росте несырьевых секторов экономики, а также развитии сферы услуг, в том числе высокотехнологичных, а в Турции — на цифровизации банковского сектора, ретейла, телекома и строительстве крупных инфраструктурных IT-проектов.
27.02.2025 [08:27], Руслан Авдеев
Asperitas выпустила модульные погружные СЖО Direct Forced Convection для GPU-серверовЗанимающаяся разработкой СЖО серверов компания Asperitas запустила новую линейку модульных продуктов Direct Forced Convection (DFCX) для систем иммерсионного охлаждения. Речь идёт о модульных ёмкостях, предназначенных для Edge-объектов, сообщает пресс-служба компании. Продукты были анонсированы ещё в июне 2024 года. Ранее Asperitas предлагала иммерсионный бак с естественной конвекцией, а теперь представлен вариант с принудительной циркуляцией жидкости. Модульная архитектура обеспечивает размещение стоек размером от 12U в каждой ёмкости. Также поддерживаются конфигурации «суперкластера» с многочисленными ёмкостями и блоками распределения жидкости (CDU). Ёмкости для стоек размера 12U обеспечивают отвод до 5 кВт на 1U или более 1 кВт на чип. Решение DFCX1 обеспечивает поддержку кластеров из трёх 4U-узлов с 24 ускорителями с возможностью отвода до 60 кВт. По данным на сайте компании, размеры модуля составляют 600 × 1215 × 1990 мм. Он весит около 1120 кг с вместе с установленным оборудованием. На бак требуется минимум 352 л диэлектрической жидкости, поставщиком которой является Shell. Впрочем, тут же описаны и чуть более скромные возможности охлаждения: до 3,6кВт/1U. Также предусмотрены два места для 19″ коммутаторов глубиной до 480 мм. В компании заявляют, что надёжность и бесшовная интеграция являются базовыми ценностями при разработке продуктов, бизнес компании успешно растёт с системами на основе естественной конвекции Perpetual Natural Convection (PNC) и технологией DFCX, особенно теперь, в эпоху ИИ. Вскоре производитель намерен представить новые продукты серии DFCX, которые поддержат растущие потребности цифровой инфраструктуры.
26.02.2025 [15:12], Сергей Карасёв
1376 ядер и 64 Тбайт RAM: Eviden представила суперсерверы Bullsequana SH с Intel Xeon 6500P/6700P и опциональной СЖОКомпания Eviden, входящая в Atos Group, анонсировала серверы семейства Bullsequana SH, построенные на процессорах Intel Xeon 6 семейства Granite Rapids-SP. По заявлениям разработчика, новые машины по сравнению с системами предыдущего поколения обеспечивают рост производительности в 1,5 раза и увеличение пропускной способности памяти в 1,7 раза. В серию вошли модели BullSequana SH21, SH41, SH81 и SH161 в форм-факторе 2U, 4U, 8U и 19U соответственно. Основой служат двухсокетные 2U-узлы, количество которых составляет один, два, четыре и восемь. Таким образом, общее число процессоров Xeon 6 в составе систем варьируется от 2 до 16. Поддерживаются чипы Xeon 6500P и 6700P, насчитывающие до 86 вычислительных ядер. Таким образом, количество ядер в одной системе может достигать 1376, а потоков — 2752. Узлы SH21, SH41 и SH81 напрямую объединяются между собой посредством Intel UPI 2.0 (24 ГТ/с), а вот для SH161 уже используется UPI-коммутатор UBox на базе ASIC, который позволяет объединить 16 сокетов в кеш-когерентную SMP-систему (CC-NUMA). Также есть 38U-модель BullSequana SH321 с 16 узлами и двумя коммутаторами UBox, но топология объединения узлов для неё не уточняется.
Источник изображения: Eviden Каждый из 2U-узлов в составе новых серверов имеет 32 слота для модулей оперативной памяти DDR5 RDIMM или DDR5 RDIMM-3DS. Максимально поддерживаемый объём ОЗУ варьируется от 8 до 64 Тбайт. В расчёте на узел доступны до шести слотов PCIe 5.0 x8 и два разъёма PCIe 5.0 x16 или до пяти слотов PCIe 5.0 x16. Поддерживаются адаптеры 1/10/25/100/200/400GbE и FC32/64. На каждый узел доступны два коннектора M.2 для NVMe SSD с опциональным RAID 0/1. Опциональный модуль SSD Box допускает подключение от восьми до 64 NVMe-накопителей E1.S с возможностью горячей замены. Кроме того, может быть добавлен адаптер для формирования массивов RAID 0/1/5/6/00/10/50/60. Серверы комплектуются блоками питания с сертификатом 80 PLUS Titanium мощностью 2200 или 3000 Вт. Каждый узел оснащается 12 вентиляторами охлаждения. Присутствуют контроллер Aspeed AST2600, сетевой порт управления 1GbE, два порта USB 3.1, последовательный порт и интерфейс D-Sub. Диапазон рабочих температур — от +10 до +35 °C. Заявлена совместимость с платформами SuSE Linux Enterprise Server, Red Hat Enterprise Linux, VMware vSphere (ESXiTM), Windows Server и Oracle Linux. Серверы Bullsequana SH ориентированы на корпоративных заказчиков, поставщиков облачных услуг и гиперскейлеров. Благодаря модульной конструкции обеспечивается гибкость масштабирования при решении задач НРС и ИИ. В качестве опции доступна технология прямого жидкостного охлаждения Eviden DLC: она, как утверждается, обеспечивает как минимум 10-% снижение потребления энергии по сравнению с воздушным охлаждением, а температуры воды на входе может достигать +40 °C. Устройства производятся на заводе Eviden в Анже (Франция) и обеспечиваются трёхлетней гарантией.
26.02.2025 [01:00], Татьяна Золотова
Yandex B2B Tech запустил платформу для разработчиков SourceCraft, которая должна стать аналогом американской GitLabС помощью платформы SourceCraft ИТ-специалисты могут совместно разрабатывать и развивать программные продукты. На данный момент разработчики и DevOps-инженеры могут пользоваться площадкой в тестовом режиме, в дальнейшем наряду с бесплатными тарифами появятся коммерческие опции. SourceCraft позиционируется как основное рабочее место ИТ-специалиста в Software Development Life Сycle. Площадка подходит для индивидуальных разработчиков (работа в открытых и закрытых репозиториях; планирование, создание и миграция с других платформ; принятие изменений, сборка и развертывание в Yandex Cloud), бизнеса и CTO (сокращение расходов на проверку бизнес-гипотез, разработку и время выхода на рынок; настройка платформы под себя), образовательных учреждений (разработка курсов/хакатонов, хранение портфолио студентов). Сервис поддерживает более 30 языков программирования. Пока он доступен через веб-интерфейс. Летом 2025 года SourceCraftс станет доступен для бизнеса и опенсорс-сообщества. Осенью инструменты платформы будут предоставляться по облачной модели (SaaS, Software as a Service) и интегрированы с сервисами Yandex Cloud, что позволит развернуть проект в облачной инфраструктуре «по кнопке». В планах у разработчиков и модель on-premise – для использования на собственных серверах. Также в будущем на SourceCraft будут доступны функции сканирования секретов и поиска уязвимостей в цепочках поставок, будут совершенствоваться средства автоматизации. SourceCraft развивается в рамках бизнес-направления Yandex B2B Tech, которое было открыто в ноябре 2024 года, в Yandex Cloud. По данным «Яндекса», выручка Yandex Cloud по итогам 2024 года составила 19,8 млрд руб. Всего в 2025–2026 гг. Yandex Cloud планирует инвестировать в новые направления, в том числе в развитие SourceCraft, 42 млрд руб.
25.02.2025 [18:30], Владимир Мироненко
Granite Rapids в малом формате: Intel представила процессоры Xeon 6500P и 6700PIntel объявила о пополнении семейства процессоров Xeon 6 рядом новинок, включая чипы Granite Rapids-SP Xeon 6700P и 6500P, предназначенные для использования в ЦОД. Одновременно компания представила младшую серию Xeon 6300 для серверов начального уровня, а также Xeon 6 SoC поколения Granite Rapids-D с ускорителями vRAN Boost. Как отметил ресурс The Register, в отличие от Intel Xeon 6900P (Granite Rapids-AP), в новых чипах Xeon с P-ядрами компания не пыталась сравниться с AMD по количеству ядер или чистой вычислительной мощности. Успешно восстановив паритет по количеству ядер со своим конкурентом в сегменте чипов с архитектурой x86, Intel в значительной степени опирается на то, что осталось от её репутации на рынке — на свой набор ускорителей вычислений и более агрессивную ценовую политику — в попытке остановить снижение своей доли в секторе чипов для ЦОД. В Xeon 6 компания перешла на чиплетную компоновку, отделив I/O-тайлы (Intel 7) от вычислительных тайлов (Intel 3), но сохранив контроллеры памяти в составе последних. В случае 6700P и 6500P I/O-тайлы фактически те же, а вот блоки с ядрами отличаются. В старших 86-ядерных чипах используется пара XCC-чиплетов. В 48-ядерных и 16-ядерных чипах есть по одному вычислительному HCC- и LCC-тайлу соответственно. Это повышает выход годной продукции и позволяет гибко подходить к выбору количества ядер и тактовых частот — до +22 ядер при том же TDP (150–350 Вт) в сравнении с прошлым поколением. В то же время такой подход ограничивает количество доступных каждому процессору каналов памяти — их в 6500P/6700P всего восемь с возможностью установки до 4 Тбайт RAM. Поддерживается DDR5-6400 (1DPC) и DDR5-5200 (2DPC). С другой стороны, для двухсокетных серверов с 32 DIMM не придётся изощряться с размещением слотов памяти, сохранив традиционную архитектуру плат, охлаждения и шасси в целом. Кроме того, некоторые CPU помимо обычных модулей также поддерживают MRDIMM DDR5-8000 (1 DPC). Наконец, есть и поддержка до 64 линий CXL 2.0, что теоретически также позволит нарастит доступную память. В односокетных конфигурациях R1S-чипы поддерживают до 136 линий PCIe 5.0 (взамен ненужных UPI) против 88 линий у обычных многосокетных процессоров. В новых CPU также вернулась поддержка 4S- и 8S-конфигураций (до четырёх линий UPI 2.0 24 ГТ/с на CPU), которой были лишены и Emerald Rapids, и Xeon 6 6900P. Таким образом, Intel по-прежнему остаётся единственным поставщиком многосокетных x86-платформ для SAP HANA и аналогичных рабочих нагрузок, которым требуется одновременно много памяти и много ядер, а по сравнению с Sapphire Rapids новинки значительно быстрее. Объём L3-кеша теперь составляет от 48 Мбайт до 336 Мбайт. Intel заявила, что чипы серии 6700P обеспечат от 14 % до 54 % прироста производительности по сравнению с флагманскими чипами Xeon Emerald Rapids. Intel по-прежнему в значительной степени опирается на интегрированные ускорители, чтобы получить преимущество по производительности по сравнению с конкурентами. Компания уже много лет встраивает кастомные ускорители в процессоры для выполнения нагрузок шифрования, безопасности, хранения, аналитики, обработки сетевого трафика и ИИ. В то же время у некоторых моделей по-прежнему активно лишь по два или три, а не по четыре акселератора DSA/DLB/IAA/QAT. Ещё одно отличие — поддержка 1024 или 2048 ключей TDX для защиты конфиденциальности в зависимости от модели. Примечательно, что NVIDIA добавила в Blackwell поддержку TDX. Intel утверждает, что в дополнение к увеличению числа ядер и инструкций за такт (IPC) в новом поколении процессоров с криптографическими движками и поддержкой AMX это позволяет одному серверному чипу Xeon 6 заменить до десяти систем Cascade Lake, по крайней мере, для таких рабочих нагрузок, как классификация изображений и работа веб-сервера Nginx с TLS. По словам Intel, её новые чипы обеспечивают преимущество по сравнению с новейшими процессорами AMD EPYC Turin в производительности в 62 % для Nginx с TLS, 17 % для MongoDB, 52 % в бенчмарке HPCG, 43 % в программной среде OpenFOAM и 2,17x в ResNet-50. The Register также отметил, что выход процессоров Intel Xeon 6 серий 6700P и 6500P демонстрирует выросшую агрессивнось Intel в отношении ценообразования. Intel традиционно дороже из расчёта за ядро по сравнению с AMD. Но теперь Intel пытается соответствовать своему конкуренту в ценах при любом количестве ядер или на целевых рынках. Компания даже незаметно снизила цены на 6900P в конце прошлого года, всего через несколько месяцев после запуска. Единственным исключением являются поддерживающие 4S- и 8S-конфигурации процессоры, у которых нет конкурентов на рынке x86-чипов. Стоимость CPU доходит до $19 тыс./шт. Естественно, здесь стоит сделать традиционную оговорку, что и AMD, и у Intel рекомендованные цены указаны за партии от 1 тыс. шт., но на практике их реальная стоимость будет варьироваться в зависимости от объёма заказа и нужд конкретного клиента, да и просто договорённостей с продавцами, интеграторами и другими участниками цепочки поставок. Наконец, у Intel появилось одно неожиданное преимущество перед AMD — «кремний» Xeon по-прежнему делается на собственных фабриках в США, тогда как AMD всё ещё зависит от тайваньской TSMC. Если новая администрация США введёт тариф на импорт полупроводников в размере 25 % и более, то Intel Xeon 6 наверняка окажутся выгоднее AMD EPYC. Intel также объявила, что Xeon 6 рекомендуются в качестве хост-процессоров для платформ NVIDIA MGX и HGX. Заявлена и поддержка OCP DC-HMS.
25.02.2025 [13:00], Сергей Карасёв
Granite Rapids-D для 5G с ИИ: дебютировали чипы Intel Xeon 6 SoC для сетевых и периферийных устройствКорпорация Intel представила чипы Xeon 6 SoC семейства Granite Rapids-D, рассчитанные на использование в сетевом оборудовании, а также встраиваемых устройствах с ИИ-функциями. Чипы поддерживают технологию Intel QAT (QuickAssist Technology) для ускорения криптографических операций, компрессии и обработки сетевого трафика. На сегодняшний день в серию Xeon 6 SoC вошли 13 моделей с количеством вычислительных ядер от 12 до 42. Все они имеют четыре канала памяти DDR5 с частотой 4800, 5600 или 6400 МГц. Показатель TDP находится в диапазоне от 110 до 235 Вт, а турбо-частота при использовании всех ядер достигает 2,9 ГГц. Большинство процессоров располагают интегрированным контроллером Ethernet 200G или 100G (за исключением Xeon 6533P-B). Некоторые модификации обладают поддержкой vRAN Boost и содержат ускоритель для транскодирования медиаданных. При этом все изделия поддерживают расширения AMX (Advanced Matrix Extensions), обеспечивающие ускорение рабочих нагрузок ИИ и машинного обучения. На вершине семейства находится чип Xeon 6726P-B с 42 ядрами, TDP 235 Вт, базовой частотой 2,3 ГГц (повышается до 2,9 ГГц), поддержкой четырёхканальной памяти DDR5-6400 и 200GbE-контроллером: стоит изделие $3795. Младшая версия Xeon 6503P-B с 12 ядрами, TDP в 110 Вт, частотой 2,0–2,6 ГГц, поддержкой DDR5-4800 и 100GbE-контроллером оценена в $934. Отмечается, что в IV квартале текущего года серия Xeon 6 SoC пополнится вариантами, насчитывающими до 72 вычислительных ядер. Кроме того, корпорация Intel сообщила, что процессоры следующего поколения Clearwater Forest на основе энергоэффективных ядер E-Core, которые придут на смену Sierra Forest, будут выпущены в I половине 2026 года.
24.02.2025 [12:22], Сергей Карасёв
SambaNova развернула самую быструю инференс-платформу для ИИ-модели DeepSeek-R1 671BКомпания SambaNova объявила о том, что в её облаке SambaNova Cloud стала доступна большая языковая модель DeepSeek-R1 с 671 млрд параметров. При этом благодаря применению фирменных ускорителей SN40L обеспечивается рекордно высокая скорость инференса. Изделия SambaNova SN40L RDU (Reconfigurable Dataflow Unit) состоят из двух крупных чиплетов, оперирующих 520 Мбайт SRAM-кеша, 1,5 Тбайт DDR5 DRAM и 64 Гбайт памяти HBM3. Восьмипроцессорная система на базе SN40L, по заявлениям SambaNova, способна запускать и обслуживать ИИ-модели с 5 трлн параметров и глубиной запроса более 256k. Платформа SambaNova Cloud при использовании DeepSeek-R1 671B демонстрирует производительность до 198 токенов в секунду, что на сегодняшний день является рекордным показателем. Для сравнения: у ближайшего конкурента — Together AI — результат составляет 98 токенов в секунду, а у Microsoft Azure — 20 токенов в секунду. Ранее Cerebras объявила о собственном рекорде — до 1508 токенов/с, но для гораздо более скромной и, по мнению компании, практичной модели DeepSeek-R1-Distill-Llama-70B. Утверждается, что ускорители SambaNova SN40L RDU по сравнению с новейшими GPU обеспечивают в три раза большую производительность и в пять раз более высокую эффективность. В частности, по заявлениям SambaNova, одна стойка с 16 экземплярами SN40L RDU по быстродействию сопоставима с 40 стойками, насчитывающими в общей сложности 320 передовых GPU. Таким образом, существенно сокращаются затраты на использование DeepSeek-R1 671B. Доступ к DeepSeek-R1 671B в облаке SambaNova Cloud предоставляется посредством API. В перспективе компания планирует наращивать вычислительные мощности, обеспечив производительность на уровне 20 000 токенов в секунду. |
|

