Лента новостей

13.07.2025 [10:57], Сергей Карасёв

CoreWeave запустила первые общедоступные инстансы на базе NVIDIA RTX Pro 6000 Blackwell Server Edition

Оператор ИИ-облака CoreWeave объявил о запуске инстансов с ускорителями NVIDIA RTX Pro 6000 Blackwell Server Edition для генеративных приложений, рендеринга в реальном времени и работы с большими языковыми моделями (LLM). Утверждается, что это первые общедоступные облачные экземпляры, построенные на базе названных GPU.

Изделия RTX Pro 6000 Blackwell Server Edition на архитектуре Blackwell насчитывают 24 064 ядра CUDA, 752 тензорных ядра пятого поколения и 188 ядер RT четвёртого поколения. В оснащение входят 96 Гбайт памяти GDDR7 с пропускной способностью до 1,6 Тбайт/с.

CoreWeave заявляет, что по сравнению с инстансами на основе NVIDIA L40S новые экземпляры обеспечивают 5,6-кратное повышение производительности при LLM-инференсе, 3,5-кратное увеличение быстродействия на операциях преобразования текста в видео и более чем 2-кратное повышение скорости тонкой настройки ИИ-моделей. Заявленная ИИ-производительность в режиме FP4 достигает 3,8 Пфлопс.

 Источник изображения: CoreWeave / NVIDIA

Источник изображения: CoreWeave / NVIDIA

Инстансы CoreWeave с ускорителями NVIDIA RTX Pro 6000 Blackwell Server Edition доступны в конфигурациях, насчитывающих до восьми GPU. Задействованы два процессора Intel Xeon поколения Emerald Rapids, а также DPU NVIDIA BlueField-3. Экземпляры предоставляют свыше 7 Тбайт пространства для хранения данных на основе NVMe SSD.

Говорится о поддержке служб CoreWeave Observability Services, которые отвечают за детальный мониторинг использования ресурсов, а также предоставляют данные о системных ошибках, температуре и пр. Это помогает быстро обнаруживать и устранять проблемы, минимизируя сбои в рабочих процессах. Новые инстансы доступны посредством CoreWeave Kubernetes Service (CKS) и Slurm on Kubernetes (SUNK) в американском регионе CoreWeave US-EAST-04.

Постоянный URL: https://servernews.ru/1125885
12.07.2025 [22:50], Владимир Мироненко

Особые цены для особо ценных клиентов: Broadcom запросила у Telefónica Germany за поддержку VMware впятеро больше прежнего

Немецкое подразделение телекоммуникационной компании Telefónica решило отказаться от услуг Broadcom после того, как та объявила стоимость продления контракта — она оказалась впятеро выше той, что была ранее, пишет The Register. В результате Telefónica Germany обратилась к услугам Spinnaker Support и запланировала отказ от продуктов VMware.

Telefónica Germany в основном полагалась на бессрочные лицензии vSphere, регулярно продлевая контракты на обслуживание и другую поддержку. Однако Broadcom после покупки VMware отказалась от бессрочных лицензий и теперь предлагает пакеты подписки, включающие как ПО, так и поддержку. Так, VMware Cloud Foundation (VCF) включает vSphere, vSAN, NSX и пр. решения для создания полноценного частного облака. В результате стоимость предложения зачастую оказывается значительно выше прежних тарифов, поскольку не всем заказчикам нужен полный набор инструментов.

«Они заявили, что мы ценный клиент, а затем запросили сумму, которая была в пять раз выше ожидаемой», — рассказал The Register Хольгер Берндт (Holger Berndt), руководитель отдела управления программными активами в Telefónica Germany. Он отметил, что компании не нужны все компоненты VCF, только vSphere 7.0/8.0. По словам Берндта, за последние три года на продукты VMware ушло примерно €5–€8 млн. Broadcom направила своё предложение в августе, а текущие лицензии истекали в конце года, так что у Telefónica Germany было время на раздумья.

 Источник изображения: U. Storsberg/unsplash.com

Источник изображения: U. Storsberg/unsplash.com

Поскольку к тому моменту компания уже пару лет пользовалась услугами Spinnaker Support по сопровождению ПО Oracle, выбор был очевиден. Тем не менее, Telefónica провела комплексную проверку и сравнила несколько предложений на рынке. Сейчас компания использует 8752 ВМ на 660 серверах. «Мы и не думали отказываться от VMware, пока не получили от Broadcom новое предложение. То, что они делают сейчас, неприемлемо: они говорят вам, что вы один из ценных клиентов, а потом так поступают», — сказал он. Теперь же компания планирует начать миграцию с продуктов VMware в конце 2026 года.

Spinnaker Support начала развивать направление поддержки решений VMware в 2024 году. С тех пор круг её клиентов заметно расширился, чему способствовало отсутствие гибкости Broadcom, с достойным лучшего применения упорством продвигающей модель подписки и навязывающей клиентам ненужные услуги. Иногда дело доходит до суда. Так, нидерландское государственное агентство Rijkswaterstaat (RWS) выиграло дело против Broadcom. Суд обязал VMware продолжать оказывать агентству поддержку в период миграции на альтернативную платформу после того, как оно отклонило новую схему лицензирования по подписке и связанные с этим повышенные расходы.

Постоянный URL: https://servernews.ru/1125860
12.07.2025 [17:08], Руслан Авдеев

Нет чипов — нет ЦОД: строящиеся ради ИИ электростанции могут так и не пригодиться

Согласно докладу London Economics International (LEI), хотя ИИ ЦОД требуют всё больше энергии, всё ещё нельзя точно сказать, насколько целесообразно строить много электростанций и ЛЭП для них — не исключено, что производители чипов попросту не справятся с поставками ускорителей, сообщает The Register.

О «прожорливости» ИИ ЦОД говорят достаточно давно. Так, Deloitte Insights предсказывает, что к 2035 году общий объём потребляемой энергии дата-центрами в США увеличится в пять раз. Для их поддержки необходимо построить множество новых электростанций и обновить энергосети. Тем не менее, есть риск, что рост ЦОД не достигнет прогнозируемого уровня, а станции и ЛЭП окажутся невостребованными. При этом немалые расходы на такое масштабирование энергетической инфраструктуры придётся нести другим клиентам.

London Economics International (LEI) по запросу SELC (Southern Environmental Law Center), известной своими тяжбами с xAI по вопросам экологии, подготовила исследование рынка энергетики и ЦОД в США. LEI пришла к выводу, что прогнозировать будущий спрос на электричество довольно трудно, в результате компании заведомо завышают его. Например, строители ЦОД буквально дублируют заявки на подключение ЦОД в разных юрисдикциях, что усложняет реальную оценку спроса. Впрочем, это не главное.

 Источник изображения: NREL

Источник изображения: NREL

Основная проблема в том, что для столь масштабного развития ИИ-инфраструктуры может попросту не хватить чипов. Если ЦОД не удаётся ввести в эксплуатацию из-за нехватки компонентов, то и лишние энергетические мощности не понадобятся. По словам авторов доклада, если все проекты ЦОД, запланированные к постройке в США в 2025–2030 гг., будут реализованы, то 90 % глобального прироста поставок ИИ-чипов в тот же период придётся на Соединённые Штаты.

Такой сценарий совершенно не реалистичен, поскольку сегодня на США приходится менее 50 % спроса на полупроводники. Наращивать закупки ИИ-чипов намерены и другие страны. Кроме того, сама политики новой администрации США тормозит развитие данного сегмента. В LEI пришли к выводу, что риск построить слишком много энергомощностей выше, чем слишком мало. При этом ошибка прогнозирования может дорого обойтись, а в первую очередь пострадают существующие клиенты энергокомпаний.

Строго говоря, энергокомпании США уже повышают тарифы. По данным The Financial Times, такое решение приняли National Grid и Northern Indiana Public Service Company. А Reuters сообщила, что PJM Interconnection, которая обслуживает Аллею дата-центров в Вирджинии, рассчитывает уже этим летом увеличить счета более чем на 20 %.

Постоянный URL: https://servernews.ru/1125827
12.07.2025 [15:13], Сергей Карасёв

От 100GbE до 800GbE, недорого: стартап TORmem обещает трансформировать рынок ЦОД-коммутаторов

Стартап TORmem, специализирующийся на решениях для дезагрегации памяти в дата-центрах, обнародовал планы по выпуску коммутаторов для сетей с высокой пропускной способностью. В семейство войдут модели с поддержкой стандартов от 100GbE до 800GbE.

По утверждениям TORmem, она потратила четыре года на разработку «революционной технологии дезагрегации», которая позволяет реализовывать концепцию вычислений в оперативной памяти (IMC) в масштабах ЦОД. Полученный опыт стартап намерен использовать для решения другой проблемы современных дата-центров — высокой стоимости корпоративной сетевой инфраструктуры.

TORmem обещает трансформировать сегмент коммутаторов корпоративного класса, выпустив высокопроизводительные устройства по цене в два раза меньше по сравнению с аналогичными решениями, уже представленными на рынке. В частности, TORmem предлагает для заказа модель стандарта 100GbE (S6500-32X) с 32 портами на основе ASIC Marvell: устройство стоит $7 тыс. против $14 тыс. или более у «стандартных продуктов», говорит компания.

 Источник изображений: TORmem

Источник изображений: TORmem

В конце текущего года стартап намерен подготовиться к началу производства коммутаторов 200GbE/400GbE, которые, как ожидается, также окажутся на 50 % дешевле конкурирующих изделий: их цена составит от $12 тыс. до $20 тыс. против $25–$40 тыс., которые, как утверждается, будут просить конкуренты. Кроме того, в разработке находятся модели класса 800GbE.

На сайте Unipoe.net удалось обнаружить описание коммутатора RZ-S6500-32X. Он располагает 32 портами 40/100GbE QSFP28, а коммутируемая ёмкость достигает 6,4 Тбит/с. Устройство выполнено в форм-факторе 1U с габаритами 440 × 470 × 43 мм. Предусмотрены сетевой порт управления, консольный порт и разъём USB 2.0. В оснащение входят два блока питания и пять модульных вентиляторов с возможностью горячей замены. Максимальное энергопотребление составляет менее 650 Вт. Диапазон рабочих температур — от 0 до +40 °C. Упомянута поддержка протоколов RIP, IS-IS, RIPng, OSPFv3, BGP4+ и пр.

Отраслевые аналитики прогнозируют, что объём глобального рынка высокоскоростных коммутаторов увеличится с примерно $8 млрд в 2025 году до более чем $15 млрд в 2027-м. Основным драйвером отрасли называется внедрение решений стандарта 200GbE и выше.

Постоянный URL: https://servernews.ru/1125861
12.07.2025 [01:00], Руслан Авдеев

NVIDIA, Cisco и Indosat помогут Индонезии встать на ИИ-рельсы

Индонезия сделала важный шаг к созданию суверенного ИИ, объявив о создании «Центра передового опыта в сфере ИИ» (AI Center of Excellence, CoE). Проект реализуется под руководством Министерства цифровых коммуникаций и информации (Komdigi) и при поддержке NVIDIA, Cisco и телеком-оператора Indosat Ooredoo Hutchison (IOH). Центр станет частью национальной инициативы «Золотое видение 2045» (Golden 2045 Vision), направленной на цифровую трансформацию экономики и развитие инноваций.

В задачи CoE входят развитие локальной ИИ-инфраструктуры, подготовка кадров и поддержка стартапов. Частью CoE станет NVIDIA AI Technology Center, который обеспечит поддержку исследований в области ИИ, предоставит доступ к программе NVIDIA Inception для стартапов и предложит обучение в экосистеме NVIDIA Deep Learning Institute. Также CoE получит типовую суверенную ИИ-фабрику с новейшими ускорителями Blackwell. Дополнительно курируемый государством форум разработает надёжные ИИ-фреймворки для создания решений, соответствующих местным ценностям.

Важное внимание уделяется вопросам кибербезопасности. На базе центра заработает система Sovereign Security Operations Center Cloud Platform, разработанная Cisco, сочетающая ИИ-распознавание угроз, локальное управление данными и управляемые сервисы обеспечения безопасности.

Проект строится на четырёх стратегических столпах:

  • Суверенная инфраструктура — масштабируемая и защищённая ИИ-инфраструктура, отвечающая национальным задачам;
  • Безопасные ИИ-нагрузки — ожидается надёжная защита цифровых ресурсов с помощью решений Cisco.
  • ИИ для всех — предусмотрено обеспечение доступа к ИИ для миллионов индонезийцев к 2027 году;
  • Подготовка кадров — планируется обучение 1 млн человек цифровым навыкам, включая ИИ и кибербезопасность.
 Источник изображения:  Jeremy Bishop/unspalsh.com

Источник изображения: Jeremy Bishop/unspalsh.com

Уже сейчас около 30 независимых разработчиков и стартапов используют ИИ-инфраструктуру IOH на базе NVIDIA. С учётом того, что Indosat покрывает связью весь индонезийский архипелаг, компания может обслуживать сотни миллионов носителей индонезийского языка (Bahasa Indonesia) с помощью приложений на основе специальных LLM, таких как Indosat Sahabat-AI. В будущем Indosat и NVIDIA намерены внедрять технологии AI-RAN, позволяющие охватывать ещё более широкий круг людей, которые смогут пользоваться ИИ с помощью беспроводных сетей.

Индонезия давно стала весьма привлекательным рынком для инвесторов. Так, Microsoft намерена в течение четырёх лет инвестировать в облачную инфраструктуру и ИИ-проекты Индонезии $1,7 млрд. А NVIDIA и Indosat Ooredoo Hutchison планируют построить ИИ-центр стоимостью $200 млн в Центральной Яве, $500 млн намерена инвестировать Tencent. Даже «Яндекс» имеет там собственные интересы.

Постоянный URL: https://servernews.ru/1125819
11.07.2025 [23:42], Владимир Мироненко

Oracle под давлением Трампа предоставила правительству США 75-% скидку на облако, на очереди — Google Cloud, Azure и AWS

В ближайшие несколько недель будет подписано соглашение Google с правительством США, в рамках которого власти получат значительные скидки на услуги облачных вычислений, сообщила газета Financial Times (FT) со ссылкой на представителя Администрации общих служб (GSA) США, координирующей госзакупки, отметив, что команда Дональда Трампа (Donald Trump) оказывает значительное давление на технологические компании, требуя снижения цен по давним и выгодным контрактам.

До этого на прошлой неделе Oracle заключила с правительством соглашение, в рамках которого временно предоставила 75-% скидку на своё ПО, СУБД и аналитические решения, а также «существенную» скидку на услуги облачных вычислений до конца ноября. По словам высокопоставленного чиновника GSA, по облачному контракту Google, вероятно, будут похожие условия. Аналогичных скидок правительство ожидает от Microsoft Azure и Amazon Web Services, но с ними переговоры пока не продвинулись так далеко, как в случае с Alphabet, материнской компанией Google.

 Источник изображения: Google

Источник изображения: Google

«Каждая из этих компаний полностью вовлечена в процесс и понимает миссию, — говорит чиновник. — Мы добьёмся сделки, сотрудничая со всеми четырьмя игроками». Администрация Трампа пытается сократить расходы на ИТ-решения в рамках общегосударственной инициативы, продвигаемой Департаментом эффективности государственного управления (DOGE), ранее возглавляемым Илоном Маском (Elon Musk). По данным FT, расходы правительства США на облачные технологии в настоящее время превышают $20 млрд/год, причём основная часть этой суммы приходится на контракты с четыре упомянутыми облачными провайдерами.

Аналогичные переговоры ведутся с консалтинговыми компаниями, такими как Booz Allen Hamilton и Deloitte. Также, по словам чиновника, GSA намерена пересмотреть соглашения с компаниями, предоставляющими услуги райдшеринга и имеющими контракты с федеральным правительством.

В апреле Google согласилась предоставить правительству США «временное снижение цен» на 71 % по некоторым контрактам Workspace до конца сентября. Также в рамках соглашений с правительством пошли на уступки Adobe и Salesforce. Последняя снизила цену за использование госслужбами сервиса обмена сообщениями Slack на 90 % до конца ноября.

Постоянный URL: https://servernews.ru/1125847
11.07.2025 [18:32], Руслан Авдеев

Бюрократы да экологи: Microsoft посетовала на трудность развития ЦОД в Европе

К 2027 году Microsoft рассчитывает более чем удвоить мощность европейских дата-центров. При этом в компании предполагают, что добиться необходимых результатов будет непросто из-за раздутой бюрократии и экологических норм, сообщает The Register. Компания пообещала усилить поддержку европейского бизнеса на фоне трений с США, в т.ч. в области защиты пользовательских данных и обеспечения «цифровой надёжности».

Ранее Microsoft пообещала расширить парк дата-центров в 16 европейских странах, нарастив в течение двух лет их мощность на 40 % и более чем вдвое увеличив присутствие в сравнении с 2023 годом — всего компания будет располагать более 200 ЦОД в регионе. Утверждается, что компания не выросла в Европе так же, как выросла в США, из-за ряда сложностей, в том числе регулирования деятельности и строгих оценок воздействия на окружающую среду. Именно поэтому работать в Европе немного сложнее и несколько дороже, чем в США, считают в Microsoft.

В Европе компании угрожают моратории, да и не везде рады расширению её присутствия. Речь, по-видимому, идёт об Ирландии, где в некоторых регионах фактически введён мораторий на создание новых ЦОД из-за нехватки энергии, но в то же время проводится «зелёная» политика. Впрочем, в других странах быстро закупить много мощностей ЦОД тоже непросто, хотя именно это и требуется. С точки зрения Microsoft, время выхода на рынок играет решающую роль. За последние два года компания заключила много арендных сделок, что создало давление на компанию в условиях жёстких рыночных требований.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Microsoft хотела бы строить собственные дата-центры, но задержки в выдаче разрешений на покупку земель вынуждают использовать аренду как временное решение, чтобы не останавливать проекты. Однако инвестиции в колокацию становятся ненадёжными из-за масштабов проектов и бюрократических сложностей. Отдельно отмечается проблема с доступом к электроэнергии — в Европе планирование осуществляется на 18 месяцев дольше, чем где-либо ещё. Операторы энергосетей не справляются с нагрузкой, что приводит к задержкам в присоединении дата-центров. Из-за этого та же Ирландия теряет инвестиции в пользу скандинавских стран.

Необходимость строительства новых ЦОД мешает Microsoft добиться «отрицательного» уровня выбросов к 2030 году. В отчёте об экоустойчивости за 2025 год компания заявила, что её выбросы всех типов (Scope 1, 2 и 3) увеличились на 23,4 % в сравнении с показателями 2020 года. Это не так плохо, как данные в докладе за предшествовавший год, где рост составил почти 30 % к 2020 году — в основном из-за развития ИИ и облака. Директор Microsoft по устойчивому развитию отметил, что в поставленные в 2020 году цели сравнимы «полётом на Луну». А пять лет спустя стало понятно, что до этого «полёта» ещё дальше.

Впрочем, в Microsoft довольны тем, что рост является весьма скромным с учётом роста потребления энергии на 168 % и роста выручки на 71 % с 2020 года. Также указывается на усилия вроде подписания контрактов на 19 ГВт возобновляемой энергии в 16 странах (фактически покупке PPA) и строительстве дата-центров с применением дерева или низкоуглеродного бетона. Как утверждают в компании, это снижает углеродный след на 65 %.

Постоянный URL: https://servernews.ru/1125800
11.07.2025 [15:02], Владимир Мироненко

Curator: DDoS-атак во втором квартале стало в 1,5 раза больше, а рекордный ботнет вырос до 4,6 млн устройств

Компания Curator опубликовала отчёт, посвящённый статистике DDoS-атак, BGP-инцидентов и бот-активности во II квартале 2025 года, согласно которому общее число атак увеличилось на 43 % год к году. При это рост количество атак на уровне приложений (L7) был ещё больше — на 74 %.

Чаще всего во II квартале DDoS-атакам на сетевом и транспортном уровне (L3–L4) подвергались сегменты «Финтех» (22,6 %), «Электронная коммерция» (20,6 %) и «ИТ и Телеком» (16,1 %), на которые пришлось 59,3 % от всех L3-L4 атак за этот период.

Самая продолжительная атака в отчётном квартале была зафиксирована в микросегменте «Онлайн-букмекеры». Её продолжительность составила чуть более 4 суток — 96,5 часа.

 Источник изображений: Curator

Источник изображений: Curator

16 мая исследователи зафиксировали новую атаку огромного ботнета, обнаруженного 26 марта 2025, которая в этот раз была направлена на организацию из сегмента «Государственные ресурсы» и продолжалась чуть больше часа. Если в марте ботнет состоял из 1,33 млн устройств, то в этот раз он включал в 3,5 раза больше устройств — порядка 4,6 млн IP-адресов.

Чаще всего источниками DDoS-атак на уровне приложений в отчётном квартале были Россия (17 %) и США (16,6 %), третье место у Бразилии (13,2 %), значительно увеличившей долю за последний год.

В исследовании также отмечен резкий рост трафика «плохих» ботов (+31 %), который значительно превысил прирост количества защищаемых ресурсов. Пик роста пришёлся на апрель-май, после чего в июне наступил некоторый спад. Главной целью «плохих» ботов во II квартале был сегмент «Электронная коммерция», доля которого выросла до 59,6 %. Далее по числу атак следуют сегменты «Онлайн-ставки» (16,5 %) и «Медиа» (9,6 %). На эти три сегмента пришлось более 85 % всего трафика «плохих» ботов.

Постоянный URL: https://servernews.ru/1125812
11.07.2025 [14:49], Сергей Карасёв

В семейство самоуничтожающихся SSD Team Group P250Q вошли модели вместимостью до 2 Тбайт

Компания Team Group выпустила SSD серии P250Q, о подготовке которых сообщалось в марте нынешнего года. Особенностью новинок является аппаратная система самоуничтожения One-Click Data Destruction, которая гарантирует полное удаление хранящейся информации без возможности восстановления.

В устройствах реализована запатентованная технология, основанная на использовании независимой электрической цепи для стирания данных на аппаратном уровне: осуществляется это путём непосредственного воздействия на чипы флеш-памяти. Для активации функции может использоваться специальная физическая кнопка: в зависимости от продолжительности нажатия на неё запускаются различные режимы уничтожения информации, а о ходе процесса информируют светодиодные индикаторы.

Кроме того, предусмотрена интеллектуальная программная система автоматического возобновления процесса самоуничтожения на случай внезапного отключения питания. Таким образом, даже если выключить компьютер или извлечь накопитель после активации функции удаления, стирание данных будет завершено после восстановления подачи питания.

 Источник изображения: Team Group

Источник изображения: Team Group

SSD семейства P250Q выполнены в формате М.2 2280 с интерфейсом PCIe 4.0 x4 (NVMe 1.4). Применены чипы флеш-памяти 3D TLC NAND. В семейство входят модели вместимостью 256 и 512 Гбайт, а также 1 и 2 Тбайт. Заявленная скорость последовательного чтения информации достигает 7000 Мбайт/с, скорость последовательной записи — 5500 Мбайт/с. Величина MTBF (средняя наработка на отказ) превышает 3 млн часов. Диапазон рабочих температур — от 0 до +70 °C. Производитель предоставляет на накопители трёхлетнюю гарантию. Новинки ориентированы на использование в оборонном секторе, индустриальной сфере и в других областях, где требуется повышенный уровень конфиденциальности и защиты данных.

Постоянный URL: https://servernews.ru/1125804
11.07.2025 [09:09], Сергей Карасёв

В облаке AWS появились инстансы EC2 P6e-GB200 UltraServer на базе ИИ-суперускорителей NVIDIA GB200 NVL72

Облачная платформа AWS объявила о доступности высокопроизводительных инстансов EC2 P6e-GB200 UltraServer, рассчитанных на наиболее ресурсоёмкие нагрузки ИИ. В основу экземпляров положены суперускорители NVIDIA GB200 NVL72.

Система GB200 NVL72 объединяет в одной стойке 18 узлов 1U, каждый из которых содержит два ускорителя GB200, что даёт в общей сложности 72 чипа B200 и 36 процессоров Grace. Задействована шина NVLink 5.

Инстансы u-p6e-gb200-x72 предоставляют доступ к 72 чипам поколения Blackwell в одном домене NVLink, включая примерно 13,4 Тбайт памяти HBM3e. Производительность в режиме FP8 достигает 360 Пфлопс. Количество vCPU составляет до 2592, объём памяти — до 17 280 ГиБ. Кроме того, предоставляется до 405 Тбайт пространства для хранения данных. Используются адаптеры AWS Elastic Fabric Adapter (EFAv4) с низкой задержкой, агрегированной скоростью передачи данных 28,8 Тбит/с и поддержкой NVIDIA GPUDirect RDMA. Пропускная способность EBS достигает 1080 Гбит/с. Также доступны u-p6e-gb200-x36 с вдвое меньшими характеристиками.

 Источник изображений: AWS

Источник изображений: AWS

Применяется система AWS Nitro, которая переносит функции виртуализации, хранения и сетевые операции на выделенное оборудование и ПО для повышения производительности и улучшения безопасности. Инстансы EC2 P6e-GB200 UltraServer объединяются в кластеры EC2 UltraCluster, что обеспечивает возможность безопасного и надёжного масштабирования до десятков тысяч ускорителей.

AWS отмечает, что новые экземпляры подходят для работы с передовыми ИИ-моделями, насчитывающими триллионы параметров. При этом может использоваться сочетание экспертных и рассуждающих моделей. После резервирования ёмкости стоимость за инстанс списывается авансом, и цена не меняется после оплаты.

Постоянный URL: https://servernews.ru/1125797