Материалы по тегу: ии

17.05.2025 [16:05], Сергей Карасёв

Autonomous представила рабочую станцию Brainy для ИИ-задач

Компания Autonomous анонсировала мощную рабочую станцию Brainy, ориентированную на задачи машинного обучения и нагрузки ИИ. Утверждается, что новинка подходит для работы с большими языковыми моделями (LLM), насчитывающими до 70 млрд параметров. При этом пользователи могут добиться значительной экономии средств по сравнению с арендой облачных GPU, говорит компания.

Рабочая станция предлагается в четырёх модификациях — Core, Pro, Pro Max и Ultra. Они несут на борту соответственно два, четыре, шесть и восемь ускорителей NVIDIA GeForce RTX 4090 Ada (16 384 ядра CUDA; 24 Гбайт GDDR6X с 384-бит шиной), а производительность ИИ на операциях FP32 достигает 330 Тфлопс, 661 Тфлопс, 991 Тфлопс и 1,32 Пфлопс.

Младшая модель Brainy Core располагает процессором AMD Ryzen Threadripper 3960X (24C/48T; 3,8–4,5 ГГц), 64 Гбайт системной памяти, одним блоком питания мощностью 1650 Вт, загрузочным SSD вместимостью 1 Тбайт, а также сетевым контроллером 1GbE. Стоит такая версия $9000.

 Источник изображений: Autonomous

Источник изображений: Autonomous

Ступенью выше располагается модификация Brainy Pro, за которой идёт Brainy Pro Max: они предлагаются по цене $19 000 и $25 000. Обе снабжены чипом Ryzen Threadripper Pro 5955WX (16C/32T; 4,0–4,5 ГГц), 128 Гбайт оперативной памяти, SSD на 1 Тбайт, двухпортовым сетевым адаптером 10GbE, контроллером ВМС и двумя блоками питания мощностью 1650 Вт.

Самая мощная версия рабочей станции — Brainy Ultra — обойдётся в $40 000. Она укомплектована процессором AMD EPYC 9124 Genoa (16C/32C; 3,0–3,7 ГГц), 192 Гбайт ОЗУ, SSD ёмкостью 1 Тбайт, контроллером Aspeed AST 2500, двухпортовым сетевым адаптером 10GbE и четырьмя блоками питания мощностью 2000 Вт каждый. 

При этом все конфигурации не выглядят достаточно сбалансированными. Например, у Pro Max системной памяти меньше, чем VRAM, но хотя бы остаются свободные линии PCIe для подключения накопителей с данными. Кроме того, RTX 4090 не имеет поддержки NVLink Bridge, так что каждая карта работает независимо.

Постоянный URL: http://servernews.ru/1122994
16.05.2025 [18:25], Руслан Авдеев

Обойдёмся без Microsoft: OpenAI заключила сделку с CoreWeave на $4 млрд

Компания CoreWeave заключила очередную сделку с OpenAI на сумму $4 млрд до 2029 года. По данным Bloomberg, в недавнем финансовом отчёте компания отчиталась о новом соглашении «с крупным предприятием в сфере ИИ», но имя партнёра не называлось. Ранее компании OpenAI уже подписала с CoreWeave сделку на $11,9 млрд, предусматривающую использование вычислительных мощностей последней. Эта сделка не вошла в перечень текущих обязательств CoreWeave (RPO).

Партнёрство двух компаний поможет CoreWeave диверсифицировать клиентскую базу, а OpenAI — сократить зависимость от Microsoft, а также собственного ИИ-проекта Stargate с участием SoftBank и Oracle. Впрочем, дело несколько сложнее, потому что якорным заказчиком CoreWeave, обеспечивающим 62 % выручки, была сама Microsoft, которая арендовала ресурсы в интересах OpenAI. Вторым по величине клиентом была NVIDIA. Ходили слухи, что в Microsoft намерены сократить расходы, но в CoreWeave информацию опровергали — ранее речь шла о контракте стоимостью $10 млрд.

Ранее эксклюзивным поставщиком облачных сервисов для OpenAI была Microsoft, вложившая в компанию с 2019 года $19 млрд, но в 2024 году было объявлено, что OpenAI будет работать и с Oracle, правда, при посредничестве той же Microsoft. По данным Datacenter Dynamics, после анонса Stargate компании «выяснили отношения» и Microsoft получила почётное звание «ключевого первоначального технологического партнёра», но не получила доли в бизнесе в отличие от Oracle, SoftBank и арабской MGX. Microsoft подтвердила, что партнёрство более не является эксклюзивным, хотя у компании остаётся право «преимущественного выбора» (ROFR).

 Источник изображения: SEO Galaxy/unsplash.com

Источник изображения: SEO Galaxy/unsplash.com

В начале мая The Financial Times заявляла, что условия сотрудничества пересматриваются, а основные разговоры ведутся о том, какую долю должна получить в капитале OpenAI компания Microsoft в обмен на прошлые инвестиции. Источники заявляют также и о пересмотре условий контракта, заключённого компаниями ещё в 2019 году. По имеющимся данным, Microsoft готова отказаться от части доли в будущей коммерческой компании в обмен на доступ передовым к технологиям OpenAI, разработанным после 2030 года, когда текущий контракт закончится.

Как сообщают некоторые источники, во многом проблема связана с «высокомерием» OpenAI, желающей денег, но также требующей не вмешиваться в рабочие процессы — Microsoft якобы должна радоваться самому факту такого сотрудничества. Впрочем, по словам близкого к OpenAI источника, Microsoft по-прежнему заинтересована в превращении последней в коммерческую структуру, хотя впереди предстоят сложные переговоры.

Постоянный URL: http://servernews.ru/1122965
16.05.2025 [16:54], Анжелла Марина

США готовят санкции против китайских производителей памяти CXMT, YMTC и других чипмейкеров

Администрация США рассматривает возможность включения нескольких китайских компаний по производству чипов в «чёрный список» экспортного контроля. Среди них — производитель памяти CXMT, а также дочерние структуры крупнейших китайских чипмейкеров SMIC и YMTC. Такое положение дел ограничит для этих компаний доступ к американским технологиям, поскольку поставки без специальной лицензии станут невозможны.

Решение пока не принято из-за разногласий внутри администрации. Часть чиновников считает, что санкции могут сорвать переговоры по торговой сделке между США и Китаем, которые недавно договорились о временном снижении пошлин на 90 дней. Однако другие, как пишет Financial Times, настаивают на жёстких мерах, напоминая, что республиканцы критиковали предыдущую администрацию за слишком мягкую политику в отношении КНР.

Особое внимание США привлекает компания CXMT, которая активно наращивает долю на мировом рынке чипов памяти DRAM и разрабатывает высокопроизводительную память HBM, критически важную для ИИ-нагрузок. В Вашингтоне опасаются, что передовые технологии могут быть использованы Китаем для модернизации военного потенциала, включая разработку гиперзвукового оружия и моделирование ядерных испытаний.

 Источник изображения: cxmt.com

Источник изображения: cxmt.com

Если компании попадут в «чёрный список», это станет очередным шагом США по ограничению доступа Китая к передовым полупроводниковым технологиям, а американские компании не смогут поставлять им оборудование и компоненты без сложного процесса согласования. Ранее аналогичные меры уже применялись против SMIC и YMTC.

Китайские компании пока не прокомментировали ситуацию. В посольстве КНР в США заявили, что «решительно выступают против злоупотребления Вашингтоном концепцией национальной безопасности и искусственных ограничений в торговле», назвав такие действия попыткой подавить технологическое развитие Китая.

Белый дом и Министерство торговли США отказались от официальных комментариев. Однако эксперты считают, что решение может быть принято в ближайшие недели, что увеличит напряжённость в американо-китайских отношениях.

Постоянный URL: http://servernews.ru/1122967
16.05.2025 [14:45], Руслан Авдеев

США готовы разрешить ОАЭ импортировать миллионы ускорителей NVIDIA для постройки одного из крупнейших в мире ИИ ЦОД

США заключили с ОАЭ предварительное соглашение, разрешающее последним импортировать 500 тыс. самых современных ИИ-ускорителей NVIDIA ежегодно. По словам двух источников Reuters, поставки начнутся уже в этом году, что ускорить строительство Эмиратами ИИ ЦОД. По оценкам, это позволит создать в Абу-Даби один из крупнейших в мире ИИ-кампусов площадью 25,9 км2 и мощностью 5 ГВт.

По словам источников, соглашение о поставке ускорителей должно действовать как минимум до 2027 года, но не исключено, что срок его действия продлят и до 2030-го. Проект предусматривает поставку пятой части всех чипов (около 100 тыс. штук в год) компании G42, а остальные разделят между американскими компаниями, работающими в сфере ИИ, вроде Microsoft (которая сама связана с G42) и Oracle. Не исключено, что последняя будет строить в ОАЭ дата-центры.

Соглашение ещё может измениться — по некоторым данным, оно находится на стадии обсуждения и оппозиция ему имеется даже в самом правительстве США. Предыдущая администрация США подготовила ограничения на поставки передовых ИИ-ускорителей в большую часть стран мира — отчасти для того, чтобы не допустить их перепродажу в Китай. Новая администрация отменила столь жёсткие ограничения, вредящие американскому бизнесу.

 Источник изображения: Darcey Beau/unspalsh.com

Источник изображения: Darcey Beau/unspalsh.com

Турне нынешнего президента США по странам Персидского залива уже привело к заключения сделок с организациями Саудовской Аравии на сумму $600 млрд. На сегодня большинство вычислительных ИИ-мощностей в мире развёрнуты в США и Китае, но если все предлагаемые в регионе Персидского залива сделки увенчаются успехом, он может стать третьим «центром силы» для ИИ-вычислений в мире.

Долями в G42 владеют Фонд национального благосостояния Абу-Даби Mubadala, правящая семья ОАЭ и американская частная инвестиционная компания Silver Lake, а её председателем является советник по национальной безопасности ОАЭ и брат президента ОАЭ шейх Тахнун ибн Шахбут Аль Нахайян (Tahnoon bin Zayed Al Nahyan). В числе прочего предварительное соглашение направлено на продвижение ЦОД в США. Пока в нём указано, что для каждого объекта, построенного G42 в ОАЭ, компания обязуется построить аналогичный ЦОД в США.

По словам одного из источников, что именно будет называться «передовым» ИИ-чипом, будет решать отдельная рабочая группа, которую создадут позже, вместе с разработкой условий обеспечения безопасности. По словам одного из источников, речь идёт о новейших чипах NVIDIA поколения Blackwell. Также не исключается, что предусмотрены поставки чипов NVIDIA Rubin, которые производительнее тех и других и ещё не появились в продаже.

Постоянный URL: http://servernews.ru/1122943
16.05.2025 [14:13], Руслан Авдеев

Tencent санкциями не напугать: китайский IT-гигант накопил достаточно ИИ-ускорителей для обучения моделей в течение многих лет

Китайский IT-гигант Tencent уверен, что накопил достаточно высокопроизводительных ускорителей для обучения новых ИИ-моделей в течение многих лет. Отчасти это объясняют тем, что в КНР нашли более эффективные способы работы с ИИ-нагрузками, чем в США, сообщает The Register.

В ходе подведения финансовых итогов I квартала 2025 года президент Tencent Мартин Лау (Martin Lau), объявил, что у компании «довольно большой запас чипов», которые компания успела приобрести до новых ограничений со стороны Соединённых Штатов. Часть будет использоваться для приложений, которые принесут «немедленную прибыль» — вроде рекламных и рекомендательных систем. Часть пойдёт на обучение ещё нескольких поколений LLM с использованием передовых методов, позволяющих использовать минимально возможное количество ускорителей.

Сообщается, что в последние месяцы в КНР стали отходить от американской концепции «масштабирования», согласно которой обучающий кластер надо постоянно увеличивать — хороших результатов можно добиться и без этого, в том числе на этапе пост-обучения. По словам Лау, агентный и рассуждающий ИИ требуют больше ускорителей сам по себе, но оптимизация ПО поможет ещё больше повысить эффективность инференса. Поэтому Tencent намерена вкладываться в повышение эффективности использования доступных ресурсов — например, обучение более мелких моделей для более узких задач, требующих меньше мощностей.

 Источник изображения: chen zy/unsplash.com

Источник изображения: chen zy/unsplash.com

Как заявил Лау, компания рассматривает и альтернативы недоступным более ускорителям NVIDIA. Потенциально компания может использовать и другие ускорители и аппаратные решения, включая ASIC-модули и даже обычные GPU в некоторых случаях, в том числе для более мелких моделей. Высказывания Лау предполагают, что попытки США заблокировать экспорт высокопроизводительных ускорителей в Китай не принесли ожидавшихся результатов — вместо этого Tencent добилась прогресса в оптимизации и инновациях.

Несколько противоречат оптимистичным заявлениям Лау высказывания генерального директора Tencent Пони Ма (Pony Ma), который подчеркнул, что облачный бизнес фактически подразумевает перепродажу мощностей ускорителей, поэтому сейчас для компании, на фоне дефицита, это направление стало менее приоритетным. Другими словами, дефицит всё же имеется.

В любом случае на данный момент компания находится в превосходном состоянии. За I квартал выручка выросла на 13 % год к году до $25,1 млрд, а валовая прибыль — на 20 % до $14 млрд. Компания насчитывает 1,4 млрд активных пользователей Weixin и WeChat ежемесячно, а новая рекламная платформа на базе ИИ только улучшает показатели. Компания является не только рекламным посредником, но и активно занимается стримингом видео и аудио, а доходы от её игр в последнее время резко выросли.

 Источник изображения: Donald Wu/unsplash.com

Источник изображения: Donald Wu/unsplash.com

Пока торговая война между США и Китаем смешала планы многих бизнесов, но Лау предлагает подождать и посмотреть на результаты в следующем квартале. По его словам, правительство оказывает большую поддержку, что компенсирует новые высокие тарифы.

В своё время китайский стартап DeepSeek сумел доказать, что в мире ИИ можно добиться больших результатов относительно малыми средствами. Хотя позже выяснилось, что экономичность его моделей не так высока, как утверждалось, американское технологическое превосходство всё равно было поставлено под вопрос.

Постоянный URL: http://servernews.ru/1122932
16.05.2025 [08:38], Владимир Мироненко

Qualcomm возвращается на рынок серверных процессоров

Qualcomm Technologies возвращается на рынок серверных процессоров. Это подтверждает меморандум о взаимопонимании, подписанный компанией и ИИ-стартапом Humain, принадлежащим Суверенному фонду Саудовской Аравии, с целью «запуска ИИ ЦОД, предложения гибридного ИИ на периферии и в облаке, а также сервисов “от облака до периферии” в Королевстве Саудовская Аравия и за его пределами». Меморандум о взаимопонимании был подписан в ходе Саудовско-американского инвестиционного форума в Эр-Рияде. Ранее о партнёрстве с Humain объявили NVIDIA, AMD и AWS, а также Cisco.

В документе закреплено обязательство Qualcomm «разработать и поставлять современные ИИ-решения и CPU для ЦОД». Также стороны планируют интегрировать семейство арабских больших языковых моделей Humain (ALLaM, совместно разработанных с SDAIA) с широкой экосистемой периферийных ИИ-устройств на базе процессоров Qualcomm, предоставляя возможности гибридного ИИ-инференса от облака до периферии для широкого спектра устройств. В дальнейшем компании будут сотрудничать с Министерством связи и информационных технологий Саудовской Аравии (MCIT) с целью создания в Саудовской Аравии Центра проектирования полупроводниковых технологий мирового класса.

 Источник изображения: Qualcomm

Источник изображения: Qualcomm

Согласно документу, Qualcomm и Humain намерены «разработать и построить передовые ИИ ЦОД в Саудовской Аравии, предназначенные для предоставления высокоэффективных масштабируемых гибридных решений ИИ-инференса от облака до периферии (cloud-to-edge) для местных и международных клиентов на основе решений Qualcomm». Также партнёры планируют ускорить использование инфраструктуры за счет применения процессоров Snapdragon и Dragonwing. Ранее Qualcomm и Cerebras договорились об использовании ускорителей Cloud AI для инференса, в том числе в интересах заказчиков из Саудовской Аравии.

Qualcomm и Humain заявили, что их ЦОД и экосистема предназначены для предоставления как государственным, так и корпоративным организациям доступа к высокопроизводительной и энергоэффективной облачной ИИ-инфраструктуре на основе CPU, а также cloud-to-edge сервисам. Согласно пресс-релизу, эти предложения позволят развёртывать ИИ-решения, которые могут делать прогнозы и принимать решения в реальном времени, а также значительно повышать доступность и ценность передовых приложений с поддержкой ИИ.

 Источник изображения: Qualcomm

Источник изображения: Qualcomm

Слухи о планируемом Qualcomm возврате к разработке серверных процессоров курсируют длительное время. В 2017 году компания выпустила 10-нм 48-ядерные чипы Centriq 2400, но затем отменила проект в 2019 году. Позже компания приобрела стартап Nuvia, который разрабатывал серверные Arm-процессоры. Qualcomm использовала наработки Nuvia в процессорах Snapdragon для компьютеров на базе Windows.

Слухи разгорелись с новой силой, когда в начале года Qualcomm наняла Сайлеша Коттапалли (Sailesh Kottapalli) в качестве старшего вице-президента. Ранее он был главным архитектором серверных процессоров Xeon. Теперь Qualcomm не скрывает своих намерений. Она разместила на сайте вакансии, связанные с разработкой серверных процессоров, включая «архитектора управления питанием сервера», «архитектора ПО для управления питанием и температурой серверных SoC» и «архитектора серверной платформы». Причём, как отметил ресурс Computer Base, каждая вакансия сопровождается примечанием: «Команда Qualcomm Data Center разрабатывает высокопроизводительное и энергоэффективное серверное решение для ЦОД».

На форуме JPMorgan финансовый директор и главный операционный директор Акаш Палхивала (Akash Palkhiwala) заявил, что у компании есть «ведущий в мире процессор» и NPU. «Изменения, которые происходят в ЦОД, очевидно, связаны с переходом к инференсу, который становится всё более важным, как и низкое энергопотребления, и именно здесь Qualcomm на высоте», — отметил Палхивала, добавив, что компания использует имеющиеся технологии в будущих серверных процессорах.

Постоянный URL: http://servernews.ru/1122911
15.05.2025 [23:28], Татьяна Золотова

«Гарда Маскирование» теперь можно использовать для работы с документами граждан Казахстана

Производитель ИБ-продуктов ГК «Гарда» обновила программное решение «Гарда маскирование». Теперь систему можно применять для работы с документами граждан Казахстана. Об этом сообщает пресс-служба компании.

«Гарда маскирование» обезличивает персональные данные для защиты от утечек при передаче их третьим лицам. Решение распознает чувствительные сведения в исходной базе данных и создает ее копию, в которой реальная информация подменяется фиктивными, но правдоподобными значениями.

Среди основных функций системы разработчики называют автоматическое выявление критической информации в массиве данных, гибкую настройку параметров маскирования, автоматический анализ структуры СУБД. Также есть ролевая модель и разграничение прав доступа, замена персональных данных и чувствительной информации, сохранение форматов и структуры данных.

По сути, продукт, удаляя критичную информацию, позволяет избежать штрафов, юридических рисков и обеспечить соответствие требованиям 152-ФЗ. Одним запросом можно найти в базах компании все данные, связанные с конкретным человеком, и затем удалить их.

 Источник: ГК «Гарда»

Источник: ГК «Гарда»

Для обработки документов граждан Казахстана (паспортные данные, полисы, налоговые номера) в решении были адаптированы механизмы сканирования и маскирования. Система упрощает миграцию данных и настройку новых инсталляций, также есть поддержка импорта и экспорта шаблонов сканирования между разными экземплярами системы.

По данным специалистов «Гарды», 39 % отечественных компаний удаляют персональные данные вручную, проводя поиск по базам, хранилищам и на рабочих местах. При этом сертифицированными программными средствами пользуются только в 3 % компаний. Операторы ПДн обязаны удалять сведения личного характера по истечении срока хранения в течение 30 дней, а по заявлению субъекта ПДн — в течение семи дней (ч. 3 ст. 20 Закона «О персональных данных» № 152-ФЗ в обновленной редакции).

Постоянный URL: http://servernews.ru/1122903
15.05.2025 [21:27], Андрей Крупин

Почтовый сервер RuPost дополнился расширенными средствами мониторинга и системой трассировки писем

Российский разработчик «РуПост» (входит в «Группу Астра») представил новый релиз почтового сервера RuPost 3.3.

RuPost представляет собой коммуникационное решение корпоративного класса, отвечающее всем требованиям современной организации любого масштаба. Продукт поддерживает кластеризацию, миграцию данных и одновременную работу с Microsoft Exchange, взаимодействие со службами каталогов ALD Pro, Active Directory, FreeIPA, а также оснащён средствами балансировки нагрузки, самодиагностики и мониторинга целостности конфигураций почтовых компонентов. Платформа RuPost подходит для решения задач импортозамещения. Программный комплекс включён в реестр Минцифры России и входит в дорожную карту «Цифровое рабочее место сотрудника».

 Источник изображения: rupost.ru

Источник изображения: rupost.ru

В RuPost версии 3.3 разработчики существенно расширили возможности мониторинга компонентов программного комплекса. В частности, стал доступен комплексный мониторинг баз данных, включающий информацию о размерах, состоянии кластера Patroni и текущих подключениях. Также были реализованы средства мониторинга подключений и работоспособности серверов LDAP и усовершенствованы механизмы протоколирования работы RuPost и его окружения. Администраторы могут оперативно получать сводки о состоянии системы за счёт централизованного сбора журналов со всех узлов кластера и их вывода в отдельную вкладку «Логи» панели управления.

В числе прочего обновлённый почтовый сервер получил систему трассировки писем, позволяющую отслеживать маршрут электронной корреспонденции, и кардинально переработанный механизм репликации данных. Дополнительно в состав RuPost были включены инструменты контроля изменений важных атрибутов учётных записей пользователей в LDAP, которые позволяют IT-службам своевременно выявлять и анализировать попытки изменения ключевых параметров доступа из внешних систем. Также реализована возможность приёма и обработки входящих писем-приглашений, что упрощает работу с документами и повышает эффективность корпоративного документооборота.

Постоянный URL: http://servernews.ru/1122909
15.05.2025 [15:12], Руслан Авдеев

Потенциал импортозамещения почти исчерпан: АРПЭ выпустила отчёт о состоянии российского рынка серверного оборудования

Ассоциация разработчиков и производителей электроники (АРПЭ) России провела исследования рынка серверного оборудования в стране. В подготовке доклада приняли участие «Гравитон», СИЛА, «Тринити», Fplus, BITBLAZE и GS Group, сообщает пресс-служба АРПЭ. Исследование показало, что рынок уже два года подряд сокращается в количественном выражении, за последний год быстрее, чем раньше — в 2024 году продали 147,95 тыс. серверов, на 15,1 % меньше, чем годом ранее.

В денежном выражении рынок несколько вырос до $1,78 млрд, что больше год к году на 1,4 %. Рост рынка в денежном выражении исследователи объяснили в основном «технологическими и экономическими составляющими» — переход на использование процессоров новых поколений и более дорогих конфигураций. При этом санкции и без того влияют на издержки — в последние три года выросла как цена серверного оборудования, так и расходы на производство и логистику. Кроме того, многое зависит от курса доллара.

После ухода западных компаний, российские производители серверов активно росли благодаря импортозамещению, но теперь рост почти остановился — в 2024 году доля отечественных производителей серверов на рынке составила 43%, что всего на 1,7% больше, чем годом ранее.

 Источник изображения: Alexander Smagin/unsplash.com

Источник изображения: Alexander Smagin/unsplash.com

По словам АРПЭ, основным драйвером развития российского производства серверного оборудования в 2022 и 2023 гг. стал уход ключевых иностранных вендоров. Тогда выпуском серверов под собственными брендами занялись десятки компаний, многие из них вложили средства в локальное производство и разработки. Однако потенциал импортозамещения исчерпался довольно быстро, уже в 2024 тренд в России для местных компаний изменился.

Сегодня основной моделью работы для российских вендоров является локализация производства в стране серверов, разработанных за рубежом, и ценовая конкуренция не позволяет отечественным производителям выйти «за пределы регулируемых рынков». Другими словами, в обычных коммерческих проектах серверное оборудование обычно просто завозится вендорами из-за границы, но под собственными торговыми марками. Благодаря такой модели российский бизнес сохраняет авторизованные каналы поставок и техподдержки, в то же время не сталкиваясь с барьерами, характерными для параллельного импорта.

Как отмечают в РАПЭ, с учётом действующей в России нормативной базы, для локализации производства достаточно покупки конструкторской документации за рубежом у ODM-компаний, с дальнейшим размещением производства в России и включением готового оборудования в Реестр российской промышленной продукции. Фактически речь идёт о монтаже компонентов на печатные платы, изготовлении корпусов, сборке и тестировании оборудования, а использования российской компонентной базы касается лишь позиций, не влияющих на схемотехнику серверных плат.

 Источник изображения: Fplus

Источник изображения: Fplus

В прошлом году, по данным исследования, многие заказчики стремились снизить закупки нового оборудования вообще, как российского, так и зарубежного, стремясь продлить жизненный цикл уже имеющихся платформ. В текущем году АРПЭ ожидает стагнацию на российском рынке — он должен вырасти, когда действующее оборудование потребует замены. Предполагается, что спрос на российские продукты будут стимулировать регулированием рынка критической информационной инфраструктуры (КИИ), процесс уже идёт в настоящее время.

Впрочем, вопрос требует всестороннего изучения. В начале мая Fplus предоставляла информацию о том, что в 2024 году российские корпоративные заказчики приобрели гораздо больше закупали отечественных серверов, чем зарубежных — в примерном соотношении 3:1, несмотря на то что у многих компаний IT-инфраструктура по-прежнему базируется на зарубежном оборудовании.

Постоянный URL: http://servernews.ru/1122850
15.05.2025 [13:51], Владимир Мироненко

Спрос на AMD Instinct MI325X со стороны крупных компаний оказался ниже ожиданий из-за ограниченных возможностей масштабирования

Одно из последних предложений AMD для рынка ЦОД — ускоритель AMD Instinct MI325X — не вызвал большого интереса у крупных заказчиков, отдавших предпочтение чипам NVIDIA Blackwell из-за лучшего соотношения цены и производительности, сообщили аналитики SemiAnalysis.

После тестовых закупок чипа в 2024 году Microsoft не стала размещать заказы на дальнейшие поставки. Пытаясь привлечь интерес других крупных клиентов, AMD снизила цены на Instinct MI325X. После этого чипы приобрела Oracle и ещё несколько гиперскейлеров, но объёмы закупок не идут ни в какое сравнение с продажами ускорителей NVIDIA.

 Источник изображения: AMD

Источник изображения: AMD

Отсутствие интереса крупных компаний связано с ограничением MI325X в возможности масштабирования лишь до восьми ускорителей, объединённых быстрым интерконнектом, тогда как суперускоритель GB200 NVL72 размер со стойку поддерживает объединение 72 ускорителей. Когда дело касается крупномасштабных рабочих нагрузок ИИ-инференса и рассуждений на on-premise уровне, такая разница имеет решающее значение, отметил ресурс SemiAnalysis.

AMD позиционировала MI325X в качестве альтернативы NVIDIA HGX B200 (NVL8) и HGX B300 (NVL16), но даже в этом сегменте NVIDIA имеет преимущество как в чистой производительности, так и в совокупной стоимости владения.

Вместе с тем, у MI325X имеются перспективы для менее масштабных развёртываний, не требующих больших кластеров ускорителей, например, для инференса небольших моделей, когда требуется много памяти с большой пропускной способностью. AMD продолжает совершенствовать свою программную экосистему, с которой у неё были очень большие проблемы, и MI325X при условии конкурентоспособной цены может вызвать интерес у компаний, разрабатывающих ИИ-модели среднего размера, считают в SemiAnalysis.

Постоянный URL: http://servernews.ru/1122864
Система Orphus