Материалы по тегу: ии

18.04.2025 [15:47], Владимир Мироненко

Cloud.ru представил первый в России управляемый облачный сервис для инференса ИИ-моделей — Evolution ML Inference

Провайдер Cloud.ru представил Evolution ML Inference — первый, по словам компании, в России управляемый облачный сервис для инференса больших языковых моделей (LLM), который позволит эффективно управлять вычислительными ресурсами. С его помощью клиенты смогут помимо моделей GigaChat от Cloud.ru запускать и развертывать собственные ИИ-модели, а также open source модели из библиотеки Hugging Face на базе облачных ускорителей.

Это полностью управляемый сервис — пользователю достаточно настроить конфигурацию, модель и тип масштабирования, Cloud.ru предоставит доступ к мощным ускорителям, а также будет отвечать за полное администрирование и обслуживание инфраструктуры. Сервис отличается простотой и гибкостью управления, что позволяет запускать модели без необходимости сборки образа напрямую из Hugging Face, а также запускать собственные образы со своим окружением.

Благодаря поддержке технологии Shared GPU, позволяющей распределять GPU-ресурсы с учётом потребления количества vRAM, необходимого для эффективной работы модели без задержек, а также с возможностью динамически перераспределять ресурсы в зависимости от текущих потребностей, сервис обеспечивает повышение утилизации мощностей в ИИ-проектах от 15 до 45 % в сравнении со сценарием, когда GPU используется целиком. Тем самым обеспечивается высокая степень адаптации и рациональное использование доступных ресурсов с одновременным запуском нескольких моделей на одном GPU.

«Это делает технологию наиболее оптимальной для распределённых систем с разнородной вычислительной инфраструктурой и помогает эффективно масштабировать нагрузку», — отметила Cloud.ru. Ещё одно отличие сервиса — поддержка режима скайлирования (эффективного масштабирования), когда оплата за использование модели начисляет только с момента обращения к ней.

По оценкам Cloud.ru, около 70 % заказчиков используют GPU-ресурсы, зарезервированные под инференс в процессе эксплуатации ML-моделей, менее чем на 55 %. При внедрении ИИ в большинстве случаев базой становится именно среда исполнения модели. Поэтому для рационального использования ресурсов и оптимизации затрат при обработке ИИ-нагрузок, особенно генеративного ИИ, необходима производительная инфраструктура с гибким масштабированием в реальном времени, отметил глава Cloud.ru.

Постоянный URL: http://servernews.ru/1121510
18.04.2025 [12:37], Руслан Авдеев

ИИ-мегапроект Stargate может прийти в Великобританию и Евросоюз, но только в случае успеха в США

Совместный ЦОД-проект Stargate, реализуемый в США компанией OpenAI при участии SoftBank, Oracle, MGX и других партнёров, в ближайшие годы могут расширить. Предполагается организация площадок в Европе, сообщает The Financial Times. По информации издания, главным претендентом на строительство регионального объекта Stargate пока является Великобритания, но переговоры и обсуждения ещё находятся на самой ранней стадии.

В рамках Stargate планируется потратить только в ближайший год около $100 млрд, а в течение четырёх лет — порядка $500 млрд. Всю инфраструктуру пока планируется строить в Соединённых Штатах. Дальнейшее развитие запланировано только при условии, что OpenAI преуспеет в реализации Stargate в США. Лишь после этого компания и партнёры начнут уделять серьёзное внимание другим рынкам. По словам одного из источников, участвующих в совместных работах, в качестве кандидатов для развития Stargate также рассматриваются Германия и Франция.

 Источник изображения: Mariia Shalabaieva/unsplash.com

Источник изображения: Mariia Shalabaieva/unsplash.com

На данный момент Великобритания считается в OpenAI самым перспективным кандидатом с учётом усилий местных властей по развитию ИИ и даже превращению в «ИИ-сверхдержаву» с помощью атомной энергетики. Франция также начала реализацию крупных ИИ-проектов в рамках более широкой инициативы по стимулированию инвестиций в экономику.

Издание не исключает, что «утечки» из OpenAI и прочих участников проекта могут использоваться для организации косвенного давления на европейские страны, побуждая те конкурировать друг с другом, предлагая налоговые льготы и упрощённые бюрократические процедуры. Ранее глава OpenAI Сэм Альтман (Sam Altman) заявил, что «хотел бы реализовать проект Stargate Europe» и сообщил, что уже провёл многообещающие беседы на континенте.

Постоянный URL: http://servernews.ru/1121483
18.04.2025 [12:14], Сергей Карасёв

Массовый выпуск серверных процессоров на предприятиях в России начнётся не раньше 2030 года

Серийное производство российских высокопроизводительных процессоров для серверов на отечественных предприятиях будет освоено не ранее, чем через восемь лет. Об этом, как сообщает ComNews, заявил заместитель директора по развитию АО «МЦСТ» (разработчик чипов «Эльбрус») Константин Трушкин.

По его словам, заводы, способные выпускать серверные чипы по 28-нм технологии, могут появиться в России «на горизонте 2028–2030 гг.». Ещё около трёх лет потребуется на получение массовой партии серверных процессоров с российскими кристаллами в соответствии с запросами участников рынка. Таким образом, в лучшем случае такие изделия в необходимых количествах станут доступны в 2031-м.

Как отмечает Трушкин, организация подобного производства — это сложный технологический процесс. Для его отладки необходим партнёр, готовый «передать на завод дизайн сложной микросхемы» и совместными усилиями выявить возможные проблемы. Из-за высокой трудоёмкости такого проекта необходима поддержка, которую, по мнению Трушкина, могли бы оказать регуляторы. Переход на российские процессоры важен в связи со сформировавшейся геополитической обстановкой и санкциями, которые затрудняют закупки зарубежного оборудования.

 Источник изображения: «МЦСТ»

Источник изображения: «МЦСТ»

Трушкин считает, что «МЦСТ» станет первой отечественной компанией, которая сможет освоить массовый выпуск высокопроизводительных серверных процессоров на российском заводе. По его словам, изделия «Эльбрус» благодаря своей архитектуре позволяют получать значительную производительность с единицы площади кристалла.

Вместе с тем участники рынка говорят, что, помимо создания российских серверных чипов, необходимо переписать ПО под новую архитектуру. При этом с портированием софта могут возникнуть серьёзные сложности из-за дефицита квалифицированных специалистов в соответствующей области.

Постоянный URL: http://servernews.ru/1121479
17.04.2025 [21:27], Владимир Мироненко

UserGate расширила экосистему UserGate SUMMA образовательными проектами и ИБ-услугами

Российский разработчик ИБ-решений UserGate объявил о существенном расширении собственной экосистемы информационной безопасности UserGate SUMMA, которая теперь объединяет не только продукты и технологии, но и образовательные проекты, а также ИБ-услуги и сервисы. Это позволит компании обеспечивать комплексную кибербезопасность, которая включает помимо инфраструктурных и программных решений развитую экспертизу, сервисное сопровождение и обучение.

В начале 2025 года компания провела исследование, которое показало, что рост числа угроз и требований к информационной безопасности входит в Топ-3 вызовов в сфере IT для большинства клиентов UserGate из государственного и коммерческого сектора. Более трети респондентов (36 %) отметили, что на современном российском рынке существующих ИБ-решений недостаточно и ими покрыты не все актуальные потребности в защите от киберугроз.

 Источник изображения: UserGate

Источник изображения: UserGate

Исследование также показало, что удовлетворённость клиентов защитой UserGate остаётся выше среднего, но они также хотели бы иметь более качественную техподдержку. При этом уровень сервисного сопровождения для них зачастую приоритетнее, чем характеристики технических решений, например, их многофункциональность.

Реагируя на пожелания клиентов, UserGate приняла меры к повышению уровня техподдержки, запустив новые направления сервиса, увеличив на 50 % год к году количество тестов. Штат технических специалистов за последние два года увеличился примерно в три раза. И сейчас в среднем 20 % заявок решаются уже на этапе заведения.

Важным компонентом расширяющейся экосистемы является постоянное развитие ИБ-продуктов. Как сообщил директор по продукту UserGate, в дополнение к флагманским продуктам компании — UserGate NGFW, UserGate Management Center, UserGate LogAn — в портфолио появились новые решения: UserGate DCFW — файерволл для задач уровня ЦОД, UserGate SIEM — платформа, предназначенная для сбора, анализа, мониторинга и расследования событий и инцидентов безопасности в сети, UserGate WAF для защиты веб-приложений, UserGate Client — собственное решение класса NAC и т.д.

В состав экосистемы UserGate SUMMA также входит Академия UserGate, которая не только готовит квалифицированные кадры для российского IT-рынка, но и занимается формированием на нём культуру информационной безопасности. Ещё одним важным элементом обновлённой концепции расширяющейся экосистемы UserGate SUMMA является Центр мониторинга и реагирования UserGate, который сосредоточится на создании проактивной сервисной модели обеспечения информационной безопасности заказчиков под названием UserGate Factor.

Постоянный URL: http://servernews.ru/1121466
17.04.2025 [13:31], Руслан Авдеев

Сначала NVIDIA, потом AMD: США не позволили продать в Китай ускорители Instinct на $800 млн

NVIDIA оказалась не единственным разработчиком чипов, который пострадает от новых торговых санкций, введённых в отношении Китая администрацией США. В минувшую среду AMD заявила, что ожидает «списания» $800 млн — около 16 % выручки серии Instinct за 2024 финансовый год, сообщает The Register. Причина — ограничения на экспорт, введённые США, которые блокируют поставки её ИИ-ускорителей Instinct MI308 в Китай и другие страны, вызывающие «обеспокоенность».

Как и в случае с NVIDIA, велика вероятность, что американские власти могут пересмотреть запреты, рассматривая партии поставок в индивидуальном порядке и выдавая экспортные лицензии для MI308 в Китай. При этом AMD отмечает в документе, поданном в Комиссию по ценным бумагам и биржам (SEC), что подать заявки на лицензии компания намерена, но нет никаких гарантий, что они будут одобрены в итоге. Пока же AMD в том же положении, что и NVIDIA, не успевшая распродать запасы ослабленных ускорителей H20 и теперь ожидающая изменения ситуации со складами, полными их запасов.

Хотя потенциальные убытки AMD выглядят весьма скромно в сравнении с $5,5 млрд, которые потеряет NVIDIA в результате запрета продаж H20 в Китай и некоторые другие страны без специального разрешения, для AMD в этом приятного всё равно мало. Бизнес рос хорошими темпами со времени дебюта ускорителей MI300X в конце 2023 года.

 Источник изображения: AMD

Источник изображения: AMD

Ранее AMD заявляла, что производительность MI300X до 32 % выше в сравнении с NVIDIA H100 в некоторых задачах. Как и NVIDIA, AMD рассчитывала разработать собственную версию ослабленного ускорителя для китайского рынка по аналогии c A800 и H800, а позже H20. Речь шла именно о серии MI308 — правда, о ней практически ничего не известно. Год назад говорилось, что некие урезанные версии Instinct MI309 оказались недостаточно слабы для экспорта в Китай. По-видимому, AMD в MI308 пришлось ещё сильнее снизить производительность и пропускную способность интерфейсов.

Хотя возможности NVIDIA и AMD вести дела с Китаем будут серьёзно ограничены в обозримом будущем, компании, возможно, снова смогут доработать существующие модели, дополнительно снизив производительность для обхода ограничений, введённых Министерством торговли США. Intel также готовила отдельную серию ИИ-ускорителей Habana Gaudi3 — к обычным HL-325L, HL-335 и HL-338 были добавлены урезанные HL-328 и HL-388. Впрочем, продажами Habana компания и так не может похвастаться.

Также не исключено, что AMD начнёт продвигать MI308 в качестве ускорителя для инференса в странах, куда продавать их по американским законам всё ещё можно. Это позволит хотя бы вернуть часть инвестиций. Нечто подобное произошло с NVIDIA A800. В Китай они не попали, но NVIDIA смогла продать их HP для установки в рабочии станции. Заинтересованность в A800 и H800 также выражала Индия, на которую на тот момент ограничения в основном не распространялись.

Постоянный URL: http://servernews.ru/1121420
17.04.2025 [11:55], Сергей Карасёв

OpenYard начала серийный выпуск российских материнских плат для Intel Xeon Sapphire Rapids и Emerald Rapids

Компания OpenYard объявила о начале серийного выпуска новых материнских плат для серверного оборудования на своей производственной площадке в Рязанской области. Системы на базе этих плат планируется включить в реестр Минпромторга РФ.

 Источник изображения: OpenYard

Источник изображения: OpenYard

Изделие базируется на наборе логики Intel C741. Допускается установка двух процессоров Intel Xeon Emerald Rapids или Sapphire Rapids в исполнении LGA 4677 с показателем TDP до 350 Вт. Доступны 32 слота для модулей оперативной памяти DDR5 и разъёмы PCIe 5.0.

Отмечается, что, помимо начала изготовления материнских плат, OpenYard обновила весь стек вспомогательных плат, бэкплейны и райзеры, которые получили переработанный дизайн и с 2025 года изготавливаются на отечественном текстолите чёрного цвета. При этом на предприятии в Рязанской области существуют широкие возможности для масштабирования производства.

Как отмечает директор производства OpenYard, организация выпуска материнских плат следующего поколения и сопутствующих решений является важным достижением для компании на пути к расширению продуктового ассортимента и выводу на рынок принципиально новых серверных продуктов для российского бизнеса: «Наш производственный комплекс успешно освоил технологический процесс, и теперь мы можем предоставить заказчикам продукцию нового поколения, а доверенным партнёрам — возможность контрактного производства плат любого уровня сложности на базе производственного комплекса OpenYard в Рязанской области».

Постоянный URL: http://servernews.ru/1121414
17.04.2025 [11:33], Владимир Мироненко

«Группа Астра» с партнёрами создала СП для развития и продвижения отечественной open source среды разработки OpenIDE

«Группа Астра», Axiom JDK (АО «Аксиом») и Haulmont объявили о создании совместного предприятия «Открытая среда разработки» на паритетных началах в рамках некоммерческого партнёрства с целью развития и вывода на рынок OpenIDE — бесплатной, безопасной, лицензионно чистой среды разработки на базе open source среды IntelliJ IDEA Community Edition, первая версия которой находится на финальной стадии бета-тестирования. Выход стабильной версии OpenIDE с публикацией исходников и открытием баг-трекера намечен на II квартал 2025 года. Согласно графику, в III квартале платформа будет включена в реестр российского ПО.

OpenIDE объединяет и упрощает использование различных инструментов разработки, способствуя экономии ИТ-ресурсов и снижению затрат, оптимизируя процессы разработки и управление лицензиями, что позволяет компаниям более эффективно распределять ресурсы. Платформа позволит решать задачи госсектора и крупного бизнеса, предъявляющих особые требования к безопасности, предсказуемости и технологической независимости.

Как указано в пресс-релизе, запуск платформы стал одним из первых в России масштабных примеров объединения нескольких вендоров для создания бесплатного решения с открытым исходным кодом, соответствующего самым высоким стандартам производительности, надёжности и безопасности.

 Источник изображения: OpenIDE

Источник изображения: OpenIDE

Учредители OpenIDE рассчитывают привлечь партнёров для участия в open source проекте, которые также предложат свои продукты пользователям платформы. В OpenIDE можно создавать Java-проекты на свободной версии платформы Axiom JDK — единственной отечественной тиражируемой JDK. Бесплатная версия плагина Amplicode от Haulmont предоставляет базовую поддержку фреймворка Spring «из коробки». Также «Группа Астра» планирует в ближайшее время предложить удобную интеграцию с платформой для разработки GitFlic.

Ключевые преимущества OpenIDE — открытый исходный код и отсутствие рисков, связанных с использованием зарубежных технологий и размещением инфраструктуры за пределами страны. В ней нет проприетарных компонентов, серверы с дистрибутивами и исходным кодом, как и команда её разработчиков, находятся в России. Что также удобно, функциональность решения можно расширить, подключив соответствующие отечественные плагины через открытый маркетплейс. Благодаря этому обеспечивается гибкость, надёжность и безопасность решения, а также исключаются проблемы с лицензированием, говорят создатели.

Генеральным директором ООО «Открытая среда разработки» назначен Федор Сазонов, который, в частности руководил разработкой решений для работы с ключевыми клиентами в «Сбере». «Создание OpenIDE — это не просто реакция на текущие ограничения, а стратегический шаг. Мы стремимся вырастить полноценную и безопасную экосистему продуктов для российских разработчиков ПО», — заявил Сазонов, выразив уверенность в перспективности проекта, который привлечёт большое количество пользователей.

Постоянный URL: http://servernews.ru/1121415
17.04.2025 [00:10], Владимир Мироненко

Суперускоритель Huawei CloudMatrix 384 оказалася быстрее NVIDIA GB200 NVL72, но значительно прожорливее

Huawei анонсировала на конференции Huawei Cloud Ecosystem Conference 2025 собственный суперускоритель CloudMatrix 384, который позиционируется в качестве отечественной альтернативы системы NVIDIA GB200 NVL72. Решение Huawei отличается более высокой общей производительностью — 300 Пфлопс против 180 Пфлопс. Но в то же время оно уступает решению NVIDIA по производительности на чип и имеет значительно более высокое энергопотребление, пишет SemiAnalysis.

Система Huawei CloudMatrix 384 использует 384 ускорителя Huawei Ascend 910C, в то время как в GB200 NVL72 задействовано 36 процессоров Grace в сочетании с 72 ускорителями B200 (Blackwell). То есть, чтобы вдвое превзойти по производительности GB200 NVL72, потребовалось примерно в пять раз больше ускорителей Ascend 910C, что не очень хорошо с точки зрения использования самих ускорителей, но отлично на уровне развёртывания системы, отметил ресурс SemiAnalysis. Как утверждает SemiAnalysis, Huawei отстает от NVIDIA на поколение по производительности чипов, но опережает в проектировании и развёртывании масштабируемых систем.

 Источник изображения: TechPowerUp

Источник изображения: TechPowerUp

Если сравнивать отдельные ускорители, то NVIDIA GB200 явно превосходит Huawei Ascend 910C, обеспечивая более чем в три раза большую производительность в вычислениях в формате BF16 (2500 против 780 Тфлопс) и больший HBM на чипе (192 против 128 Гбайт) с более высокой пропускной способностью памяти (ПСП, 8 против 3,2 Тбайт/с). Другими словами, у NVIDIA есть преимущество в чистой мощности и на уровне чипа.

Но на уровне системы эффективность CloudMatrix CM384 выходит вперёд. Он выдаёт в 1,7 раза больше Пфлопс, имеет в 3,6 раз больше HBM, обеспечивает в 2,1 раза большую ПСП и объединяет более чем в пять раз больше ускорителей, чем GB200 NVL72. Однако эта масштабируемость имеет обратную сторону, поскольку система Huawei потребляет почти в четыре раза больше энергии — 145 кВт против ~560 кВт. Для Huawei CloudMatrix 384 требуется в 3,9 раза больше энергии, чем для GB200 NVL72: в 2,3 раза больше энергии на 1 флопс, в 1,8 раза — на 1 Тбайт/с ПСП и в 1,1 раза — на 1 Тбайт HBM.

SCMP со ссылкой на данные самой Huawei сообщает, что CloudMatrix CM384 показал производительность на уровне 800 Пфлопс в BF16-вычислениях без разреженности или 1920 токенов/с на модели DeepSeek-R1. Суперускоритель размещается в 16 стойках, из которых четыре отведено только под интерконнект — всего 6912 400G-порта. Остальные стойки содержат по 32 ускорителя Ascend 910C в четырёх узлах (8×4) и ToR-коммутатор.

Как отметил SemiAnalysis, было бы заблуждением говорить, что Ascend 910C и CloudMatrix 384 производятся в Китае: HBM в них от Samsung, пластины от TSMC, а само оборудование из США, Нидерландов и Японии. Хотя у китайской SMIC уже есть 7-нм техпроцесс, подавляющее большинство Ascend 910B/910C было втайне сделано по 7-нм технологии TSMC. Предполагается, что Huawei смогла обойти санкции США, заказав чипы на $500 млн при посредничестве Sophgo. Сама TSMC прекратила поставки Huawei в 2020 году.

Постоянный URL: http://servernews.ru/1121397
16.04.2025 [13:09], Владимир Мироненко

Orion soft уже заместила 15 % всей бывшей инсталляционной базы VMware на рынке РФ

Российский разработчик инфраструктурного ПО для корпоративного сегмента Orion soft подвёл финансовые итоги 2024 года. Выручка компании составила 3,17 млрд руб., что на 79 % больше по сравнению с 1,76 млрд руб. в 2023 году. Orion soft сообщила, что планирует сохранять подобный темп роста в ближайшие два-три года.

Больше всего выручки компании принесли клиенты из нефтегазохимического и энергетического сектора (47 %). Далее следуют компании из финансовой отрасли (23 %) и госсектора (10 %). Оставшуюся часть принесли клиенты промышленной индустрии, металлургии, машиностроения и транспортной отрасли. Количество компаний-заказчиков Orion soft превысило 430 шт.

Управляющий директор Orion soft сообщил, что в 2024 году госсектор, финансовая и энергетическая отрасль активно занимались импортозамещением в части виртуализации. Объём выручки Orion soft от сделок с госкомпаниями увеличился год к году в 4 раза, выручка от проектов с заказчиками из финсектора — в 3 раза, с заказчиками из энергетического сектора — в 2 раза. Выручка от проектов в нефтегазохимической отрасли росла не так активно, поскольку в секторе уже высока доля импортозамещения. Большинство заказчиков уже выбрали решения, и некоторые уже установили внутрикорпоративный стандарт ПО и внедряют его в дочерних предприятиях.

 Источник изображения: Orion soft

Источник изображения: Orion soft

Директор по развитию бизнеса Orion soft подчеркнул, что в 2024 году выручка компании росла втрое быстрее рынка виртуализации, который по оценкам iKS-Consulting увеличился за год примерно на 20 %. По его словам, на сегодняшний день компания уже заместила 15 % всей бывшей инсталляционной базы VMware на рынке: «Мы ожидаем роста в таком же темпе еще как минимум ближайшие два-три года. По нашей оценке, примерно столько времени нужно, чтобы большинство предприятий с КИИ завершили импортозамещение в части инфраструктурного ПО».

Драйвером роста компании стал её флагманский продукт — платформа безопасного управления средой виртуализации zVirt, выручка от продаж которой составила 2,7 млрд руб., а инсталляционная база продукта достигла 12 тыс. хостов. В ближайших планах компании — усиление интеграции zVirt и системы терминального доступа Termit функциональностью VDI, а также связки zVirt и CMP-платформы Cloudlink для управления виртуальной облачной инфраструктурой.

Постоянный URL: http://servernews.ru/1121376
16.04.2025 [12:26], Руслан Авдеев

США запретили продавать Китаю даже ослабленные ускорители NVIDIA H20

Очередным шагом в американо-китайской торговой войне стало введение администрацией Дональда Трампа (Donald Trump) запрета на поставки в КНР специально ослабленных ускорителей NVIDIA H20. По последним данным, это может стоить NVIDIA $5,5 млрд, сообщает The Register.

Деталей пока немного, но уже известно, что новые экспортные ограничения предусматривают ограничение поставок H20 не только в материковый Китай, но и Гонконг, а также другие регионы, вызывающие сомнения у американских властей. Возможность продаж не закрыта полностью — но для этого потребуется получить специальную экспортную лицензию. NVIDIA узнала об этом 9 апреля, а позже ей сообщили, что требование о получении экспортной лицензии останется в силе «на неопределённый период времени».

Согласно данным, поданным американскому регулятору — Комиссии по ценным бумагам и биржам (SEC), контроль должен предотвратить использование чипов Китаем в своих суперкомпьютерах. NVIDIA сообщила SEC, что ожидает убытков до $5,5 млрд в I квартале финансового года из-за затрат, связанных с H20, в т.ч. со списанием запасов, обязательствами по закупкам и связанными резервами.

Другими словами, у NVIDIA, похоже, останется огромная партия ускорителей H20, которые она не успела продать в Китай, а теперь они будут занимать место на складах, пока Трамп не решит, стоит ли намерение NVIDIA инвестировать в производство ИИ-решений на территории США разрешения на поставки H20 в Китай. С учётом того, что глава NVIDIA встречался с Дональдом Трампом ранее в этом месяце, вероятно, он не рассчитывал на столь суровые встречные меры. По слухам, именно после совместного обеда администрация Трампа «поставила на паузу» планы по ужесточению экспортного контроля относительно ускорителей H20.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

С учётом того, что NVIDIA совсем недавно выразила готовность расширять производство на территории США наряду с TSMC, Wistron, Foxconn и другими компаниями, вполне возможно, со временем Белый дом всё-таки разрешит поставки H20 в Китай, хотя бы в некоторых объёмах.

США уже не впервые ограничивают поставки ускорителей NVIDIA в Китай. С конца 2022 года администрация Байдена вводила ограничения на всё новые типы ускорителей, и каждый раз NVIDIA ослабляла свои решения специально для китайского рынка для того, чтобы те соответствовали техническим требованиям для свободного экспорта. Теперь, как сообщают в SEC, этот порог поднят до такой степени, что под запрет попали как H20 (и без того в разы более слабые в сравнении с современными решениями), но и другие ускорители с аналогичными характеристиками. После новостей о запрете акции NVIDIA упали более, чем на 6 %.

Удар для Китая может оказаться болезненным. В конце февраля триумф ИИ-моделей DeepSeek подстегнул спрос на ускорители H20 в Китае, а чуть более недели назад сообщалось, что NVIDIA может переключиться на выполнение заказов только из Китая в преддверии усиления санкций США.

Постоянный URL: http://servernews.ru/1121368
Система Orphus