Материалы по тегу: deepseek

26.05.2025 [18:09], Руслан Авдеев

Под давлением США власти Малайзии открестились от ИИ-проекта на базе решений Huawei

Малайзия поспешила отмежеваться от ранее анонсированного «суверенного» ИИ-проекта на базе решений Huawei. Стране приходится балансировать между интересами США и КНР. При этом американские полупроводники играют важную роль в малайзийской экономике, сообщает Asia News Network. Премьер-министр Малайзии Анвар Ибрагим (Anwar Ibrahim) прямо назвал прежние заявления подчинённых «преждевременными», подчеркнув, что его страна «решительно независима» в выборе технологий. По его словам, вопрос находится на стадии переговоров и инициатор в данном случае — частный сектор, а не правительство.

19 мая представитель Министерства связи объявила о создании в стране «первой в своём роде» суверенной ИИ-системы на основе ускорителей Huawei Ascend. Предполагалось, что к 2026 году в стране будет развёрнуто 3 тыс. таких ускорителей, но уже на следующий день сделанное в ходе премьеры инициативы Strategic Artificial Intelligence Infrastructure заявление было официально отозвано без объяснения. 21 мая Министерство инвестиций, торговли и промышленности тоже опровергло заявление, объявив, что проект носит частный характер, а правительство к нему отношения не имеет. Такой поворот объясняют давлением со стороны Вашингтона, ведущего с Малайзией торговые переговоры.

Источник изображения: CHUTTERSNAP/unspalsh.com

Министерство инвестиций, торговли и промышленности поспешило подчеркнуть приверженность Малайзии выполнению экспортных ограничений и соблюдению стандартов безопасности, а также принципов прозрачности и многосторонности при участии ВТО. Анонсированный ранее проект также включал в себя внедрение ИИ-решений китайского стартапа DeepSeek. Советник Трампа по вопросам ИИ Дэвид Сакс (David Sacks) уже 20 мая сообщил, что малайзийское правительство отказалось от анонса, хотя днём ранее он фактически пожаловался на то, что китайцы добились успеха.

Из-за переговоров с США, в том числе относительно потенциальной «оптимизации» пошлин, страна особенно уязвима для давления. По словам представителя Малайзийской ассоциации полупроводниковой промышленности (Malaysia Semiconductor Industry Association), страна должна ясно продемонстрировать, что её действия соответствуют американским торговым требованиям — она должна гарантировать, что с ней можно вести дела.

В соседнем Сингапуре заявили, что нейтралитет сегодня — непозволительная роскошь, поскольку обе стороны (США и Китай) требуют сделать недвусмысленный выбор. США не по душе не только прямое сотрудничество Малайзии с Китаем, но и теневое. В Соединённых Штатах вновь подняли этот вопрос в январе на фоне ужесточения санкций в отношении КНР, опасаясь, что страны Юго-Восточной Азии стали перевалочными пунктами для контрабанды новейших ИИ-чипов в Китай.

Полупроводниковая индустрия — очень важная часть малайзийской экономики, поскольку электронные и электротехнические продукты составляют до 40 % экспорта страны. Кроме того, Малайзия прямо заявила, что хочет стать новым IT-хабом всей Юго-Восточной Азии. В последние два года ей уже удалось привлечь ряд операторов ЦОД и американских гиперскейлеров.

Постоянный URL: http://servernews.ru/1123446

21.05.2025 [10:15], Руслан Авдеев

Малайзия проигнорировала США и развернула первую в регионе суверенную ИИ-платформу на чипах Huawei и LLM DeepSeek

Малайзия официально объявила об успешной реализации проекта Strategic AI Infrastructure — теперь это первая в Юго-Восточной Азии страна с полностью суверенным стеком ИИ-технологий. Несмотря на настоятельные рекомендации Министерства торговли США не использовать передовые китайские ускорители вроде Huawei Ascend, новый проект реализован с использованием именно этих продуктов и китайской ИИ-модели семейства DeepSeek — впервые за пределами КНР, сообщает TrendForce.

Как свидетельствует агентство со ссылкой на малайзийские СМИ, местные власти приветствовали запуск новой инфраструктуры, назвав событие важной вехой на пути развития ИИ в стране. Представитель министерства связи Малайзии подчеркнул, что локализация ИИ-моделей вроде DeepSeek и размещение ИИ-серверов на территории страны укрепляет цифровой суверенитет государства.

Источник изображения: Wengang Zhai/unsplash.com

Предполагается, что теперь Малайзия не зависит от зарубежных облаков или ЦОД — вся инфраструктура, от серверов до ИИ-агентов, разрабатывается и управляется на месте. По имеющимся данным, первая суверенная генеративная ИИ-экосистема, оператором которой выступает малайзийская Skyvast Cloud, работает на основе серверов AlterMatic DT250 с восемью ускорителями Huawei Ascend.

Skyvast и китайская компания Leadyo намерены развернуть к 2026 году 3 тыс. высокопроизводительных ускорителей в нескольких зонах в Малайзии. Это будет частью стратегии по масштабированию национальной ИИ-системы за счёт международного и локального сотрудничества.

Примечательно, что в стране фактически проигнорировали предупреждение Министерства торговли США, которое недавно заявило о потенциальных рисках применения китайских ускорителей, а также предостерегло от использования американских ИИ-чипов для обучения и дальнейшего обеспечения работы китайских ИИ-моделей. В частности, утверждалось, что при их создании использовалась интеллектуальная собственность американских компаний.

Дополнительно на днях сообщалось, что Соединённые Штаты готовят санкции против китайских производителей памяти CXMT, YMTC и других чипмейкеров.

Постоянный URL: http://servernews.ru/1123190

17.03.2025 [17:23], Руслан Авдеев

Ежегодные расходы техногигантов на ИИ превысят $500 млрд, но большая часть денег пойдёт на инференс, а не на обучение моделей

Крупнейшие IT-компании нарастят ежегодные расходы на ИИ-технологии — в совокупности они превысят $500 млрд уже в следующем десятилетии. Одной из причин роста инвестиций в ИИ станет новый подход к разработкам со стороны китайской DeepSeek и OpenAI, сообщает Bloomberg Intelligence.

Группа гиперскейлеров, включая Microsoft, Amazon и Meta✴ намерена потратить $371 млрд на ЦОД и вычислительные ресурсы для ИИ в 2025 году, на 44 % больше, чем годом ранее. К 2032 году затраты вырастут до $525 млрд — быстрее, чем ожидали в Bloomberg Intelligence до того, как недавно «выстрелили» продукты DeepSeek.

До недавних пор большая часть инвестиций в ИИ уходила на дата-центры и чипы, которые использовались для обучения или разработки новых, всё более крупных ИИ-моделей. Теперь компании намерены больше тратить на инференс. Изменение стратегии ускорилось после выпуска «рассуждающих» моделей компаний OpenAI и DeepSeek. У этих систем уходит больше времени на ответы на запросы пользователей, при этом они требуют больше ресурсов на инференс.

Неожиданный для многих успех DeepSeek, которая, как утверждается, создала чрезвычайно недорогую и конкурентоспособную модель на уровне современных продуктов западных конкурентов (с оговорками), вызвал вопросы об эффективности инвестиций в США. Эксперты оценивают, стоило ли вкладывать огромные средства в укрупнение моделей. Некоторые компании уже стали внедрять эффективные LLM, работающие на относительно небольшом числе ускорителей.

Источник изображения: The Drink/unspalsh.com

По данным Bloomberg, «рассуждающие» модели обеспечивают новые возможности для заработка на ПО и потенциально обходятся дороже на этапе инференса, чем на этапе обучения. Это, похоже, приведёт к наращиванию инвестиций в соответствии с новой концепцией и приведёт к росту вложений в ИИ в целом.

Рост капитальных затрат на обучение ИИ, как считают в Bloomberg, может быть заметно медленнее, чем предсказывалось ранее. Огромное внимание, которое привлекла DeepSeek, вероятно, заставит технологические фирмы нарастить инвестиции в инференс — именно он станет самым быстрорастущим сегментом на рынке систем генеративного ИИ. Похожие прогнозы давала и Omdia.

Хотя в текущем году затраты на связанные с обучением задачи, вероятно, составят более 40 % расходов гиперскейлеров на ИИ, сегмент, как ожидается, уменьшится к 2032 году до всего 14 %. В том же году связанные с инференсом инвестиции могут составить около половины всех расходов на ИИ. Как считают в Bloomberg, наилучшие позиции среди гиперскейлеров у Google. У неё TPU собственной разработки, которые можно использовать как для обучения, так и для инференса. Другие компании, вроде Microsoft и Meta✴, сильно зависят от NVIDIA и могут оказаться не столь гибкими в гонке по новым правилам.

Постоянный URL: http://servernews.ru/1119852

10.03.2025 [17:43], Руслан Авдеев

Goldman Sachs: китайские телеком-операторы станут крупнейшими бенефициарами ИИ-бума, раньше всех взяв на вооружение продукты DeepSeek

Три крупнейших китайских телеком-оператора получат максимальную выгоду от бума ИИ-технологий в Китае. Согласно исследованию Goldman Sachs-China, компании China Mobile, China Telecom и China Unicom становятся ключевыми бенефициарами благодаря наличию собственной облачной инфраструктуры и принятию на вооружение продуктов DeepSeek, сообщает блог IEEE Comsoc.

Наличие у тройки лидеров крупнейшей в КНР облачной инфраструктуры позволяет обслуживать и другие облачные компании, а также предлагать собственные облачные сервисы конечным пользователям. В частности, их дата-центрами пользуется Alibaba. А собственная развитая сетевая инфраструктура позволяет снизить себестоимость услуг связи. Более того, другим операторам за передачу данных приходится платить именно «большой тройке» по рыночным ценам. Как считают в Goldman Sachs, в некоторых компаниях, предоставляющих в КНР услуги IaaS, например, QingCloud Technology на ЦОД и услуги связи уходит 50–60 % от общих расходов.

«Большая тройка» сделала ставку на решения DeepSeek, поэтому имеют все шансы воспользоваться преимуществами раннего внедрения этих ИИ-технологий. При этом государство активно поддерживает использование ИИ на государственных предприятиях, на которые приходится до 30 % выручки телеком-операторов. В последние три недели операторы начали помогать ключевым клиентам в развёртывании LLM DeepSeek. China Mobile поддерживает PetroChina в развертывании полнофункциональной модели, China Telecom предоставляет ту же услугу Sinopec, а China Unicom сотрудничает с Фошаньским муниципальным бюро промышленности и информационных технологий.

Источник изображения: Eric Prouzet/unsplash.com

Более того, 21 февраля Комитет по контролю и управлению государственным имуществом Китая (SASAC) инициировала реализацию плана AI+, призванного стимулировать разработку и коммерческое применение ИИ китайскими государственными предприятиями. China Mobile также объявила, что использует ИИ для преобразования своих телекоммуникационных сетей в рамках стратегии AI+NETWORK, ориентированной на интеграцию ИИ в сетевую инфраструктуру.

Постоянный URL: http://servernews.ru/1119492

26.02.2025 [17:15], Руслан Авдеев

Триумф ИИ-моделей DeepSeek подстегнул спрос на ускорители NVIDIA H20 в Китае

Китайские техногиганты Alibaba, ByteDance и Tencent наращивают закупки урезанных ускорителей NVIDIA H20. Даже ослабленные чипы весьма востребованы китайским бизнесом для обеспечения работы ИИ-моделей, сообщает Reuters. Это опровергает опасения относительно падения спроса на фоне того, что модели DeepSeek для обучения и инференса требуют гораздо менее производительного оборудования.

Несмотря на введённые США экспортные ограничения в отношении Китая, запрещающие поставки наиболее передовых ускорителей, NVIDIA продала в 2024 году около 1 млн чипов H20, выручив порядка $12 млрд. Это свидетельствует о том, что спрос на строительство ИИ-инфраструктуры в Китае по-прежнему высок. Стоимость H20 составляет $12-15 тыс., но модель стала критически важным компонентом в гонке китайских ИИ-платформ после новых ограничений, введённых в отношении КНР в 2023 году. Кроме того, есть риск, что новая администрация США запретит продажи Китаю ускорителей H20.

Источник изображения: NVIDIA

Спрос на вычислительные ИИ-мощности в Китае подстегнул триумф местного стартапа DeepSeek, представившего удивительно экономичные и эффективные ИИ-модели. Закупки наращивают Alibaba, ByteDance и Tencent, в частности, для облачных сервисов на базе DeepSeek-R1. ИИ-серверы на базе H20 с DeepSeek также востребованы медицинскими организациями и образовательными ведомствами.

Ускорители Huawei Ascend тоже активно закупаются для снижения зависимости от американских технологий. И хотя они не слишком хороши в обучении моделей в сравнении с продуктами NVIDIA, для инференса их возможностей хватает, а это одна из ключевых ИИ-нагрузок. Инференс-платформы для DeepSeek предлагают и американские компании Cerebras и SambaNova.

Постоянный URL: http://servernews.ru/1118871

24.02.2025 [12:22], Сергей Карасёв

SambaNova развернула самую быструю инференс-платформу для ИИ-модели DeepSeek-R1 671B

Компания SambaNova объявила о том, что в её облаке SambaNova Cloud стала доступна большая языковая модель DeepSeek-R1 с 671 млрд параметров. При этом благодаря применению фирменных ускорителей SN40L обеспечивается рекордно высокая скорость инференса.

Изделия SambaNova SN40L RDU (Reconfigurable Dataflow Unit) состоят из двух крупных чиплетов, оперирующих 520 Мбайт SRAM-кеша, 1,5 Тбайт DDR5 DRAM и 64 Гбайт памяти HBM3. Восьмипроцессорная система на базе SN40L, по заявлениям SambaNova, способна запускать и обслуживать ИИ-модели с 5 трлн параметров и глубиной запроса более 256k.

Платформа SambaNova Cloud при использовании DeepSeek-R1 671B демонстрирует производительность до 198 токенов в секунду, что на сегодняшний день является рекордным показателем. Для сравнения: у ближайшего конкурента — Together AI — результат составляет 98 токенов в секунду, а у Microsoft Azure — 20 токенов в секунду. Ранее Cerebras объявила о собственном рекорде — до 1508 токенов/с, но для гораздо более скромной и, по мнению компании, практичной модели DeepSeek-R1-Distill-Llama-70B.

Источник изображения: SambaNova

Утверждается, что ускорители SambaNova SN40L RDU по сравнению с новейшими GPU обеспечивают в три раза большую производительность и в пять раз более высокую эффективность. В частности, по заявлениям SambaNova, одна стойка с 16 экземплярами SN40L RDU по быстродействию сопоставима с 40 стойками, насчитывающими в общей сложности 320 передовых GPU. Таким образом, существенно сокращаются затраты на использование DeepSeek-R1 671B.

Доступ к DeepSeek-R1 671B в облаке SambaNova Cloud предоставляется посредством API. В перспективе компания планирует наращивать вычислительные мощности, обеспечив производительность на уровне 20 000 токенов в секунду.

Постоянный URL: http://servernews.ru/1118739

17.02.2025 [17:42], Руслан Авдеев

Исследователи DeepMind предложили распределённое обучение больших ИИ-моделей, которое может изменить всю индустрию

После того, как ИИ-индустрия немного отошла от шока, вызванного неожиданным триумфом китайской DeepSeek, эксперты пришли к выводу, что отрасли, возможно, придётся пересмотреть методики обучения моделей. Так, исследователи DeepMind заявили о модернизации распределённого обучения, сообщает The Register.

Недавно представившая передовые ИИ-модели DeepSeek вызвала некоторую панику в США — компания утверждает, что способна обучать модели с гораздо меньшими затратами, чем, например, OpenAI (что оспаривается), и использованием относительно небольшого числа ускорителей NVIDIA. Хотя заявления компании оспариваются многими экспертами, индустрии пришлось задуматься — насколько эффективно тратить десятки миллиардов долларов на всё более масштабные модели, если сопоставимых результатов можно добиться в разы дешевле, с использованием меньшего числа энергоёмких ЦОД.

Дочерняя структура Google — компания DeepMind опубликовала результаты исследования, в котором описывается методика распределённого обучения ИИ-моделей с миллиардами параметров с помощью удалённых друг от друга кластеров при сохранении необходимого уровня качества обучения. В статье «Потоковое обучение DiLoCo с перекрывающейся коммуникацией» (Streaming DiLoCo with overlapping communication) исследователи развивают идеи DiLoCo (Distributed Low-Communication Training или «распределённое обучение с низким уровнем коммуникации»). Благодаря этому модели можно будет обучать на «островках» относительно плохо связанных устройств.

Источник изображения: Igor Omilaev/unsplash.com

Сегодня для обучения больших языковых моделей могут потребоваться десятки тысяч ускорителей и эффективный интерконнект с большой пропускной способностью и низкой задержкой. При этом расходы на сетевую часть стремительно растут с увеличением числа ускорителей. Поэтому гиперскейлеры вместо одного большого кластера создают «острова», скорость сетевой коммуникации и связность внутри которых значительно выше, чем между ними.

DeepMind же предлагает использовать распределённые кластеры с относительно редкой синхронизацией — потребуется намного меньшая пропускная способность каналов связи, но при этом без ущерба качеству обучения. Технология Streaming DiLoCo представляет собой усовершенствованную версию методики с синхронизацией подмножеств параметров по расписанию и сокращением объёма подлежащих обмену данных без потери производительности. Новый подход, по словам исследователей, требует в 400 раз меньшей пропускной способности сети.

Источник изображения: DeepMind

Важность и потенциальную перспективность DiLoCo отмечают, например, и в Anthropic. В компании сообщают, что Streaming DiLoCo намного эффективнее обычного варианта DiLoCo, причём преимущества растут по мере масштабирования модели. В результате допускается, что обучение моделей в перспективе сможет непрерывно осуществляться с использованием тысяч разнесённых достаточно далеко друг от друга систем, что существенно снизит порог входа для мелких ИИ-компаний, не имеющих ресурсов на крупные ЦОД.

В Gartner утверждают, что методы, уже применяемые DeepSeek и DeepMind, уже становятся нормой. В конечном счёте ресурсы ЦОД будут использоваться всё более эффективно. Впрочем, в самой DeepMind рассматривают Streaming DiLoCo лишь как первый шаг на пути совершенствования технологий, требуется дополнительная разработка и тестирование. Сообщается, что возможность объединения многих ЦОД в единый виртуальный мегакластер сейчас рассматривает NVIDIA, часть HPC-систем которой уже работает по схожей схеме.

Постоянный URL: http://servernews.ru/1118392

03.02.2025 [15:21], Сергей Карасёв

Реальные затраты DeepSeek на создание ИИ-моделей на порядки выше заявленных, но достижений компании это не умаляет

Китайский стартап DeepSeek наделал много шума в Кремниевой долине, анонсировав «рассуждающую» ИИ-модель DeepSeek R1 c 671 млрд параметров. Утверждается, что при её обучении были задействованы только 2048 ИИ-ускорителей NVIDIA H800, а затраты на данные работы составили около $6 млн. Это бросило вызов многим западным конкурентам, таким как OpenAI, а акции ряда крупных ИИ-компаний начали падать в цене. Однако, как сообщает ресурс SemiAnalysis, фактические расходы DeepSeek на создание ИИ-инфраструктуры и обучение нейросетей могут быть гораздо выше.

Стартап DeepSeek берёт начало от китайского хедж-фонда High-Flyer. В 2021 году, ещё до введения каких-либо экспортных ограничений, эта структура приобрела 10 тыс. ускорителей NVIDIA A100. В мае 2023 года с целью дальнейшего развития направления ИИ из High-Flyer была выделена компания DeepSeek. После этого стартап начал более активное расширение вычислительной ИИ-инфраструктуры.

По данным SemiAnalysis, на сегодняшний день DeepSeek имеет доступ примерно к 10 тыс. изделий NVIDIA H800 и 10 тыс. NVIDIA H100. Кроме того, говорится о наличии около 30 тыс. ускорителей NVIDIA H20, которые совместно используются High-Flyer и DeepSeek для обучения ИИ, научных исследований и финансового моделирования. Таким образом, в общей сложности DeepSeek может использовать до 50 тыс. ускорителей NVIDIA при работе с ИИ, что в разы больше заявленной цифры в 2048 ускорителей.

Источник изображения: SemiAnalysis

Кроме того, SemiAnalysis сообщает, что общие капитальные затраты на ИИ-серверы для DeepSeek составили около $1,6 млрд, тогда как операционные расходы могут достигать $944 млн. Это подрывает заявления о том, что DeepSeek заново изобрела процесс обучения ИИ и инференса с существенно меньшими инвестициями, чем лидеры отрасли. Цифра в $6 млн не учитывает затраты на исследования, тюнинг модели, обработку данных и пр. На самом деле, как подчёркивается, DeepSeek потратила более $500 млн на разработки с момента своего создания.

И всё же DeepSeek имеет ряд преимуществ перед другими участниками глобального ИИ-рынка. В то время как многие ИИ-стартапы полагаются на внешних поставщиков облачных услуг, DeepSeek эксплуатирует собственные дата-центры, что позволяет быстрее внедрять инновации и полностью контролировать разработку, оптимизируя расходы. Кроме того, DeepSeek остаётся самофинансируемой компанией, что обеспечивает гибкость и позволяет более оперативно принимать решения.

Плюс к этому DeepSeek нанимает специалистов исключительно из Китая, уделяя особое внимание не формальным записям в аттестатах, а практическим навыкам работы и способностям эффективно выполнять поставленные задачи. Некоторые ИИ-исследователи в DeepSeek зарабатывают более $1,3 млн в год, что говорит об их высочайшей квалификации.

Постоянный URL: http://servernews.ru/1117640

03.02.2025 [09:20], Руслан Авдеев

The Register: Успех DeepSeek показал важность обдуманных инвестиций в ИИ, но потребность в развитии инфраструктуры никуда не денется

Шок, вызванный недавним триумфом китайского ИИ-стартапа DeepSeek, представившего дешёвые и эффективные ИИ-модели, заставил многих усомниться в результативности масштабных вложений в инфраструктуру на базе дорогих ИИ-ускорителей, сообщает The Register. Тем не менее эксперты уверены, что отказываться от инвестиций было бы нецелесообразно.

На прошлой неделе акции ряда крупнейших американских ИИ-брендов после дебюта весьма эффективной модели DeepSeek R1, использующей, со слов создателей, сравнительно мало ускорителей NVIDIA, буквально обрушились в цене. Из-за этого многие эксперты усомнились в том, что траты миллиардов на аппаратную инфраструктуру для ИИ себя оправдывают, если Китай способен добиться хороших результатов, используя не самое мощное оборудование. Например, NVIDIA «в моменте» потеряла $600 млрд рыночной стоимости.

Настоящая истерия наложилась на растущее беспокойство в связи с тем, что всё больше денег тратится на инфраструктуру и её поддержку, а особенной отдачи пока не видно. Впрочем, паника может быть неуместной, поскольку обрушение акций прекратилось, а DeepSeek обвиняется в использовании ИИ-моделей Anthropic и OpenAI. Как отмечает The Register, нет и реальных подтверждений того, что производительность моделей DeepSeek находится на уровне лучших из актуальных моделей, а также того, что на обучение китайского ИИ ушло всего $6 млн. По оценкам SemiAnalysis, доступная DeepSeek инфраструктура гораздо больше, чем утверждает компания, и стоит более чем $1,5 млрд.

Источник изображения: Etienne Girardet/unsplash.com

По словам экспертов Omdia, опасения относительно «сокрушительных» инноваций DeepSeek сильно преувеличены. В компании подтверждают, что китайский стартап использовал некоторые «гениальные инновации», но они приведут лишь к массовому использованию аналогичных решений и строительству новой ИИ-инфраструктуры. В Omdia прогнозируют, что в ближайшие годы рынок ИИ-инфраструктуры, скорее всего, значительно вырастет. В компании полагают, что до 2028 года поставки серверов для инференса будут расти на 17 % ежегодно.

В TrendForce придерживаются несколько иного мнения и предполагают, что в будущем организации всё же станут более строго оценивать инвестиции в инфраструктуру ИИ и станут применять более эффективные модели для того, чтобы снизить зависимость от доступности ускорителей. Также не исключается, что чаще будут использоваться кастомные ASIC вместо сторонних ИИ-ускорителей и спрос на «классические» модели может претерпеть с 2025 года заметные изменения. Если раньше индустрия полагалась в первую очередь на масштабирование моделей, увеличение объёмов данных и повышение производительности оборудования, то теперь стратегия меняется. DeepSeek прибегла к «дистилляции» моделей, повышению скорости инференса и снижения зависимости от оборудования.

Не так давно генеральный директор IBM Арвинд Кришна (Arvind Krishna) объявил, что деятельность DeepSeek подтвердила правильность подхода к ИИ его собственной компании, считающей, что модели могут быть меньше, как и время их обучения. При использовании подобных подходов затраты на инференс могут снизиться в 30 раз, что очень хорошо для корпоративных клиентов. Ещё в 2023 году компания начала развивать серию «экономичных» базовых моделей Granite. Вероятно, по этому пути пойдут и другие.

Источник изображения: SemiAnalysis

Gartner также сообщает, что именно эффективное масштабирование ИИ будет целесообразнее простого наращивания вычислительных ресурсов. Впрочем, китайский ИИ не устанавливает новый стандарт эффективности моделей, поскольку те соответствуют показателям уже существующих, но не превосходят их. Кроме того, нет доказательств, что добавление дополнительных вычислительных ресурсов и данных не имеет значения.

The Register прогнозирует, что продукты и технологии DeepSeek не вызовут резкого падения спроса на ИИ-инфраструктуру, поэтому инвесторам NVIDIA и строителям ЦОД, вероятно, можно не бояться того, что «пузырь» ИИ лопнет, как этого ожидают некоторые эксперты. Во всяком случае одни из крупнейших инвесторов в сектор ЦОД — Blackstone и Brookfield — заявили, что следят за успехами DeepSeek, но отказываться от инвестиций не собираются. Тем не менее, успех китайского стартапа напоминает о том, что «всегда можно сделать ещё лучше» и экстенсивное вливание денег и вычислительных ресурсов не всегда лучший вариант.

Постоянный URL: http://servernews.ru/1117625

01.02.2025 [15:23], Сергей Карасёв

Самый быстрый инференс DeepSeek R1 в мире: ИИ-платформа Cerebras снова поставила рекорд производительности

Американский стартап Cerebras Systems объявил о том, что его инференс-платформа позволила установить мировой рекорд производительности при использовании «рассуждающей» ИИ-модели DeepSeek R1 в модификации с 70 млрд параметров (DeepSeek-R1-Distill-Llama-70B).

DeepSeek R1 может содержать до 671 млрд параметров. Однако, как отмечает Cerebras, развёртывание модели со способностью к рассуждению столь большого масштаба представляет значительные проблемы. Версия с 70 млрд параметров позволяет совместить возможности рассуждений более крупной модели с MoE с широко поддерживаемой архитектурой Meta✴ Llama.

Источник изображений: Cerebras

Основой платформы Cerebras являются царь-ускорители собственной разработки WSE (Wafer Scale Engine). Производительность DeepSeek R1 при работе на инфраструктуре Cerebras достигает 1508 токенов в секунду — это значительно быстрее по сравнению с конкурирующими решениями. В частности, в случае Groq показатель составляет 252 токена в секунду.

Стандартный запрос на генерацию кода, который, как утверждает компания, занимает 22 секунды на конкурирующих платформах, в случае Cerebras завершается всего за 1,5 секунды, что соответствует 15-кратному повышению производительности. Cerebras подчёркивает, что DeepSeek-R1-Distill-Llama-70B превосходит как GPT-4o, так и o1-mini в сложных математических задачах и генерации кода.

Cerebras также отмечает, что все вычисления осуществляются на базе ИИ-инфраструктуры в США, развёрнутой в собственных дата-центрах компании. При этом никакие данные не сохраняются, что гарантирует полную безопасность для клиентов. Кроме того, модель DeepSeek R1 может быть развёрнута локально в ЦОД заказчика для обеспечения максимального контроля.

Постоянный URL: http://servernews.ru/1117588