Материалы по тегу: ии

14.11.2024 [14:30], Руслан Авдеев

AMD сократит 4 % штата и сосредоточится на ИИ и серверном рынке

Компания AMD подтвердила планы сокращения около 4 % штата по всему миру. The Register сообщает, что речь идёт об увольнении около 1 тыс. человек из приблизительно 26 тыс.

Новость появилась после публикации воодушевляющего финансового отчёта AMD за III квартал — чистая прибыль составила $771 млн при выручке $6,8 млрд. Рост год к году составил 158 % и 18 % соответственно. Несмотря на это, сотрудников решено уволить, чтобы уделить больше внимания ИИ-продуктам и рынку серверных решений. Недавняя серия увольнений Intel была значительно масштабнее, поскольку работу потеряли около 15 тыс. человек в самых разных подразделения.

Впрочем, у AMD не всё так замечательно, как могло бы быть. Выручка игрового подразделения год к году упала на 69 %. В самой компании объясняют это падением доходов от кастомных решений. Другими словами, упал спрос на чипсеты для PlayStation и Xbox. Это вполне ожидаемо — желающие купить консоли текущего поколения на базе аппаратных решений AMD в основном уже приобрели их и ждут нового поколения.

 Источник изображения: Campaign Creators/unsplash.com

Источник изображения: Campaign Creators/unsplash.com

Некоторые эксперты сравнивают подходы AMD и Intel с хирургической операцией и пропуском подразделений через измельчитель. В AMD подчёркивают, что новые меры — не показатель финансовой нестабильности компании. Речь идёт именно о смене фокуса на более маржинальные продукты в сферах ЦОД и ИИ. Ранее уже сообщалось, что Intel теряет позиции на рынке серверных чипов под натиском AMD, а уже в ноябре появилась информация, что компания отстала от AMD и NVIDIA по продажам ускорителей.

Представитель AMD заявил The Register, что, корректируя распределение ресурсов в соответствии с ключевыми возможностями роста, приходится принимать ряд целевых мер, которые, к сожалению для руководства, ведут к сокращению сотрудников. В компании обещают отнестись к ним «с уважением» и помочь по мере возможностей. Какие именно подразделения подвергнутся сокращениям, AMD уточнять не стала, сообщив, что принимает «целевые меры», касающиеся разных функций в компании.

Постоянный URL: http://servernews.ru/1114000
14.11.2024 [13:26], Руслан Авдеев

Сбербанку и Т-банку всё труднее найти площадки и питание для новых ИИ ЦОД

Представители «Сбера» и Т-банка жалуются на трудности поиска свободных площадок для постройки новых дата-центров, в том числе связанных с ИИ-проектами. Более того, банки сообщили, что им уже не хватает свободных мощностей, передают «Ведомости».

Если ранее проект «Сбера» по строительству ЦОД на 40 МВт считался крупным, то теперь объекты до 200 МВт даже не рассматриваются — по словам главы структуры Германа Грефа, оптимальным вариантом считаются проекты 300–400 МВт. В Т-банке также подтверждают сложность постройки ЦОД даже на 50 МВт из-за нехватки мощностей и высоких тарифов. В ВТБ тоже подтверждают, что поиск оптимальных объектов для размещения вычислительного оборудования представляет серьёзную проблему.

В «Сбере» отметили и высокую стоимость самого строительства — инвестиции в инфраструктуру для систем генеративного ИИ в мире в 2024 году уже составили $300 млрд, а годовой рынок ИИ ЦОД оценивается в десятки миллиардов долларов. При этом Греф подчеркнул, что речь идёт об инвестициях в будущее и траты неизбежны.

Вопрос о нехватке вычислительных мощностей для ИИ поднимался Сбербанком ещё в марте. Утверждается, что это одна из главных причин отставания российских ИИ-продуктов от решений OpenAI и Google. По словам Грефа, на тот момент российские решения отставали на 6–18 мес. При этом в конце сентября Греф заявил, что «Сбер» — владелец крупнейшего парка вычислительных мощностей в России и располагает 63 тыс. серверов в четырёх дата-центрах.

 Источник изображения: Joshua Olsen / Unsplash

Источник изображения: Joshua Olsen / Unsplash

Участники рынка и представители властей подтверждают нехватку энергии в некоторых регионах России, в том числе из-за роста энергопотребления IT-инфраструктурой. Замглавы администрации президента России Максим Орешкин уже объявил, что проблема дефицита электричества может стать актуальной в России в ближайшие 5–10 лет.

ЦОД по-прежнему сконцентрированы в Москве и Подмосковье, где уже сложно найти площадку для объекта более чем на 40 МВт. По данным iKS-Consulting в 2023 году на Москву и область приходилось 76 % всего рынка коммерческих ЦОД России, это 53,4 тыс. стойко-мест с максимальной подведённой мощностью 540 МВт. На Санкт-Петербург приходится 9,3 % рынка (7,3 тыс. стойко-мест), на прочие регионы — 14,8 % (9,6 тыс.). Если в 2023 году рынок ЦОД в регионах вырос на 8,5 %, то в 2024 году, вероятно, рост составит 27,1 %. В 2024 году коммерческие ЦОД в России получат 12 тыс. новых стойко-мест, ожидают в iKS-Consulting.

Постоянный URL: http://servernews.ru/1113988
14.11.2024 [08:17], Владимир Мироненко

SoftBank построит в Японии первый в мире ИИ-суперкомпьютер на базе NVIDIA DGX B200

NVIDIA объявила о серии совместных проектов с SoftBank, направленных на ускорение суверенных инициатив Японии в области ИИ, которые также обеспечат возможность получения дохода от ИИ для поставщиков телекоммуникационных услуг по всему миру.

В выступлении на саммите NVIDIA AI Summit Japan генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang) объявил, что SoftBank создаёт самый мощный в Японии ИИ-суперкомпьютер с использованием платформы NVIDIA DGX SuperPOD B200 и интерконнекта Quantum-2 InfiniBand. Эта система станет первой в мире, которая получит системы DGX B200. Она будет использоваться компанией для разработки генеративного ИИ и развития других бизнес-решений, а также для предоставления вычислительных услуг университетам, научно-исследовательским институтам и предприятиям в стране. Суперкомпьютер идеально подойдёт для разработки больших языковых моделей (LLM), говорится в пресс-релизе.

Пока что на звание самого мощного ИИ-суперкомьютера Японии претендует система ABCI 3.0 на базе NVIDIA H200. Впрочем, Softbank не сидит сложа руки и планирует построить ещё один суперкомпьютер, на этот раз на базе суперускорителей GB200 NVL72. Они же будут использоваться в проекте Sharp, KDDI и Supermicro по созданию «крупнейшего в Азии» ИИ ЦОД.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Также в ходе саммита было объявлено, что SoftBank, используя платформу ускоренных вычислений NVIDIA AI Aerial, успешно запустил первую в мире телекоммуникационную сеть, объединяющую возможности ИИ и 5G. В ходе испытаний, проведенных в префектуре Канагава, SoftBank продемонстрировала, что решение AI-RAN достигло производительности 5G операторского класса, используя ресурсы ускорителя для одновременной обработки сетевого трафика и инференса.

Отмечается, что мобильные сети традиционно рассчитаны на обработку пиковых нагрузок и в среднем задействуют только треть аппаратных ресурсов, что позволяет монетизировать оставшиеся две трети путём предоставления ИИ-сервисов. NVIDIA и SoftBank также сообщили, что с помощью ПО NVIDIA AI Enterprise японская компания будет создавать локализованные безопасные ИИ-сервисы.

Постоянный URL: http://servernews.ru/1113967
13.11.2024 [23:33], Руслан Авдеев

Дефицит энергии ограничит возможности 40 % ИИ ЦОД уже к 2027 году

ИИ вообще и генеративный ИИ в частности привели к стремительному росту энергопотребления ЦОД — по прогнозам агентства Gartner, в следующие два года рост составит 160 %. В результате ожидается, что 40 % существующих ИИ ЦОД будут ограничены в энергоресурсах к 2027 году. Как утверждают в агентстве, взрывной рост новых ИИ ЦОД гиперскейл-уровня обеспечивает постоянный рост спроса на электроэнергию, который совсем скоро превысит возможности поставщиков электричества.

Это грозит нехваткой энергии и перебоями в энергоснабжении, что ограничит рост новых ЦОД для систем генеративного ИИ и прочих целей с 2026 года. По оценкам Gartner, для обеспечения работы для ИИ серверов в 2027 году понадобится 500 ТВт∙ч, что в 2,6 раза больше, чем в 2023 году.

Дефицит энергии может затянуться, поскольку на создание новой инфраструктуры для генерации, распределения и доставки энергии уйдут годы, а уже назревшие проблемы никуда не денутся. В скором будущем число новых ЦОД и развитие систем генеративного ИИ будет определяться доступностью энергии. В Gartner рекомендуют организациям и компаниям оценить влияние риск дефицита энергии на их продукты и сервисы. Стоит не только принимать в расчёт рост стоимости электричества при планировании новых продуктов и сервисов, но и искать новые решения, требующие меньше энергии.

 Источник изображения: Gartner

Источник изображения: Gartner

Неизбежно связанное с дефицитом повышение цен на электричество увеличит стоимость эксплуатации больших языковых моделей (LLM). Хотя ключевые пользователи электроэнергии заранее работают над заключением долгосрочных контрактов, зачастую по фиксированным ставкам, стоимость энергии для питания дата-центров в любом случае значительно вырастет. Это скажется на стоимости ИИ как продукта и бизнесе соответствующих сервис-провайдеров.

Вероятно, цели по достижению экоустойчивости при этом пострадают. Ранее уже прогнозировалось, что операторы ЦОД не смогут добиться заявленных целей, теперь к сходным выводам приходят и в Gartner. В краткосрочной перспективе растущий спрос заставит поставщиков добывать энергию любыми доступными способами. В некоторых случаях это означает сохранение электростанций на ископаемом топливе, которые при других обстоятельствах закрылись бы в плановом порядке. В Gartner подчёркивают, что масштабирование ЦОД приведёт и к росту выбросов CO2 в краткосрочной перспективе.

 Источник изображения: Janusz Walczak/unsplash.com

Источник изображения: Janusz Walczak/unsplash.com

Дата-центрам требуется энергоснабжение в режиме 24/7, а такого не могут обеспечить классические ветряные и солнечные электростанции. Надёжно поставлять энергию в больших объёма могут только ГЭС, станции на ископаемом топливе и АЭС. В долгосрочной перспективе новые технологии энергохранилищ (вроде натрий-ионных аккумуляторов) или «чистая» энергия вроде малых модульных реакторов (SMR) позволит легче добиваться ESG-целей.

В Gartner рекомендуют пересмотреть цели достижения экоустойчивости, связанные с выбросами углекислого газа с учётом будущих требований ЦОД и доступности источников энергии в ближайшие годы. При разработке ИИ-приложений стоит сконцентрировать усилия на использовании минимальных вычислительных мощностей и оценивать другие возможности вроде широкого применение периферийных вычислений и т.н. малых языковых моделей (SLM), имеющих узкую специализацию.

Постоянный URL: http://servernews.ru/1113935
13.11.2024 [22:21], Руслан Авдеев

Поработайте за нас: AWS предоставит учёным кластеры из 40 тыс. ИИ-ускорителей Trainium

AWS намерена привлечь больше людей к разработке ИИ-приложений и фреймворков, использующих разработанные Amazon ускорители семейства Tranium. В рамках нового инициативы Build on Trainium с финансированием в объёме $110 млн академическим кругам будет предоставлен доступ к кластерам UltraClaster, включающим до 40 тыс. ускорителей, сообщает The Register.

В рамках программы Build on Trainium предполагается обеспечить доступ к кластеру представителям университетов, которые заняты разработкой новых ИИ-алгоритмов, которые позволяет повысить эффективность использования ускорителей и улучшить масштабирование вычислений в больших распределённых системах. На каком поколении чипов, Trainium1 или Trainium2, будут построены кластеры, не уточняется.

 Источник изображений: AWS

Источник изображений: AWS

Как поясняют в самом блоге AWS, исследователи могут придумать новую архитектуру ИИ-моделей или новую технологию оптимизации производительности, но у них может не оказаться доступа к HPC-ресурсам для крупных экспериментов. Не менее важно, что плоды трудов, как ожидается, будут распространяться по модели open source, поэтому от этого выиграет вся экосистема машинного обучения.

Впрочем, со стороны AWS альтруизма мало. Во-первых, $110 млн будут выданы выбранным проектам в виде облачных кредитов, такое происходит не впервые. Во-вторых, компания фактически пытается переложить часть своих задач на других людей. Кастомные чипы AWS, включая ИИ-ускорители для обучения и инференса, изначально разрабатывались для повышения эффективности выполнения внутренних задач компании. Однако низкоуровневые фреймворки и т.п. ПО не предназначены для того, чтобы с ними мог свободно работать широкий круг лиц как, например, происходит с NVIDIA CUDA.

Иными словам, AWS для популяризации Trainium необходимо более простое в освоение ПО, а ещё лучше готовые решения прикладных задач. Неслучайно Intel и AMD склонны предлагать разработчикам готовые оптимизированные под их ускорители фреймворки вроде PyTorch и TensorFlow, а не пытаться заставить их заниматься достаточно низкоуровневым программированием. AWS занимается тем же самым, предлагая продукты вроде SageMaker.

Во многом реализация проекта возможна благодаря новому интерфейсу Neuron Kernel Interface (NKI) для AWS Tranium и Inferentia, обеспечивающему прямой доступ к набору инструкций чипов и позволяющему исследователям строить оптимизированные вычислительные ядра для работы новых моделей, оптимизации производительности и инноваций в целом. Впрочем, учёным — в отличие от обычных разработчиков — часто интересно работать именно с низкоуровневыми системами.

Постоянный URL: http://servernews.ru/1113909
13.11.2024 [16:14], Владимир Мироненко

«Росатом» купит 50 % производителя телеком-оборудования ООО «Файбертрейд»

«Росатом» планирует приобрести 50 % производителя телеком-оборудования ООО «Файбертрейд» (бренд Future Technologies), сообщил РБК со ссылкой на информированные источники. По словам источника в госкорпорации, в рамках сделки оценка компании составила около 7 млрд руб. Сейчас сделка проходит согласование в Федеральной антимонопольной службе (ФАС).

Базирующаяся в Новосибирске «Файбертрейд» занимается разработкой и производством оптических трансиверов, систем уплотнения каналов и другого телекоммуникационного оборудования. Компания перестала публиковать финансовые результаты в 2022 году. До этого, в 2020 году её выручка составила 683 млн руб., сократившись в 2021 году на 20 %, до 549 млн руб.

Эксперты отмечают, что Future Technologies «не просто сборщик телеком-оборудования, эта компания интегрирована в цепочку — научный институт, разработчик прикладных технологий, тиражный производитель». Сделка позволит компании ускорить дальнейшее развитие.

 Источник изображения: Future Technologies

Источник изображения: Future Technologies

По словам источника РБК, сделка поможет «Росатому» развивать и частично закрыть потребность «в доверенных и соответствующих современным требованиям трансиверах и коммутаторах» для критической информационной инфраструктуры (КИИ), включая сети связи и информационный системы госорганов, энергетических, финансовых, транспортных и ряда других компаний. Владельцы КИИ обязаны до 2030 года полностью перейти на использование отечественного оборудования и ПО.

В конце прошлого «Росатом» приобрёл 50 % в Kraftway, на тот момент сумма сделки оценивалась в 3,5–5 млрд руб. Кроме того, дочернее предприятие госкорпорации ООО «Т-ком» занимается в России производством коммутаторов. Осенью этого года группа компаний Softline получила контроль над НТО «ИРЭ-Полюс», ещё одним значимым отечественным игроком в области ВОЛС. Согласно прогнозу NeoAnalytics, в ближайшей перспективе объём российского рынка телеком-оборудования будет в среднем расти на 2–3 % и к 2026 году приблизится к 2 трлн руб.

Постоянный URL: http://servernews.ru/1113938
13.11.2024 [10:20], Сергей Карасёв

МВД: вышедшие из строя серверы на «Эльбрусах» оперативно заменить невозможно

Министерство внутренних дел России (МВД), по сообщению газеты «Ведомости», столкнулось с серьёзными проблемами при замене вышедших из строя серверов на российских процессорах «Эльбрус», разработкой которых занимается АО «МЦСТ». Дело в том, что поставки этих чипов ограничены.

Как сообщил заместитель начальника департамента информационных технологий, связи и защиты информации МВД Игорь Кашпур, с 2020-го по 2024 год ведомство приобрело в общей сложности 709 серверов с процессорами «Эльбрус». В частности, в марте 2021-го МВД выделило 1,16 млрд руб. для закупки 298 систем. Позднее в том же году планировалось приобрести ещё 80 серверов на 350 млн руб. А в 2023-м ведомство получило 23 сервера на «Эльбрусах» общей стоимостью 86,3 млн руб.

Как отмечает Кашпур, серверы служат для поддержания работы сервисов автоматизации деятельности центров фиксации административных правонарушений в области дорожного движения в базе специального ПО «Паутина», а также единого информационного ресурса регистрационного иммиграционного учета. Проблема заключается в том, что эти машины демонстрируют невысокую отказоустойчивость. Причём у МВД фактически отсутствует возможность оперативной замены такого оборудования при выходе его из строя вследствие форс-мажорных обстоятельств, поскольку отгрузки новых серверов осуществляются исключительно в плановом порядке.

 Источник изображения: МЦСТ

Источник изображения: МЦСТ

В МЦСТ говорят, что имеющийся на сегодняшний день резерв чипов «Эльбрус» распределён, тогда как новые партии «временно не производятся». Вместе с тем директор по развитию компании Константин Трушкин сообщил, что возможности и мощности для производства требуемого оборудования у МЦСТ имеются. По его словам, решаются вопросы, связанные с возобновлением поставок.

Говорится также, что проблемы с серверами на чипах «Эльбрус» испытывают и другие организации, в число которых входят банки, операторы и госкорпорации. Участники рынка говорят, что трудности с выпуском процессоров у МЦСТ возникли в связи с санкциями. От выпуска «Эльбрусов» отказался тайваньский контрактный производитель TSMC, который ранее занимался выполнением соответствующих заказов. У МЦСТ были планы по переносу производства на завод «Микрон», но они так и не были реализованы. Сейчас компания находится под внешним управлением.

Постоянный URL: http://servernews.ru/1113902
12.11.2024 [18:25], Руслан Авдеев

Французская EDF готова запитать от АЭС три гигаваттных ИИ ЦОД

Французская государственная энергоснабжающая компания EDF (Électricité de France), которая является одним из крупнейших в мире производителей атомной энергии, обсуждает поставки электричества для трёх кампусов ЦОД во Франции мощностью 1 ГВт каждый. По данным Reuters, соответствующей информацией поделился представитель ED.

В октябре EDF запустила Project Giga для удовлетворения растущего спроса на энергию со стороны ИИ ЦОД. В рамках проекта планируется использовать землю и инфраструктуру EDF для поставок низкоуглеродной энергии гиперскейлерам вроде Microsoft и Google. В том же месяце выработка атомной энергии во Франции составляла 30,0 ТВт∙ч, на 1,7 ТВт∙ч больше год к году. С начала года ежегодные кумулятивные поставки составили 292,0 ТВт∙ч, на 30,7 ТВт∙ч больше в сравнении с 2023 годом, отмечает Datacenter Dynamics.

Несмотря на рост интереса к «мирному атому» на европейском рынке, активнее и радушнее всего атомную энергию принимают в США, это касается как обычных атомных электростанций, так и малых модульных реакторов (SMR). В сентябре Microsoft согласились заключить PPA на 20 лет с Constellation Energy для получения 100 % электричества с АЭС Three Mile Island в Пенсильвании. В марте AWS приобрела кампус ЦОД Talen Energy рядом АЭС Susquehanna, тоже в Пенсильвании — за $650 млн.

 Источник изображения: Jametlene Reskp / Unsplash

Источник изображения: Jametlene Reskp / Unsplash

В секторе SMR компания подписала три соглашения для содействия внедрению SMR для питания ЦОД. В том числе речь идёт о соглашениях с Energy Northwest и Dominion Energy, а также прямых инвестициях в разработчика SMR — X-energy. Не так давно Google анонсировала сделку на поставку 500 МВт с разработчиком SMR— Kairos Power. Компания рассчитывает, что первые из шести-семи реакторов в рамках соглашения заработают в 2030 году.

Постоянный URL: http://servernews.ru/1113869
12.11.2024 [12:00], Сергей Карасёв

«Рикор» представила российские мини-ПК для бизнеса на платформе Intel Alder Lake

Компания «Рикор» анонсировала компьютеры небольшого форм-фактора Rikor MSK и Rikor Pro для корпоративных клиентов. Устройства, как утверждается, стали первыми серийными мини-ПК, корпус которых полностью произведён в России: это сокращает время поставки, уменьшает стоимость, а также даёт дополнительную гибкость при заказе.

В основу новинок положена аппаратная платформа Intel Alder Lake, но позже появится модификация на платформе AMD. Сейчас доступен выбор из процессоров Core i3-12100 (4С/8Т; 3,3–4,3 ГГц; 60 Вт) и Core i5-12400 (6С/12Т; 2,5–4,4 ГГц; 65 Вт). Доступны два слота SO-DIMM для модулей DDR4-3200 суммарным объёмом до 64 Гбайт.

 Источник изображения: «Рикор»

Источник изображения: «Рикор»

Устройства заключены в корпус с габаритами 180 × 178 × 39 мм (объём около 1,25 л). Есть коннектор М.2 для SSD с интерфейсом PCIe 3.0 или SATA-3 и ещё один разъём М.2 для SSD SATA-3. Кроме того, может быть установлен SFF-накопитель SATA-3. В оснащение входят адаптеры Wi-Fi 6 и Bluetooth 5.2, сетевой контроллер 1GbE. Изображение может выводиться одновременно на несколько мониторов через интерфейсы D-Sub, HDMI 1.4b и DisplayPort 1.4. Доступны четыре порта USB 3.2 Gen1 Type-A, два порта USB 3.2 Gen1 Type-С и два порта USB 2.0 Type-A, гнездо RJ-45 для сетевого кабеля и набор аудиогнёзд на 3,5 мм. За питание отвечает внешний блок мощностью 90 Вт. Упомянут модуль ТРМ 2.0.

Ключевым преимуществом устройств «Рикор» называет максимальную локализацию производства. Инженеры компании разработали конструкцию объёмом немногим более 1 л, которая, как отмечается, не только не уступает зарубежным аналогам по ключевым характеристикам, но и превосходит их по прочности и лёгкости. Полный цикл производства внутри страны позволяет снизить стоимость устройств благодаря экономии на логистике и материалах, а также ускоряет поставки клиентам.

Постоянный URL: http://servernews.ru/1113842
11.11.2024 [19:03], Руслан Авдеев

Softbank животворящий: Graphcore активно нанимает персонал для разработки новых ИИ-решений

Через четыре месяца после покупки японским конгломератом SoftBank британский стартап Graphcore, разрабатывающий ИИ-ускорители, занялся наймом новых сотрудников. По данным EE Times, сейчас у компании открыто 75 позиций в сферах разработки и тестирования полупроводников, управления инфраструктурой ЦОД и ИИ-исследований. Всего год назад компания спешно искала финансирование и сокращала персонал.

Сейчас штат Graphcore насчитывает 375 человек, но компания намерена увеличить количество сотрудников на 20 % в Великобритании, Польше и на Тайване. Прочие офисы, включая подразделение в Китае, закрылись. По словам главы Graphcore Найджела Туна (Nigel Toon), компания представляет собой место, где эксперты по полупроводникам, ПО, ИИ и т.п. могут и полностью реализовать себя. Тем не менее, производственные планы бизнеса пока не раскрываются.

 Источник изображения: Graphcore

Источник изображения: Graphcore

На момент покупки Graphcore имела в своём портфолио три поколения чипов. Однако последнее поколение Bow IPU, выпущенное в 2022 году, по большому счёту являлось апгрейдом продукта второго поколения от 2020 года. Модель имела 892 Мбайт набортной SRAM, дополненной внешней DDR-памятью, а не HBM. Другими словами, теоретически продукт не слишком подходит для обучения больших языковых моделей (LLM). Впрочем, Cerebras тоже использует SRAM в составе своих суперчипов, но последняя дополнена массивами гибридной памяти MemoryX. А SambaNova в SN40L в итоге пришла к сочетанию SRAM, HBM и DDR.

Если Graphcore намерена создать новое поколение ИИ-ускорителей, то она, вероятно, пойдёт по пути SambaNova, считают в EE Times. На это косвенно указывает вакансия инженера ЦОД, для которой желателен опыт работы с жидкостным охлаждением. Также компании требуются специалисты для работы над облачными платформами и инфраструктурой ЦОД. Не исключено, что компания сменит бизнес-модель на манер Groq, продавая не ускорители, а доступ к ИИ-сервисам. Cerebras и SambaNova, например, уже успели по очереди похвастаться производительностью своих инференс-платформ.

В случае Graphcore смещение фокуса на инференс открывает возможности для освоения корпоративных и суверенных ИИ-решений, которых ещё не было, когда последние чипы компании вышли на рынок. Тем не менее, пока нет данных, готов ли SoftBank обеспечить Graphcore достаточными средствами для развития больших ЦОД.

Постоянный URL: http://servernews.ru/1113803