Материалы по тегу: ии

15.11.2024 [10:33], Сергей Карасёв

«Росэлектроника» создаст суперкомпьютер нового поколения для РАН

Холдинг «Росэлектроника», входящий в госкорпорацию «Ростех», анонсировал проект нового НРС-комплекса, который будет создан для Объединённого института высоких температур Российской академии наук (ОИВТ РАН). Особенностью суперкомпьютера станет применение российского интерконнекта «Ангара».

Система разрабатывается в рамках соглашения, заключенного между НИЦЭВТ (входит в «Росэлектронику») и ОИВТ РАН. При проектировании машины планируется использовать опыт разработки и производства суперкомпьютеров НИЦЭВТ предыдущих поколений — «Ангара-К1», Desmos и Fisher.

Отмечается, что коммуникационная сеть «Ангара», созданная специалистами НИЦЭВТ, предназначена для построения мощных суперкомпьютеров, вычислительных кластеров для обработки больших данных и расчётов на основе сверхмасштабируемых параллельных алгоритмов. Помимо «Ангары» в составе проектируемого HPC-комплекса будут задействованы технологии погружного охлаждения.

На сегодняшний день участники проекта прорабатывают технические характеристики создаваемого суперкомпьютера — количество узлов, объём памяти, архитектуру процессоров и число ядер. Особое внимание будет уделяться максимально возможному использованию отечественной элементной базы. Целевые показатели производительности системы не раскрываются, но говорится, по величине пикового быстродействия она превзойдёт предшественников.

 Источник изображения: unsplash.com / Scott Rodgerson

Источник изображения: unsplash.com / Scott Rodgerson

Суперкомпьютер планируется применять для проведения научно-исследовательских, опытно-конструкторских и технологических работ на базе образовательных учреждений и промышленных предприятий РФ.

«Стратегическое партнёрство с НИЦЭВТ позволит нам совместно создать высокопроизводительную вычислительную систему и расширить наши возможности в исследовании сложных процессов в энергетике и теплофизике. ОИВТ РАН обладает большим опытом использования передовых вычислительных методов, включая методы первопринципного моделирования и молекулярной динамики для научных исследований. Увеличение мощности вычислительных ресурсов позволит значительно повысить точность, темп и эффективность наших исследований», — отметил директор ОИВТ РАН.

Постоянный URL: http://servernews.ru/1114048
15.11.2024 [10:31], Сергей Карасёв

Eviden представила интерконнект BullSequana eXascale третьего поколения для ИИ-систем

Компания Eviden (дочерняя структура Atos) анонсировала BullSequana eXascale Interconnect (BXI v3) — интерконнект третьего поколения, специально разработанный для рабочих нагрузок ИИ и HPC. Технология станет доступа на рынке во II половине 2025 года.

Отмечается, что существующие высокоскоростные сетевые решения недостаточно эффективны, поскольку не устраняют критическое узкое место, известное как «сетевая стена». По заявлениям Eviden, зачастую при крупномасштабном обучении ИИ компании наращивают количество ускорителей, однако на самом деле ограничивающим фактором является интерконнект. Хотя поставщики сетевых решений продолжают удваивать пропускную способность каждые несколько лет, этого недостаточно для решения проблемы. В результате, до 70 % времени GPU простаивают, ожидая получения данных из-за задержек, утверждает Eviden. Технология BXI v3 призвана устранить этот недостаток.

 Источник изображений: Eviden

Источник изображений: Eviden

Новый интерконнект использует стандарт Ethernet в качестве базового протокола связи. При этом реализованы функции, которые обычно характерны для масштабируемых сетей высокого класса, таких как Infiniband. Отмечается, что BXI v3 обеспечивает низкие задержки (менее 200 нс от порта к порту), высокую пропускную способность, упорядоченную (in order) доставку пакетов, расширенное управление перегрузками и масштабируемость.

Технология BXI v3 ляжет в основу интеллектуального сетевого адаптера (Smart NIC) нового поколения, который поможет снизить влияние задержек сети на GPU и CPU. При использовании такого решения ускоритель ИИ выгружает данные на сетевой адаптер и сразу же переходит к другим задачам, что устраняет неэффективность, связанную с простоями. Подчёркивается, что протокол BXI v3 интегрируется непосредственно в Smart NIC, благодаря чему оборудование работает сразу после установки, а в приложения не требуется вносить какие-либо изменения.

Кроме того, новая технология предоставляет ряд дополнительных функций, ориентированных на повышение производительности путём оптимизации системных операций и обработки данных. В частности, BXI v3 обеспечивает прозрачную трансляцию виртуальных адресов в физические, что позволяет приложениям напрямую отправлять запросы в SmartNIC с использованием виртуальных адресов без необходимости системных вызовов. Такой подход повышает эффективность, обеспечивая бесперебойное управление памятью при сохранении высокой производительности.

Технология BXI v3 также позволяет регистрировать до 32 млн приёмных буферов, которые SmartNIC выбирает с помощью ключей сопоставления на основе атрибутов сообщения. Благодаря этому уменьшается нагрузка на CPU, что повышает общую эффективность системы. Кроме того, сетевой адаптер способен выполнять математические атомарные операции, что дополнительно высвобождает ресурсы CPU. Впрочем, деталей пока мало, зато говорится об участии в консорциуме Ultra Ethernet (UEC) и партнёрстве с AMD.

Постоянный URL: http://servernews.ru/1114044
15.11.2024 [10:10], Владимир Мироненко

ИСП РАН покажет результаты 30-ти лет работы на Открытой конференции в Москве

11–12 декабря в Москве состоится Открытая конференция ИСП РАН — ведущее научно-практическое мероприятие в области системного программирования в России. В этом году конференция посвящена 30-летию института и 300-летию Российской академии наук. Вместе с ними в числе организаторов — Академия криптографии РФ, Национальный технологический центр цифровой криптографии, Фонд перспективных исследований, а также международные ассоциации IEEE и IEEE Computer Society.

«За 30 лет наша модель работы, объединяющая образование, исследования и инновации, доказала свою устойчивость и способность обеспечивать долгосрочное развитие. Мы начинали с R&D-контрактов с международными компаниями. Сейчас все технологии, которые мы создаём, принадлежат нам или передаются в open source проекты, — рассказал директор ИСП РАН, академик РАН Арутюн Аветисян. — Институт стал распределённым центром компетенций, который собирает вокруг себя самые разные сообщества — от специалистов по анализу ядра Linux до разработчиков ERP-систем. Мы объединяем 800 сотрудников и 200 студентов. Более 200 компаний используют наши инструменты. Мы одновременно обеспечиваем технологическую независимость внутри страны и сохраняем открытость, работая над проектами с открытым кодом вместе с международным сообществом разработчиков. Эту идею открытости, особенно важную в эти дни, подчеркивает и наша конференция, которая в этом году объединит больше тысячи участников, а также десятки компаний и вузов».

 Источник изображений: ИСП РАН им. В.П. Иванникова

Источник изображений: ИСП РАН им. В.П. Иванникова

В этом году Открытая конференция ИСП РАН пройдёт на новой площадке — в инновационном кластере «Ломоносов», и начнётся с пленарной сессии с участием представителей академического сообщества, ведущих ИТ-компаний, отраслевых ассоциаций и государственных министерств и ведомств. Далее запланированы круглые столы по разработке безопасного программного обеспечения. Состоится воркшоп «Системы доверенного искусственного интеллекта», в котором примут участие представители Исследовательского центра доверенного искусственного интеллекта (ИЦДИИ) ИСП РАН, а также его индустриальных партнёров («Лаборатория Касперского», «ЕС-Лизинг», «Технопром», «Интерпроком») и других исследовательских центров.

Запланированы также традиционные секции рецензируемых научных докладов по анализу, моделированию и трансформации программ, управлению данными и информационным системам, САПР микроэлектронной аппаратуры, решению задач механики сплошных сред с использованием СПО, лингвистическим системам анализа. Круглый стол «Цифровая медицина» объединит представителей ведущих медицинских центров России — Сеченовского университета, НИИ глазных болезней им. М.М. Краснова и других. Уже во второй раз пройдёт секция «Российский Open Source: разработка библиотек в сфере ИИ», организованная совместно с Фондом содействия инновациям.

Ряд мероприятий состоится впервые: это секция «Системы управления базами данных» с участием разработчиков VK Tarantool, Yandex YDB и других платформ, круглый стол «Цифровое будущее государственного сектора: суверенитет, экономика, технологии» (совместно с РАНХиГС), а также круглый стол «Образование в системном программировании: состояние и перспективы» — с участием представителей ИСП РАН, МФТИ, НовГУ, МИРЭА, МИФИ, МГТУ им. Н.Э. Баумана и других организаций. Оба дня конференции будет проходить выставка технологий ИСП РАН (в том числе в области искусственного интеллекта), а также ведущих компаний и вузов – партнёров института.

Регистрация на очное участие заканчивается до 6 декабря 2024 г. Конференция пройдёт в гибридном формате, запланирована онлайн-трансляция каждой секции. Ссылка на трансляцию будет отправлена каждому участнику на адрес электронной почты, указанный при регистрации.

Участие в конференции бесплатное, необходимо зарегистрироваться на сайте: https://www.isprasopen.ru/#Registration. Все подробности можно найти на сайте мероприятия: https://www.isprasopen.ru. По вопросам аккредитации просьба обращаться к Анне Новомлинской, annanovoml@gmail.com.

Место проведения: МГУ им М.В. Ломоносова. Адрес: Москва, Раменский бульвар, д. 1. Кластер «Ломоносов».

Постоянный URL: http://servernews.ru/1113969
15.11.2024 [00:25], Владимир Мироненко

Оковы окон: российские госкомпании продолжают закупать продукты Microsoft

Российские госкомпании продолжали закупать в 2024 году ПО покинувшей рынок Microsoft, хотя и в меньших объёмах, пишет «Коммерсантъ». Согласно данным сервиса «Контур.Закупки», на приобретение продуктов Microsoft, включая закупки в малых объёмах, за 10 месяцев 2024 года госорганами (по 223-ФЗ и 44-ФЗ) было потрачено 24,1 млн руб., тогда как в 2023 году на эти цели израсходовали 52,5 млн руб.

Закупки ОС Windows госкомпаниями и госкорпорациями (по 223-ФЗ) за этот период составили 7 млн руб., что на 69 % меньше год к году, пакетов Office — 3 млн руб. (на 75 % меньше). В «Контур.Закупках» отметили, что госкомпании не готовы полностью отказаться от продукции Microsoft, поскольку некоторые программы не импортозамещены. Поэтому они закупают «остатки» Microsoft Office и Microsoft 365 версий 2019 и 2021. Количество таких закупок малого объёма увеличилось год к году почти в два раза, хотя сумма сократилась с 3,2 млн до 2,4 млн руб.

В свою очередь, электронная торговая площадка «Росэлторг» подсчитала, что по 223-ФЗ закупки ОС Windows сократились на 21 % в денежном выражении, до 35,5 млн руб., а количество тендеров уменьшилось на 5 %, до 55 единиц. По 44-ФЗ закупки уменьшились на 14 % до 22,7 млн руб. и на 12 % сократилось количество тендеров — до 99 единиц, передаёт «Коммерсантъ».

 Источник изображения: Surface / Unsplash

Источник изображения: Surface / Unsplash

Опрошенные «Коммерсантом» эксперты и представители отрасли предполагают, что Microsoft может не желать целиком терять рынок в РФ и снижает цены. Кроме того, даже в реестре отечественного ПО есть продукты, совместимые только Windows. В некоторых случаях на создание российских аналогов иностранных решений может уйти более 10 лет. Ещё один фактор — необходимость инвестиций, в том числе денежных, в переобучение сотрудников и развитие ПО.

Постоянный URL: http://servernews.ru/1114035
14.11.2024 [23:07], Владимир Мироненко

Google и NVIDIA показали первые результаты TPU v6 и B200 в ИИ-бенчмарке MLPerf Training

Ускорители Blackwell компании NVIDIA опередили в бенчмарках MLPerf Training 4.1 чипы H100 более чем в 2,2 раза, сообщил The Register. По словам NVIDIA, более высокая пропускная способность памяти в Blackwell также сыграла свою роль. Тесты были проведены с использование собственного суперкомпьютера NVIDIA Nyx на базе DGX B200.

Новые ускорители имеют примерно в 2,27 раза более высокую пиковую производительность в вычисления FP8, FP16, BF16 и TF32, чем системы H100 последнего поколения. B200 показал в 2,2 раза более высокую производительность при тюнинге модели Llama 2 70B и в два раза большую производительность при предварительном обучении (Pre-training) модели GPT-3 175B. Для рекомендательных систем и генерации изображений прирост составил 64 % и 62 % соответственно.

Компания также отметила преимущества используемой в B200 памяти HBM3e, благодаря которой бенчмарк GPT-3 успешно отработал всего на 64 ускорителях Blackwell без ущерба для производительности каждого GPU, тогда как для достижения такого же результата понадобилось бы 256 ускорителей H100. Впрочем, про Hopper компания тоже не забывает — в новом раунде компания смогла масштабировать тест GPT-3 175B до 11 616 ускорителей H100.

 Источник изображений: NVIDIA

Источник изображений: NVIDIA

Компания отметила, что платформа NVIDIA Blackwell обеспечивает значительный скачок производительности по сравнению с платформой Hopper, особенно при работе с LLM. В то же время чипы поколения Hopper по-прежнему остаются актуальными благодаря непрерывным оптимизациям ПО, порой кратно повышающим производительность в некоторых задач. Интрига в том, что в этот раз NVIDIA решила не показывать результаты GB200, хотя такие системы есть и у неё, и у партнёров.

 Источник изображений: NVIDIA

В свою очередь, Google представила первые результаты тестирования 6-го поколения TPU под названием Trillium, о доступности которого было объявлено в прошлом месяце, и второй раунд результатов ускорителей 5-го поколения TPU v5p. Ранее Google тестировала только TPU v5e. По сравнению с последним вариантом, Trillium обеспечивает прирост производительности в 3,8 раза в задаче обучения GPT-3, отмечает IEEE Spectrum.

Если же сравнивать результаты с показателями NVIDIA, то всё выглядит не так оптимистично. Система из 6144 TPU v5p достигла контрольной точки обучения GPT-3 за 11,77 мин, отстав от системы с 11 616 H100, которая выполнила задачу примерно за 3,44 мин. При одинаковом же количестве ускорителей решения Google почти вдвое отстают от решений NVIDIA, а разница между v5p и v6e составляет менее 10 %.

 Источник изображения: Google

Источник изображения: Google

В тесте Stable Diffusion система из 1024 TPU v5p заняла второе место, завершив работу за 2,44 мин, тогда как система того же размера на основе NVIDIA H100 справилась с задачей за 1,37 мин. В остальных тестах на кластерах меньшего масштаба разрыв остаётся примерно полуторакратным. Впрочем, Google упирает на масштабируемость и лучшее соотношение цены и производительности в сравнении как с решениями конкурентов, так и с собственными ускорителями прошлых поколений.

Также в новом раунде MLPerf появился единственный результат измерения энергопотребления во время проведения бенчмарка. Система из восьми серверов Dell XE9680, каждый из которых включал восемь ускорителей NVIDIA H100 и два процессора Intel Xeon Platinum 8480+ (Sapphire Rapids), в задаче тюнинга Llama2 70B потребила 16,38 мДж энергии, потратив на работу 5,05 мин. — средняя мощность составила 54,07 кВт.

Постоянный URL: http://servernews.ru/1114029
14.11.2024 [18:28], Руслан Авдеев

АЭС от ВМС: OpenAI подготовила для правительства США детальные рекомендации по масштабному развитию ИИ-отрасли

Компания OpenAI приготовила пакет рекомендаций американским властям, в котором изложила меры, необходимые, как она считает, для развития ИИ-сектора. По данным CNBC, план ИИ-инфраструктуры США касается экономики ИИ, использования опыта ВМС США в сфере атомной энергетики, а также правительственных проектов, финансируемых частными инвесторами. Говорится и о необходимости создания североамериканского ИИ-альянса, к которому в перспективе могут присоединиться, например, страны Персидского залива.

Критически важным считается принятия «Закона о национальных магистральных ЛЭП» (National Transmission Highway Act), который называется столь же амбициозным, как и «Закон о национальных межштатных и оборонных магистралях» (National Interstate and Defense Highways Act) 1956 года. В сентябре уже сообщалось, что топ-менеджеры OpenAI, включая гендиректора Сэма Альтмана (Sam Altman), провели ряд встреч с потенциальными инвесторами с целью заручиться поддержкой в создании многомиллиардной IT-инфраструктуры, необходимой для ускоренного развития ИИ.

В документе OpenAI предсказывает ИИ блестящее будущее, называя искусственный интеллект «основополагающей» технологией, какой стало электричество, и обещающей такие же распределённый доступ и выгоды. Предполагается, что инвестиции в ИИ помогут создать десятки тысяч рабочих мест, приведут к росту ВВП, модернизации энергетической инфраструктуры, включая атомную энергетику и созданию новых заводов по выпуску чипов — а также миллиардным инвестициям из зарубежных фондов.

 Источник изображения: Lukáš Lehotský/unsplash.com

Источник изображения: Lukáš Lehotský/unsplash.com

OpenAI недвусмысленно выразила готовность сотрудничать с администрацией будущего президента США Дональда Трампа (Donald Trump). По имеющимся данным, Трамп намерен отменить указ действующего президента США Джо Байдена (Joe Biden), в котором упоминаются необходимость оценки безопасности технологий, защита прав сотрудников отрасли, защита принципов равенства, защита прав потребителей и др. Трамп заявлял, что указ препятствует инновациям в сфере ИИ.

В презентации компании упоминается о необходимости создания экономических ИИ-зон совместно с властями штатов и федеральным правительством, что должно упростить выдачу разрешений на создание ИИ-инфраструктуры. Компания намерена строить новые солнечные и ветряные электростанции, а также добиться разрешения на эксплуатацию неиспользуемых реакторов. Предполагается, что штаты, предоставляющие поддержку ИИ-бизнесу, смогут требовать выделения части вычислительных мощностей государственным университетам для проведения собственных исследований.

 Источник изображения: Marcus/unsplash.com

Источник изображения: Marcus/unsplash.com

«Закон о национальных магистральных ЛЭП» должен расширить возможности электроснабжения, развить ВОЛС и обеспечить строительство газопроводов. В компании запрашивают новые полномочия для упрощения бюрократических процедур. Заявляется, что правительство может поощрять частные инвестиции в дорогостоящие проекты энергетической инфраструктуры и взять на себя ряд обязательств, в т.ч. по покупке энергии, чтобы снизить риски инвесторов. Также предлагается использовать опыт ВМС, уже эксплуатирующих около 100 малых модульных реакторов (SMR), питающих в основном подводные лодки — это поможет состязаться с Китаем, активно строящим новые АЭС.

В США основными регионами для инвестиций в ИИ называются Средний Запад и Юго-Запад, пока они остаются «за бортом», несмотря на то что там есть земля и возможность строительства ветряных и солнечных электростанций и, возможно, ядерных объектов. Тем более, что в штатах вроде Канзаса или Айовы могут потребоваться собственные специализированные ИИ-модели для обработки сельскохозяйственных данных.

По оценкам одного из представителей OpenAI, к 2030 году США понадобится 50 ГВт энергии для удовлетворения потребностей ИИ-отрасли и конкуренции с КНР, особенно с учётом того, что Китай за последние два года одобрил строительство 20 ядерных реакторов и ещё 11 на следующий год. Не так давно уже сообщалось об инициативе главы OpenAI Сэма Альтмана (Sam Altman), предлагавшего правительству США строительство сети 5-ГВт ЦОД. Позже данные получили подтверждение.

Постоянный URL: http://servernews.ru/1114006
14.11.2024 [17:06], Руслан Авдеев

Европейские компании ищут низкоуглеродные альтернативы дизель-генераторам для ЦОД

Консорциум Net Zero Innovation Hub for Data Centers ) инициировал т. н. запрос информации (RFI). Как сообщает сайт NZIH, речь идёт о первом запросе такого рода в Европе, направленном на поиск инновационных решений, способных заменить дизельные резервные генераторы.

RFI представляет собой официальный запрос, направляемый компаниям и организациям с целью сбора информации о передовых технологиях и подходах, имеющихся в их распоряжении, которые могут использоваться для решения конкретной проблемы, в данном случае — замены источников резервного питания на безуглеродные.

В консорциум входят такие известные компании, как Danfoss, Data4, Google, Microsoft, Schneider Electric и Vertiv. В NZIH объявили, что ищут решения, которые можно масштабировать до гигаваттного уровня. Инициатива, как ожидается, должна ускорить внедрение решений для резервного питания с нулевым выбросом.

В I квартале 2025 года будет проведена оценка жизнеспособности предложенных решений с технической, экономической, регуляторной и других точек зрения, а во II квартале 2025 года начнётся поиск источников финансирования, после чего, возможно, будут заключены соглашения о внедрении между владельцами инновационных технологий и участниками NIZH.

 Источник изображения: NZIH

Источник изображения: NZIH

Речь идёт о возможностях для широкого круга компаний, в том числе тех, чьи решения находятся на раннем этапе коммерциализации. Инициативу планируется реализовать в три этапа. Предполагается:

  • согласовать и стандартизировать требования с учётом специфика отрасли ЦОД;
  • определить инновационные решения, масштабируемые и поддерживаемые цепочкой поставок, потенциально готовые к внедрению в гигаваттных масштабах;
  • реализовать первичные пилотные проекты с привлечением государственных и частных инвестиций.

Как сообщается на сайте консорциума, внедрение передовых «чистых» технологий часто сталкиваются с препятствиями, во многом из-за новизны и высоких рисков на ранних стадиях. Выступая «агрегатором» спроса на такие технологии и создавая новые коммерческие структуры при поддержки крупнейших заказчиков, NIZH со своей инициативой пытается снизить риск для инновационных проектов, разработчиков, энергетических компаний, обеспечивая при этом возможность получения инвестиций.

Инновационный аспект решений может быть представлен разработчиками — речь может идти о технологии, бизнес-модели или других аспектах или их комбинации. Первое предложение уже сделал один из ключевых участников консорциума — Microsoft продвигает водородную энергетику. Так, компания при поддержке ESB на время запитает свой дублинский ЦОД от водородных топливных ячеек GeoPura.

Постоянный URL: http://servernews.ru/1113980
14.11.2024 [14:30], Руслан Авдеев

AMD сократит 4 % штата и сосредоточится на ИИ и серверном рынке

Компания AMD подтвердила планы сокращения около 4 % штата по всему миру. The Register сообщает, что речь идёт об увольнении около 1 тыс. человек из приблизительно 26 тыс.

Новость появилась после публикации воодушевляющего финансового отчёта AMD за III квартал — чистая прибыль составила $771 млн при выручке $6,8 млрд. Рост год к году составил 158 % и 18 % соответственно. Несмотря на это, сотрудников решено уволить, чтобы уделить больше внимания ИИ-продуктам и рынку серверных решений. Недавняя серия увольнений Intel была значительно масштабнее, поскольку работу потеряли около 15 тыс. человек в самых разных подразделения.

Впрочем, у AMD не всё так замечательно, как могло бы быть. Выручка игрового подразделения год к году упала на 69 %. В самой компании объясняют это падением доходов от кастомных решений. Другими словами, упал спрос на чипсеты для PlayStation и Xbox. Это вполне ожидаемо — желающие купить консоли текущего поколения на базе аппаратных решений AMD в основном уже приобрели их и ждут нового поколения.

 Источник изображения: Campaign Creators/unsplash.com

Источник изображения: Campaign Creators/unsplash.com

Некоторые эксперты сравнивают подходы AMD и Intel с хирургической операцией и пропуском подразделений через измельчитель. В AMD подчёркивают, что новые меры — не показатель финансовой нестабильности компании. Речь идёт именно о смене фокуса на более маржинальные продукты в сферах ЦОД и ИИ. Ранее уже сообщалось, что Intel теряет позиции на рынке серверных чипов под натиском AMD, а уже в ноябре появилась информация, что компания отстала от AMD и NVIDIA по продажам ускорителей.

Представитель AMD заявил The Register, что, корректируя распределение ресурсов в соответствии с ключевыми возможностями роста, приходится принимать ряд целевых мер, которые, к сожалению для руководства, ведут к сокращению сотрудников. В компании обещают отнестись к ним «с уважением» и помочь по мере возможностей. Какие именно подразделения подвергнутся сокращениям, AMD уточнять не стала, сообщив, что принимает «целевые меры», касающиеся разных функций в компании.

Постоянный URL: http://servernews.ru/1114000
14.11.2024 [13:26], Руслан Авдеев

Сбербанку и Т-банку всё труднее найти площадки и питание для новых ИИ ЦОД

Представители «Сбера» и Т-банка жалуются на трудности поиска свободных площадок для постройки новых дата-центров, в том числе связанных с ИИ-проектами. Более того, банки сообщили, что им уже не хватает свободных мощностей, передают «Ведомости».

Если ранее проект «Сбера» по строительству ЦОД на 40 МВт считался крупным, то теперь объекты до 200 МВт даже не рассматриваются — по словам главы структуры Германа Грефа, оптимальным вариантом считаются проекты 300–400 МВт. В Т-банке также подтверждают сложность постройки ЦОД даже на 50 МВт из-за нехватки мощностей и высоких тарифов. В ВТБ тоже подтверждают, что поиск оптимальных объектов для размещения вычислительного оборудования представляет серьёзную проблему.

В «Сбере» отметили и высокую стоимость самого строительства — инвестиции в инфраструктуру для систем генеративного ИИ в мире в 2024 году уже составили $300 млрд, а годовой рынок ИИ ЦОД оценивается в десятки миллиардов долларов. При этом Греф подчеркнул, что речь идёт об инвестициях в будущее и траты неизбежны.

Вопрос о нехватке вычислительных мощностей для ИИ поднимался Сбербанком ещё в марте. Утверждается, что это одна из главных причин отставания российских ИИ-продуктов от решений OpenAI и Google. По словам Грефа, на тот момент российские решения отставали на 6–18 мес. При этом в конце сентября Греф заявил, что «Сбер» — владелец крупнейшего парка вычислительных мощностей в России и располагает 63 тыс. серверов в четырёх дата-центрах.

 Источник изображения: Joshua Olsen / Unsplash

Источник изображения: Joshua Olsen / Unsplash

Участники рынка и представители властей подтверждают нехватку энергии в некоторых регионах России, в том числе из-за роста энергопотребления IT-инфраструктурой. Замглавы администрации президента России Максим Орешкин уже объявил, что проблема дефицита электричества может стать актуальной в России в ближайшие 5–10 лет.

ЦОД по-прежнему сконцентрированы в Москве и Подмосковье, где уже сложно найти площадку для объекта более чем на 40 МВт. По данным iKS-Consulting в 2023 году на Москву и область приходилось 76 % всего рынка коммерческих ЦОД России, это 53,4 тыс. стойко-мест с максимальной подведённой мощностью 540 МВт. На Санкт-Петербург приходится 9,3 % рынка (7,3 тыс. стойко-мест), на прочие регионы — 14,8 % (9,6 тыс.). Если в 2023 году рынок ЦОД в регионах вырос на 8,5 %, то в 2024 году, вероятно, рост составит 27,1 %. В 2024 году коммерческие ЦОД в России получат 12 тыс. новых стойко-мест, ожидают в iKS-Consulting.

Постоянный URL: http://servernews.ru/1113988
14.11.2024 [08:17], Владимир Мироненко

SoftBank построит в Японии первый в мире ИИ-суперкомпьютер на базе NVIDIA DGX B200

NVIDIA объявила о серии совместных проектов с SoftBank, направленных на ускорение суверенных инициатив Японии в области ИИ, которые также обеспечат возможность получения дохода от ИИ для поставщиков телекоммуникационных услуг по всему миру.

В выступлении на саммите NVIDIA AI Summit Japan генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang) объявил, что SoftBank создаёт самый мощный в Японии ИИ-суперкомпьютер с использованием платформы NVIDIA DGX SuperPOD B200 и интерконнекта Quantum-2 InfiniBand. Эта система станет первой в мире, которая получит системы DGX B200. Она будет использоваться компанией для разработки генеративного ИИ и развития других бизнес-решений, а также для предоставления вычислительных услуг университетам, научно-исследовательским институтам и предприятиям в стране. Суперкомпьютер идеально подойдёт для разработки больших языковых моделей (LLM), говорится в пресс-релизе.

Пока что на звание самого мощного ИИ-суперкомьютера Японии претендует система ABCI 3.0 на базе NVIDIA H200. Впрочем, Softbank не сидит сложа руки и планирует построить ещё один суперкомпьютер, на этот раз на базе суперускорителей GB200 NVL72. Они же будут использоваться в проекте Sharp, KDDI и Supermicro по созданию «крупнейшего в Азии» ИИ ЦОД.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Также в ходе саммита было объявлено, что SoftBank, используя платформу ускоренных вычислений NVIDIA AI Aerial, успешно запустил первую в мире телекоммуникационную сеть, объединяющую возможности ИИ и 5G. В ходе испытаний, проведенных в префектуре Канагава, SoftBank продемонстрировала, что решение AI-RAN достигло производительности 5G операторского класса, используя ресурсы ускорителя для одновременной обработки сетевого трафика и инференса.

Отмечается, что мобильные сети традиционно рассчитаны на обработку пиковых нагрузок и в среднем задействуют только треть аппаратных ресурсов, что позволяет монетизировать оставшиеся две трети путём предоставления ИИ-сервисов. NVIDIA и SoftBank также сообщили, что с помощью ПО NVIDIA AI Enterprise японская компания будет создавать локализованные безопасные ИИ-сервисы.

Постоянный URL: http://servernews.ru/1113967
Система Orphus