Материалы по тегу: а
15.11.2024 [17:47], Владимир Мироненко
FTC собралась расследовать жалобы на антиконкурентную практику в облачном бизнесе MicrosoftФедеральная торговая комиссия США (FTC) готовится начать расследование заявлений по поводу использования Microsoft антиконкурентных практик в своём облачном бизнесе, сообщила Financial Times со ссылкой на информированные источники. По их словам, FTC пока не запросила документы или другую информацию у Microsoft. Это говорит о том, что расследование находится на ранней стадии и нет никаких гарантий, что оно будет продолжено. Как утверждают источники, сейчас FTC изучает обвинения Microsoft в злоупотреблении своей рыночной властью — компания якобы навязывает карательные условия лицензирования, чтобы помешать клиентам переносить свои данные из Azure на другие платформы. В частности, чтобы усложнить переход на другую платформу, Microsoft существенно увеличивает абонентскую плату для тех, кто покидает Azure, вводит высокие сборы за выход и якобы делает продукты Office 365 несовместимыми с облаками конкурентов. На этот шаг регулятора подтолкнуло письмо Google с обвинением Microsoft в антиконкурентной практике, направленное в комиссию в июне 2023 года. В письме утверждается, что Microsoft использует ограничения по лицензированию ПО, чтобы заставить клиентов использовать облачные сервисы Azure для экономии денег. ![]() Google также заявила, что Microsoft использует доминирующее положение Windows Server и Office, чтобы оказывать давление на клиентов, заставляя их пользоваться Azure, и использует «сложную сеть» лицензионных ограничений, которые призваны помешать компаниям диверсифицировать поставщиков корпоративного ПО. Также было отмечено, что Microsoft взимает плату со сторонних поставщиков облачной инфраструктуры, таких как Google Cloud и Amazon Web Services, за запуск её ПО, такого как Windows Server и Office, на их платформах. В конечном итоге расходы перекладываются на клиентов. При этом дополнительная плата за запуск ПО Microsoft в облаке Azure не взимается. Аналитик Хольгер Мюллер (Holger Mueller) из Constellation Research сообщил в прошлом году, что поставщики ПО ужесточают условия лицензирования, чтобы ограничить своих конкурентов. «Основная уловка заключается в том, что они либо ограничивают сервисы, не позволяя им работать в других облаках, либо взимают большую плату за такую возможность», — сказал Мюллер. Microsoft удалось избежать официального расследования деятельности своего облачного подразделения со стороны Еврокомиссии с помощью сделки с CISPE. При этом Google пыталась с помощью денежного вознаграждения убедить облачные компании не прекращать жаловаться на Microsoft в ЕС. В итоге Google подала в Еврокомиссию новую жалобу на Microsoft и сформировала новую коалицию Open Cloud Coalition. Аналогичные разбирательства ведутся и в Великобритании.
15.11.2024 [13:50], Руслан Авдеев
Операторы ЦОД выстроились в очередь, чтобы получить 750 МВт от SMR компании OkloПоддерживаемый Сэмом Альтманом (Sam Altman) стартап Oklo сообщил о получении запросов на поставку 750 МВт для ЦОД в США. Потенциальные клиенты не называются, но известно, что общая мощность планируемых к строительству реакторов Oklo в результате должна вырасти до 2,1 ГВт. Как сообщает The Register, разработки Oklo, вероятно, основаны на экспериментальной модели Experimental Breeder Reactor II (EBR-II) и используют жидкостно-металлическое охлаждение. Такие реакторы способны генерировать 15–50 МВт энергии, в зависимости от конфигурации. Это означает, что неназванные клиенты Oklo в общей сложности намерены использовать 15–50 реакторов для удовлетворения их запросов. Впрочем, до получения реальных поставок пока далеко. На сайте Oklo сообщается, что до конца десятилетия должна заработать только первая электростанция. До этого компания должна получить разрешение у Комиссии по ядерному регулированию США, необходимые заявки уже поданы. В 2022 году регулятор уже отклонил план строительства SMR компанией, сославшись на «значительные информационные пробелы», связанные с мерами, принимаемыми для обеспечения безопасности. Позже Oklo получила поддержку правительственных ведомств. Министерство энергетики выдало разрешение на использование площадки, а Национальная лаборатория Айдахо (где находится EBR-II) выделила топливо для поддержки проекта. При этом Oklo может избежать проблем, с которыми сталкиваются другие «атомные» стартапы вроде Terrapower. Реакторы Oklo предназначены для уже отработанного ядерного топлива от обычных реакторов. Фактически стартап сейчас сотрудничает с лабораториями Министерства энергетики для разработки новых технологий утилизации отработанного топлива. Oklo рассчитывает представить план переработки коммерческого уровня к началу 2030-х годов. Ранее сообщалось, что Okla ищет главу ЦОД-направления. В прошлом месяце Amazon (AWS) объявила о поддержке трёх новых атомных проектов, включая строительство нескольких SMR компанией X-energy. Amazon является одним из её крупнейших инвесторов в ходе раунда финансирования серии C на $500 млн. Oracle также анонсировала получение разрешений на строительство трёх SMR для питания ИИ ЦОД ёмкостью более 1 ГВТ. Тем временем Google заключила соглашение с Kairos Power для удовлетворения собственных энергетических потребностей. Несмотря на весь ажиотаж, связанный с SMR, технология всё ещё не доказала своей экономической целесообразности, хотя идея построения небольших и мощных источников энергии буквально в любом месте слишком хороша, чтобы ЦОД отказались от неё. В любом случае SMR будут нет так уж доступны. Эксперты утверждают, что SMR «слишком дороги, медленно строятся и слишком рискованны для того, чтобы играть значимую роль в отказе от ископаемого топлива». NuScale, одной из первых получившая одобрения собственного проекта SMR, уже, возможно, пожалела об этом. Стартап планировал построить шесть реакторов на 462 МВт в Юте, но высокие цены оттолкнули потребителей и проект в конечном счёте просто забросили. Даже участие в проектах с обычными АЭС не гарантирует успех. AWS в этом году приобрела за $650 млн кампус ЦОД Cumulus Data около АЭС Susquehanna в Пенсильвании и планировала построить там 15 ЦОД. Тем не менее к ноябрю регулятор отказал в увеличении подачи энергии на площадку, хотя компания не намерена отказываться от проекта. Бывает и хуже. Meta✴ рассчитывала построить «атомные ЦОД», но на необходимой ей площадке обнаружился редкий вид пчёл, поэтому от проекта пришлось отказаться.
15.11.2024 [10:33], Сергей Карасёв
«Росэлектроника» создаст суперкомпьютер нового поколения для РАН
hardware
hpc
ангара
импортозамещение
ницэвт
погружное охлаждение
россия
росэлектроника
сделано в россии
сжо
суперкомпьютер
Холдинг «Росэлектроника», входящий в госкорпорацию «Ростех», анонсировал проект нового НРС-комплекса, который будет создан для Объединённого института высоких температур Российской академии наук (ОИВТ РАН). Особенностью суперкомпьютера станет применение российского интерконнекта «Ангара». Система разрабатывается в рамках соглашения, заключенного между НИЦЭВТ (входит в «Росэлектронику») и ОИВТ РАН. При проектировании машины планируется использовать опыт разработки и производства суперкомпьютеров НИЦЭВТ предыдущих поколений — «Ангара-К1», Desmos и Fisher. Отмечается, что коммуникационная сеть «Ангара», созданная специалистами НИЦЭВТ, предназначена для построения мощных суперкомпьютеров, вычислительных кластеров для обработки больших данных и расчётов на основе сверхмасштабируемых параллельных алгоритмов. Помимо «Ангары», в составе проектируемого HPC-комплекса будут задействованы технологии погружного охлаждения. На сегодняшний день участники проекта прорабатывают технические характеристики создаваемого суперкомпьютера — количество узлов, объём памяти, архитектуру процессоров и число ядер. Особое внимание будет уделяться максимально возможному использованию отечественной элементной базы. Целевые показатели производительности системы не раскрываются, но говорится, по величине пикового быстродействия она превзойдёт предшественников. ![]() Источник изображения: unsplash.com / Scott Rodgerson Суперкомпьютер планируется применять для проведения научно-исследовательских, опытно-конструкторских и технологических работ на базе образовательных учреждений и промышленных предприятий РФ. «Стратегическое партнёрство с НИЦЭВТ позволит нам совместно создать высокопроизводительную вычислительную систему и расширить наши возможности в исследовании сложных процессов в энергетике и теплофизике. ОИВТ РАН обладает большим опытом использования передовых вычислительных методов, включая методы первопринципного моделирования и молекулярной динамики для научных исследований. Увеличение мощности вычислительных ресурсов позволит значительно повысить точность, темп и эффективность наших исследований», — отметил директор ОИВТ РАН.
15.11.2024 [10:10], Владимир Мироненко
ИСП РАН покажет результаты 30-ти лет работы на Открытой конференции в Москве11–12 декабря в Москве состоится Открытая конференция ИСП РАН — ведущее научно-практическое мероприятие в области системного программирования в России. В этом году конференция посвящена 30-летию института и 300-летию Российской академии наук. Вместе с ними в числе организаторов — Академия криптографии РФ, Национальный технологический центр цифровой криптографии, Фонд перспективных исследований, а также международные ассоциации IEEE и IEEE Computer Society. «За 30 лет наша модель работы, объединяющая образование, исследования и инновации, доказала свою устойчивость и способность обеспечивать долгосрочное развитие. Мы начинали с R&D-контрактов с международными компаниями. Сейчас все технологии, которые мы создаём, принадлежат нам или передаются в open source проекты, — рассказал директор ИСП РАН, академик РАН Арутюн Аветисян. — Институт стал распределённым центром компетенций, который собирает вокруг себя самые разные сообщества — от специалистов по анализу ядра Linux до разработчиков ERP-систем. Мы объединяем 800 сотрудников и 200 студентов. Более 200 компаний используют наши инструменты. Мы одновременно обеспечиваем технологическую независимость внутри страны и сохраняем открытость, работая над проектами с открытым кодом вместе с международным сообществом разработчиков. Эту идею открытости, особенно важную в эти дни, подчеркивает и наша конференция, которая в этом году объединит больше тысячи участников, а также десятки компаний и вузов». В этом году Открытая конференция ИСП РАН пройдёт на новой площадке — в инновационном кластере «Ломоносов», и начнётся с пленарной сессии с участием представителей академического сообщества, ведущих ИТ-компаний, отраслевых ассоциаций и государственных министерств и ведомств. Далее запланированы круглые столы по разработке безопасного программного обеспечения. Состоится воркшоп «Системы доверенного искусственного интеллекта», в котором примут участие представители Исследовательского центра доверенного искусственного интеллекта (ИЦДИИ) ИСП РАН, а также его индустриальных партнёров («Лаборатория Касперского», «ЕС-Лизинг», «Технопром», «Интерпроком») и других исследовательских центров. Запланированы также традиционные секции рецензируемых научных докладов по анализу, моделированию и трансформации программ, управлению данными и информационным системам, САПР микроэлектронной аппаратуры, решению задач механики сплошных сред с использованием СПО, лингвистическим системам анализа. Круглый стол «Цифровая медицина» объединит представителей ведущих медицинских центров России — Сеченовского университета, НИИ глазных болезней им. М.М. Краснова и других. Уже во второй раз пройдёт секция «Российский Open Source: разработка библиотек в сфере ИИ», организованная совместно с Фондом содействия инновациям. Ряд мероприятий состоится впервые: это секция «Системы управления базами данных» с участием разработчиков VK Tarantool, Yandex YDB и других платформ, круглый стол «Цифровое будущее государственного сектора: суверенитет, экономика, технологии» (совместно с РАНХиГС), а также круглый стол «Образование в системном программировании: состояние и перспективы» — с участием представителей ИСП РАН, МФТИ, НовГУ, МИРЭА, МИФИ, МГТУ им. Н.Э. Баумана и других организаций. Оба дня конференции будет проходить выставка технологий ИСП РАН (в том числе в области искусственного интеллекта), а также ведущих компаний и вузов – партнёров института. Регистрация на очное участие заканчивается до 6 декабря 2024 г. Конференция пройдёт в гибридном формате, запланирована онлайн-трансляция каждой секции. Ссылка на трансляцию будет отправлена каждому участнику на адрес электронной почты, указанный при регистрации. Участие в конференции бесплатное, необходимо зарегистрироваться на сайте: https://www.isprasopen.ru/#Registration. Все подробности можно найти на сайте мероприятия: https://www.isprasopen.ru. По вопросам аккредитации просьба обращаться к Анне Новомлинской, annanovoml@gmail.com. Место проведения: МГУ им М.В. Ломоносова. Адрес: Москва, Раменский бульвар, д. 1. Кластер «Ломоносов».
14.11.2024 [18:28], Руслан Авдеев
АЭС от ВМС: OpenAI подготовила для правительства США детальные рекомендации по масштабному развитию ИИ-отраслиКомпания OpenAI приготовила пакет рекомендаций американским властям, в котором изложила меры, необходимые, как она считает, для развития ИИ-сектора. По данным CNBC, план ИИ-инфраструктуры США касается экономики ИИ, использования опыта ВМС США в сфере атомной энергетики, а также правительственных проектов, финансируемых частными инвесторами. Говорится и о необходимости создания североамериканского ИИ-альянса, к которому в перспективе могут присоединиться, например, страны Персидского залива. Критически важным считается принятия «Закона о национальных магистральных ЛЭП» (National Transmission Highway Act), который называется столь же амбициозным, как и «Закон о национальных межштатных и оборонных магистралях» (National Interstate and Defense Highways Act) 1956 года. В сентябре уже сообщалось, что топ-менеджеры OpenAI, включая гендиректора Сэма Альтмана (Sam Altman), провели ряд встреч с потенциальными инвесторами с целью заручиться поддержкой в создании многомиллиардной IT-инфраструктуры, необходимой для ускоренного развития ИИ. В документе OpenAI предсказывает ИИ блестящее будущее, называя искусственный интеллект «основополагающей» технологией, какой стало электричество, и обещающей такие же распределённый доступ и выгоды. Предполагается, что инвестиции в ИИ помогут создать десятки тысяч рабочих мест, приведут к росту ВВП, модернизации энергетической инфраструктуры, включая атомную энергетику и созданию новых заводов по выпуску чипов — а также миллиардным инвестициям из зарубежных фондов. OpenAI недвусмысленно выразила готовность сотрудничать с администрацией будущего президента США Дональда Трампа (Donald Trump). По имеющимся данным, Трамп намерен отменить указ действующего президента США Джо Байдена (Joe Biden), в котором упоминаются необходимость оценки безопасности технологий, защита прав сотрудников отрасли, защита принципов равенства, защита прав потребителей и др. Трамп заявлял, что указ препятствует инновациям в сфере ИИ. В презентации компании упоминается о необходимости создания экономических ИИ-зон совместно с властями штатов и федеральным правительством, что должно упростить выдачу разрешений на создание ИИ-инфраструктуры. Компания намерена строить новые солнечные и ветряные электростанции, а также добиться разрешения на эксплуатацию неиспользуемых реакторов. Предполагается, что штаты, предоставляющие поддержку ИИ-бизнесу, смогут требовать выделения части вычислительных мощностей государственным университетам для проведения собственных исследований. «Закон о национальных магистральных ЛЭП» должен расширить возможности электроснабжения, развить ВОЛС и обеспечить строительство газопроводов. В компании запрашивают новые полномочия для упрощения бюрократических процедур. Заявляется, что правительство может поощрять частные инвестиции в дорогостоящие проекты энергетической инфраструктуры и взять на себя ряд обязательств, в т.ч. по покупке энергии, чтобы снизить риски инвесторов. Также предлагается использовать опыт ВМС, уже эксплуатирующих около 100 малых модульных реакторов (SMR), питающих в основном подводные лодки — это поможет состязаться с Китаем, активно строящим новые АЭС. В США основными регионами для инвестиций в ИИ называются Средний Запад и Юго-Запад, пока они остаются «за бортом», несмотря на то что там есть земля и возможность строительства ветряных и солнечных электростанций и, возможно, ядерных объектов. Тем более, что в штатах вроде Канзаса или Айовы могут потребоваться собственные специализированные ИИ-модели для обработки сельскохозяйственных данных. По оценкам одного из представителей OpenAI, к 2030 году США понадобится 50 ГВт энергии для удовлетворения потребностей ИИ-отрасли и конкуренции с КНР, особенно с учётом того, что Китай за последние два года одобрил строительство 20 ядерных реакторов и ещё 11 на следующий год. Не так давно уже сообщалось об инициативе главы OpenAI Сэма Альтмана (Sam Altman), предлагавшего правительству США строительство сети 5-ГВт ЦОД. Позже данные получили подтверждение.
14.11.2024 [17:06], Руслан Авдеев
Европейские компании ищут низкоуглеродные альтернативы дизель-генераторам для ЦОДКонсорциум Net Zero Innovation Hub for Data Centers ) инициировал т. н. запрос информации (RFI). Как сообщает сайт NZIH, речь идёт о первом запросе такого рода в Европе, направленном на поиск инновационных решений, способных заменить дизельные резервные генераторы. RFI представляет собой официальный запрос, направляемый компаниям и организациям с целью сбора информации о передовых технологиях и подходах, имеющихся в их распоряжении, которые могут использоваться для решения конкретной проблемы, в данном случае — замены источников резервного питания на безуглеродные. В консорциум входят такие известные компании, как Danfoss, Data4, Google, Microsoft, Schneider Electric и Vertiv. В NZIH объявили, что ищут решения, которые можно масштабировать до гигаваттного уровня. Инициатива, как ожидается, должна ускорить внедрение решений для резервного питания с нулевым выбросом. В I квартале 2025 года будет проведена оценка жизнеспособности предложенных решений с технической, экономической, регуляторной и других точек зрения, а во II квартале 2025 года начнётся поиск источников финансирования, после чего, возможно, будут заключены соглашения о внедрении между владельцами инновационных технологий и участниками NIZH. ![]() Источник изображения: NZIH Речь идёт о возможностях для широкого круга компаний, в том числе тех, чьи решения находятся на раннем этапе коммерциализации. Инициативу планируется реализовать в три этапа. Предполагается:
Как сообщается на сайте консорциума, внедрение передовых «чистых» технологий часто сталкиваются с препятствиями, во многом из-за новизны и высоких рисков на ранних стадиях. Выступая «агрегатором» спроса на такие технологии и создавая новые коммерческие структуры при поддержки крупнейших заказчиков, NIZH со своей инициативой пытается снизить риск для инновационных проектов, разработчиков, энергетических компаний, обеспечивая при этом возможность получения инвестиций. Инновационный аспект решений может быть представлен разработчиками — речь может идти о технологии, бизнес-модели или других аспектах или их комбинации. Первое предложение уже сделал один из ключевых участников консорциума — Microsoft продвигает водородную энергетику. Так, компания при поддержке ESB на время запитает свой дублинский ЦОД от водородных топливных ячеек GeoPura.
14.11.2024 [13:26], Руслан Авдеев
Сбербанку и Т-банку всё труднее найти площадки и питание для новых ИИ ЦОДПредставители «Сбера» и Т-банка жалуются на трудности поиска свободных площадок для постройки новых дата-центров, в том числе связанных с ИИ-проектами. Более того, банки сообщили, что им уже не хватает свободных мощностей, передают «Ведомости». Если ранее проект «Сбера» по строительству ЦОД на 40 МВт считался крупным, то теперь объекты до 200 МВт даже не рассматриваются — по словам главы структуры Германа Грефа, оптимальным вариантом считаются проекты 300–400 МВт. В Т-банке также подтверждают сложность постройки ЦОД даже на 50 МВт из-за нехватки мощностей и высоких тарифов. В ВТБ тоже подтверждают, что поиск оптимальных объектов для размещения вычислительного оборудования представляет серьёзную проблему. В «Сбере» отметили и высокую стоимость самого строительства — инвестиции в инфраструктуру для систем генеративного ИИ в мире в 2024 году уже составили $300 млрд, а годовой рынок ИИ ЦОД оценивается в десятки миллиардов долларов. При этом Греф подчеркнул, что речь идёт об инвестициях в будущее и траты неизбежны. Вопрос о нехватке вычислительных мощностей для ИИ поднимался Сбербанком ещё в марте. Утверждается, что это одна из главных причин отставания российских ИИ-продуктов от решений OpenAI и Google. По словам Грефа, на тот момент российские решения отставали на 6–18 мес. При этом в конце сентября Греф заявил, что «Сбер» — владелец крупнейшего парка вычислительных мощностей в России и располагает 63 тыс. серверов в четырёх дата-центрах. Участники рынка и представители властей подтверждают нехватку энергии в некоторых регионах России, в том числе из-за роста энергопотребления IT-инфраструктурой. Замглавы администрации президента России Максим Орешкин уже объявил, что проблема дефицита электричества может стать актуальной в России в ближайшие 5–10 лет. ЦОД по-прежнему сконцентрированы в Москве и Подмосковье, где уже сложно найти площадку для объекта более чем на 40 МВт. По данным iKS-Consulting в 2023 году на Москву и область приходилось 76 % всего рынка коммерческих ЦОД России, это 53,4 тыс. стойко-мест с максимальной подведённой мощностью 540 МВт. На Санкт-Петербург приходится 9,3 % рынка (7,3 тыс. стойко-мест), на прочие регионы — 14,8 % (9,6 тыс.). Если в 2023 году рынок ЦОД в регионах вырос на 8,5 %, то в 2024 году, вероятно, рост составит 27,1 %. В 2024 году коммерческие ЦОД в России получат 12 тыс. новых стойко-мест, ожидают в iKS-Consulting.
14.11.2024 [09:32], Руслан Авдеев
ЦОД Iron Mountain запитают от подводных «воздушных змеев» SeaQurrentОператор Iron Mountain Data Centers (IMDC) объединил усилия с SeaQurrent для питания своих ЦОД от приливных электростанций (ПЭС). По данным Datacenter Dynamics, в SeaQurrent разрабатывают высокоэффективные и экологичные ПЭС с базовой мощностью 500 кВт, которые можно объединять многомегаваттные кластеры. Сотрудничество с Iron Mountain позволит SeaQurrent масштабировать свои ПЭС. ПЭС SeaQurrent включает «воздушный змей», который представляет собой гидродинамическое крыло, турбину и платформу, прикреплённую ко дну. Для подъёма крыла используется поток воды. Конструкция движется по стабильной траектории-«восьмёрке» и управляется системой дистанционного мониторинга и контроля, автономно управляющей всем процессом. Создаваемое крылом тяговое усилие приводит в движение биоразлагаемую рабочую жидкость, которая, в свою очередь, обеспечивает вращательное движение турбины генератора. В Iron Mountain решение рассматривают, как часть более широкого проекта по переходу к 2040 году на обеспечение ЦОД исключительно «чистой» энергии в режиме 24/7. Благодаря предсказуемой выработке энергии приливные электростанции лучше подходят для питания ЦОД. Впрочем, от других «зелёных» источников Iron Mountain не отказывается. В июне заключено соглашение о поставке солнечной энергии с InRange для компенсации потребления ЦОД LON-1. В апреле 2023 года подписано PPA с нидерландской энергетической компанией Sunrock. Довольно стабильны и геотермальные источники энергии, которыми пользуются или планируют пользоваться многие операторы ЦОД. Например, летом сообщалось, что Google подписала соглашение с NV Energy об использовании геотермальной энергии для питания своих дата-центров в Неваде. А Meta✴ намерена снабжать свои ЦОД в США энергией из петротермальных источников.
13.11.2024 [23:33], Руслан Авдеев
Дефицит энергии ограничит возможности 40 % ИИ ЦОД уже к 2027 годуИИ вообще и генеративный ИИ в частности привели к стремительному росту энергопотребления ЦОД — по прогнозам агентства Gartner, в следующие два года рост составит 160 %. В результате ожидается, что 40 % существующих ИИ ЦОД будут ограничены в энергоресурсах к 2027 году. Как утверждают в агентстве, взрывной рост новых ИИ ЦОД гиперскейл-уровня обеспечивает постоянный рост спроса на электроэнергию, который совсем скоро превысит возможности поставщиков электричества. Это грозит нехваткой энергии и перебоями в энергоснабжении, что ограничит рост новых ЦОД для систем генеративного ИИ и прочих целей с 2026 года. По оценкам Gartner, для обеспечения работы для ИИ серверов в 2027 году понадобится 500 ТВт∙ч, что в 2,6 раза больше, чем в 2023 году. Дефицит энергии может затянуться, поскольку на создание новой инфраструктуры для генерации, распределения и доставки энергии уйдут годы, а уже назревшие проблемы никуда не денутся. В скором будущем число новых ЦОД и развитие систем генеративного ИИ будет определяться доступностью энергии. В Gartner рекомендуют организациям и компаниям оценить влияние риск дефицита энергии на их продукты и сервисы. Стоит не только принимать в расчёт рост стоимости электричества при планировании новых продуктов и сервисов, но и искать новые решения, требующие меньше энергии. ![]() Источник изображения: Gartner Неизбежно связанное с дефицитом повышение цен на электричество увеличит стоимость эксплуатации больших языковых моделей (LLM). Хотя ключевые пользователи электроэнергии заранее работают над заключением долгосрочных контрактов, зачастую по фиксированным ставкам, стоимость энергии для питания дата-центров в любом случае значительно вырастет. Это скажется на стоимости ИИ как продукта и бизнесе соответствующих сервис-провайдеров. Вероятно, цели по достижению экоустойчивости при этом пострадают. Ранее уже прогнозировалось, что операторы ЦОД не смогут добиться заявленных целей, теперь к сходным выводам приходят и в Gartner. В краткосрочной перспективе растущий спрос заставит поставщиков добывать энергию любыми доступными способами. В некоторых случаях это означает сохранение электростанций на ископаемом топливе, которые при других обстоятельствах закрылись бы в плановом порядке. В Gartner подчёркивают, что масштабирование ЦОД приведёт и к росту выбросов CO2 в краткосрочной перспективе. ![]() Источник изображения: Janusz Walczak/unsplash.com Дата-центрам требуется энергоснабжение в режиме 24/7, а такого не могут обеспечить классические ветряные и солнечные электростанции. Надёжно поставлять энергию в больших объёма могут только ГЭС, станции на ископаемом топливе и АЭС. В долгосрочной перспективе новые технологии энергохранилищ (вроде натрий-ионных аккумуляторов) или «чистая» энергия вроде малых модульных реакторов (SMR) позволит легче добиваться ESG-целей. В Gartner рекомендуют пересмотреть цели достижения экоустойчивости, связанные с выбросами углекислого газа с учётом будущих требований ЦОД и доступности источников энергии в ближайшие годы. При разработке ИИ-приложений стоит сконцентрировать усилия на использовании минимальных вычислительных мощностей и оценивать другие возможности вроде широкого применение периферийных вычислений и т.н. малых языковых моделей (SLM), имеющих узкую специализацию.
13.11.2024 [22:21], Руслан Авдеев
Поработайте за нас: AWS предоставит учёным кластеры из 40 тыс. ИИ-ускорителей TrainiumAWS намерена привлечь больше людей к разработке ИИ-приложений и фреймворков, использующих разработанные Amazon ускорители семейства Tranium. В рамках нового инициативы Build on Trainium с финансированием в объёме $110 млн академическим кругам будет предоставлен доступ к кластерам UltraClaster, включающим до 40 тыс. ускорителей, сообщает The Register. В рамках программы Build on Trainium предполагается обеспечить доступ к кластеру представителям университетов, которые заняты разработкой новых ИИ-алгоритмов, которые позволяет повысить эффективность использования ускорителей и улучшить масштабирование вычислений в больших распределённых системах. На каком поколении чипов, Trainium1 или Trainium2, будут построены кластеры, не уточняется. Как поясняют в самом блоге AWS, исследователи могут придумать новую архитектуру ИИ-моделей или новую технологию оптимизации производительности, но у них может не оказаться доступа к HPC-ресурсам для крупных экспериментов. Не менее важно, что плоды трудов, как ожидается, будут распространяться по модели open source, поэтому от этого выиграет вся экосистема машинного обучения. Впрочем, со стороны AWS альтруизма мало. Во-первых, $110 млн будут выданы выбранным проектам в виде облачных кредитов, такое происходит не впервые. Во-вторых, компания фактически пытается переложить часть своих задач на других людей. Кастомные чипы AWS, включая ИИ-ускорители для обучения и инференса, изначально разрабатывались для повышения эффективности выполнения внутренних задач компании. Однако низкоуровневые фреймворки и т.п. ПО не предназначены для того, чтобы с ними мог свободно работать широкий круг лиц как, например, происходит с NVIDIA CUDA. Иными словам, AWS для популяризации Trainium необходимо более простое в освоение ПО, а ещё лучше готовые решения прикладных задач. Неслучайно Intel и AMD склонны предлагать разработчикам готовые оптимизированные под их ускорители фреймворки вроде PyTorch и TensorFlow, а не пытаться заставить их заниматься достаточно низкоуровневым программированием. AWS занимается тем же самым, предлагая продукты вроде SageMaker. Во многом реализация проекта возможна благодаря новому интерфейсу Neuron Kernel Interface (NKI) для AWS Tranium и Inferentia, обеспечивающему прямой доступ к набору инструкций чипов и позволяющему исследователям строить оптимизированные вычислительные ядра для работы новых моделей, оптимизации производительности и инноваций в целом. Впрочем, учёным — в отличие от обычных разработчиков — часто интересно работать именно с низкоуровневыми системами. |
|