Материалы по тегу: ии

02.10.2024 [13:11], Руслан Авдеев

Equinix с партнёрами намерена привлечь $15 млрд на новые ЦОД xScale в США

Оператор ЦОД Equinix создал новое совместное предприятие (СП) с сингапурским фондом национального благосостояния GIC и канадским пенсионным фондом Canada Pension Plan (CPP Investments). По информации Datacenter Dynamics, СП намерено привлечь $15 млрд для развития ЦОД xScale гиперскейл-уровня в США.

В Eqinix утверждают, что СП намерено приобрести землю для нескольких кампусов ёмкостью от 100 МВт, а в конечном счёте гиперскейлеры США получат более 1,5 ГВт дополнительной ёмкости. Как заявили в компании, лидеры IT-отрасли нуждаются в инфраструктуре для ИИ и прочих задач, поэтому им требуются оптимизированные для таких нагрузок дата-центры и узлы связи. Объекты xScale и IBX должны удовлетворить эти запросы, позволяя полностью реализовать потенциал ИИ-решений.

 Источник изображения: Equinix

Источник изображения: Equinix

В пресс-релизе Equinix сообщается, что в совместном предприятии CPP Investments и GIC будут контролировать доли по 37,5 %, на саму Equinix придётся 25 %. Партнёрские структуры вложили в проект собственные средства; также СП должно привлечь кредитные деньги на строительство ЦОД. Партнёры ожидают, что СП поможет удовлетворить растущий спрос на ИИ-инфраструктуру, драйвером развития которой стало совершенствование технологий, в том числе ИИ.

Впервые Equinix начала сотрудничать с GIC в октябре 2019 года для разработки объектов гиперскейл-уровня под брендом xScale. До нового анонса структуры вложили более $7,5 млрд в соответствующие ЦОД, открытые в Великобритании, Японии, Франции, Бразилии и Южной Корее. В апреле Equinix анонсировала создание СП на $600 млн с PGIM Investment для открытия ЦОД xScale в Кремниевой долине, он будет иметь ёмкость до 28 МВт.

Канадский CPP Investments неоднократно вкладывал средства в связанные с ЦОД проекты, а недавно совместно с Blackstone договорился о покупке оператора AirTrunk, действующего преимущественно в Азиатско-Тихоокеанском регионе — речь идёт о рекордной сделке в $16,1 млрд. В фонде утверждают, что уже давно получили большой опыт в сфере ЦОД.

Постоянный URL: http://servernews.ru/1111859
02.10.2024 [12:26], Руслан Авдеев

Google потратит $1 млрд на постройку облачной и ИИ-инфраструктуры в Таиланде

Компания Google намерена вложить $1 млрд в строительство новых дата-центров в Таиланде. Bloomberg сообщает, что она присоединится к другим технологическим компаниям, масштабирующим облачную и ИИ-инфраструктуру в Юго-Восточной Азии (ЮВА).

Компания намерена добавить соответствующие объекты в Бангкоке и Чонбури — эта провинция расположена к юго-востоку от тайской столицы. Это вложение позволит добавить $4 млрд в экономику страны к 2029 году и в следующие пять лет компания будет поддерживать 14 тыс. рабочих мест.

Инвестиция, совместно анонсированная Google и властями Таиланда, отражает усилия, прилагаемые азиатскими странами для привлечения в регион зарубежных технологических компаний. Если ранее многие страны региона с населением около 675 млн человек были не особенно развиты в IT-сфере, то теперь для компаний вроде Apple, Microsoft, NVIDIA и Amazon открываются большие возможности. Они тратят миллиарды долларов на строительство новых ЦОД от Таиланда и Малайзии до Сингапура и Индонезии.

Как сообщают в Google, компания инвестирует в облачные регионы, дата-центры и подводные кабели в ЮВА — в компании считают, что регион обладает большим потенциалом. Всего на конец 2023 года Google, AWS и Microsoft намеревались инвестировать в строительство дата-центров в Таиланде почти $8,5 млрд. Google также анонсировала миллиарды долларов инвестиций в Малайзии и Сингапуре.

 Источник изображения: Geoff Greenwood/unsplash.com

Источник изображения: Geoff Greenwood/unsplash.com

В настоящее время правительства всего мира пытаются сохранить баланс, с одной стороны стараясь обеспечить цифровой суверенитет, с другой — привлечь иностранные инвестиции. Власти надеются сохранить контроль над данными своих граждан и способствуют формированию местных технологических компаний, в то же время применяя инвестиционные ресурсы и опыт транснациональных гигантов для строительства облачной и ИИ-инфраструктуры.

Новые мощности ЦОД Таиланда помогут поддержать сервисы Google на основе ИИ — поиска, карт и офисных инструментов. Компания начала вести дела в Таиланде ещё 13 лет назад и заявляет, что в последние пять лет обучила 3,6 млн студентов, преподавателей и разработчиков, а также представителей предприятий малого и среднего бизнеса.

Инвестиции вполне соответствуют политике страны в отношении облачных услуг. Предполагается, что они ускорят развитие инновационных цифровых сервисов и, в ответ, это позволит компании открыть там новые экономические возможности. Летом власти Таиланда одобрили $291 млн инвестиций в местную индустрию ЦОД.

Постоянный URL: http://servernews.ru/1111853
01.10.2024 [22:04], Андрей Крупин

«Тантор Лабс» возродила Open Source-проект PipelineDB по разработке надстройки к PostgreSQL для непрерывной обработки потоковых данных

Российская компания «Тантор Лабс» (входит в группу «Астра», занимается разработкой СУБД Tantor, а также развитием одноимённого инструмента для управления и мониторинга БД, основанных на PostgreSQL) сообщила о масштабных доработках расширения PipelineDB — высокопроизводительного инструмента для агрегации временных рядов, совместимого с PostgreSQL

PipelineDB предназначен для выполнения SQL-запросов, которые уменьшают количество элементов в потоковых наборах данных. Решение позволяет в реальном времени обрабатывать, агрегировать, обобщать и фильтровать потоковые данные, объединять их с историческими данными для сравнения и анализа, а также выполнять вычисления в скользящих временных окнах. Расширение поддерживает вероятностные структуры данных и возможность слияния непрерывно наполняемых таблиц.

 Источник изображения: macrovector / freepik.com

Источник изображения: macrovector / freepik.com

Исторически решение разрабатывалось как Open Source-проект PipelineDB Core — форк PostgreSQL. В 2018 году проект трансформировался в расширение PostgreSQL, что существенно упростило его использование. Однако в 2019 году он был закрыт. Последней версией PostgreSQL, с которой работал PipelineDB, была 11-я. Специалисты «Тантор Лабс» портировали PipelineDB на новые версии PostgreSQL (13, 15 и 16-ю), добавили поддержку СУБД Tantor, реализовали новые функции и исправили множество ошибок.

Обновлённый PipelineDB поставляется в двух вариантах: как бесплатное Open Source-расширение (доступно в репозитории Tantor) и как отдельный самостоятельный продукт с функциональными доработками.

Постоянный URL: http://servernews.ru/1111836
01.10.2024 [21:45], Владимир Мироненко

«Группа Аренадата» привлекла 2,7 млрд рублей в ходе IPO

ПАО «Группа Аренадата» (Группа Arenadata), российский разработчик ПО для систем управления и обработки данных, объявило об успешном проведении первичного публичного предложения (IPO), прошедшего по верхней границе ценового диапазона. Сообщается, что «Группа Аренадата» стала первой публичной компанией среди разработчиков системного ПО для работы с данными. Стоимость акции составила 95 руб., а оценка рыночной капитализации компании достигла 19 млрд руб.

В ходе IPO со стороны текущих акционеров было предложено 28 млн акций на сумму около 2,7 млрд руб. по цене IPO, включая 2,8 млн акций, которые могут быть использованы для стабилизации цены акций на вторичных торгах в период до 30 дней после начала торгов.

В результате IPO акционерами группы стали около 30 тыс. частных инвесторов. Акции были распределены между категориями инвесторов в следующей пропорции: 57 % получили институциональные инвесторы, 27 % — розничные инвесторы и 16 % — партнёры продающих акционеров. Аллокация (распределение акций) розничным инвесторам составила около 5 %. Каждый розничный инвестор получил не менее 1 акции, те, кто подал более 10 заявок, не получили аллокации.

 Источник изображения: «Группа Аренадата»

Источник изображения: «Группа Аренадата»

Как отметил в интервью «Агентству Бизнес Новостей» представитель ПАО «Группа Аренадата», на размер аллокации повлиял «размер сделки, повышенный интерес как со стороны институциональных инвесторов — крупнейших УК, инвестиционных фондов, так и со стороны частных инвесторов». По данным «Агентства Бизнес Новостей», в ходе IPO Iva Technologies аллокация среди розничных инвесторов составила 5–10 %, столько же у IT-компании Positive Technologies и 4 % — у «Группы Астра».

После выхода на биржу доля акций в свободном обращении (free-float) составит порядка 14 % от акционерного капитал группы. Акции под тикером DATA и ISIN RU000A108ZR8 были включены во второй уровень листинга Московской биржи. Первые торги акциями «Группы Аренадата» прошли сегодня, 1 октября 2024 года.

Компания была основана в 2015 году как дочерняя структура IBS, но впоследствии отделилась от родительской компании. В 2017 года компания представила свой первый продукт — Arenadata Hadoop. В дальнейшем на рынок были выведены Arenadata DB, Arenadata QuickMarts, Arenadata Cluster Manager, Arenadata Streaming, Arenadata Postgres и т.д. По состоянию на 2023 году объём данных на платформе Arenadata превысил 60 Пбайт.

Постоянный URL: http://servernews.ru/1111834
01.10.2024 [17:53], Руслан Авдеев

KT Corporation заключила с Microsoft многомиллиардную сделку в сфере ИИ

Южнокорейская KT Corporation и Microsoft заключили «многомиллиардную» сделку о развитии ИИ-систем в Южной Корее. В частности, KT Telecom в течение 15 лет вложит $450 млн в сетевую инфраструктуру и ЦОД, которой воспользуется Microsoft. Microsoft, в свою очередь, будет отвечать за персонал и IT-инфраструктуру. Первое соглашение о стратегическом партнёрстве между компаниями было подписано ещё летом 2024 года,

KT Telecom и Microsoft создадут кастомизированную версию ИИ-модели OpenAI GPT-4o, а также изучат создание малых языковых моделей Microsoft Phi. KT предоставит наборы данных, которые позволят адаптировать модели к корейскому языку и культуре. Они будут использоваться как для внутренних нужд KT, так и в качестве основы для вертикально интегрированных B2B-решений в различных отраслях.

Также компании займутся развитием суверенных облаков на базе платформы Microsoft Cloud for Sovereignty для регулируемых отраслей вроде государственного и финансового секторов. Кроме того, будет создан центр совместных инноваций, направленный на создание ИИ-решений для цифровой трансформации. Microsoft поможет обучить 19 тыс. сотрудников KT навыкам работы с облачными технологиями и ИИ.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Как сообщают в Microsoft, сотрудничество поможет объединить отраслевой опыт KT Telecom с возможностями технологического стека Microsoft, от Azure AI до Microsoft 365 Copilot. Вместе компании смогут ускорить ИИ-трансформацию корейских организаций как в частном, так и в государственном секторах, а также обеспечить новый опыт на основе ИИ для миллионов потребителей.

В 2017 году Microsoft ввела в эксплуатацию два облачных региона в Южной Корее — Центральный и Южный регионы в Сеуле и Пусане соответственно. В 2021 году в Сеуле добавлены дополнительные зоны доступности. Конкурирующий с KT конгломерат SK Group также активно вкладывается в развитии ИИ, но в то же время прилагает немалые усилия по импортозамещению американских технологий.

Постоянный URL: http://servernews.ru/1111800
01.10.2024 [10:59], Андрей Крупин

T-Boost до трёх раз ускорит запись резервных копий на СХД YADRO TATLIN.BACKUP

Российская компания YADRO, занимающаяся разработкой и производством программного и аппаратного обеспечения на базе собственных R&D-центров и сборочных мощностей, сообщила о выпуске обновлённой системы хранения данных резервных копий TATLIN.BACKUP 1.1.

TATLIN.BACKUP представляет собой решение для среднего и крупного бизнеса и может использоваться для резервного копирования различных данных (СУБД, виртуальные машины, файлы, электронные письма). Система поддерживает технологию многопоточной дедупликации блоками переменной длины, компрессию по алгоритму ZSTD (обеспечивает сжатие до 2,5:1 в рамках фрагмента данных), включает средства балансировки нагрузки, проверки целостности резервируемой информации (верификация реализована на аппаратном уровне технологиями ECC, T10 PI), упреждающей журнализации и прочие востребованные в профессиональной среде функции.

 Источник изображения: YADRO

Источник изображения: YADRO

Продукт зарегистрирован в реестре российской радиоэлектронной продукции Минпромторга, поддерживает работу с ОС Astra Linux, Debian, Ubuntu, «Ред ОС», SberLinux OS Server, интеграцию с программными комплексами «Кибер Бэкап», RuBackup, Veritas, NetBackup, Veeam Backup, Vinchin Backup и СУБД Postgres Pro.

Особенностью TATLIN.BACKUP версии 1.1 является поддержка проприетарного протокола T-Boost — фирменной разработки инженеров YADRO, обеспечивающей повышение эффективности и производительности процессов резервного копирования за счёт распределения нагрузки. Технология обеспечивает дедупликацию на источнике (клиенте) и передачу только уникальных данных, что позволяет существенно сократить нагрузку на сеть и ускорить процесс записи резервных копий. T-Boost позволяет использовать NFS/CIFS и требует плагина (агента) со стороны клиента.

 Особенности технологии T-Boost (Источник изображения: YADRO)

Особенности технологии T-Boost (Источник изображения: YADRO)

Согласно проведённым тестам, при одновременной записи резервных копий с повторяющимися блоками данных через протокол T-Boost в среднем скорость записи может увеличиться до трёх раз, а нагрузка на сеть снизиться на порядок и более. Также новая разработка обеспечивает безопасную передачу данных и защищает их от вирусов-шифровальщиков.

Кроме того, в обновлённой версии TATLIN.BACKUP 1.1 была оптимизирована аппаратная платформа, улучшена общая производительность системы в среднем на 70 %, добавлена поддержка VLAN для организации виртуальных локальных сетей и обеспечения безопасности передачи данных, расширены сервисы для сбора и анализа логов системы. Также был улучшен графический интерфейс для удобства пользователей и администраторов.

Система резервного копирования TATLIN.BACKUP в полной мере отвечает задачам импортозамещения и может использоваться заказчиками при реализации программ по переходу на отечественные продукты с решений зарубежных разработчиков.

Постоянный URL: http://servernews.ru/1111756
30.09.2024 [10:24], Сергей Карасёв

В облаке Vultr появились ускорители AMD Instinct MI300X

Vultr, крупнейший в мире частный облачный провайдер, объявил о том, что в составе его инфраструктуры теперь доступны ускорители AMD Instinct MI300X и открытый программный стек AMD ROCm. Клиенты могут использовать их для ресурсоёмких задач ИИ и НРС-нагрузок.

Отмечается, что благодаря объединению платформы Vultr Serverless Inference с ускорителями Instinct MI300X даже небольшие предприятия получают возможность применять передовые технологии ИИ, которые ранее им были недоступны. Новое решение ориентировано на заказчиков из различных отраслей, включая здравоохранение, финансовые услуги, производство, энергетику, медиа, розничную торговлю и телекоммуникации.

На сайте Vultr отмечается, что изделия Instinct MI300X обеспечивают ИИ-производительность в режиме TF32 до 653,7 Тфлопс, FP16 — 1307,4 Тфлопс, INT8 — 2614,9 TOPS, FP8 — 2614,9 Тфлопс. При НРС-нагрузках теоретическое пиковое быстродействие достигает 81,7 Тфлопс FP64 и 163,4 Тфлопс FP32.

 Источник изображения: Vultr

Источник изображения: Vultr

Ускорители AMD интегрируются с Vultr Kubernetes Engine for Cloud GPU для формирования кластеров Kubernetes с ускорением на базе GPU. Компания Vultr говорит о высоком соотношении цены и производительности, гибких возможностях масштабирования и оптимизации для инференса. Нужно отметить, что ранее об использовании ускорителей Instinct MI300X в составе своей облачной инфраструктуры объявила корпорация Oracle. Новые инстансы BM.GPU.MI300X.8 могут использоваться в том числе для обработки больших языковых моделей (LLM), насчитывающих сотни миллиардов параметров.

Постоянный URL: http://servernews.ru/1111720
29.09.2024 [18:32], Руслан Авдеев

Microsoft потратит $2,7 млрд на облачную и ИИ-инфраструктуру в Бразилии

Компания Microsoft будет способствовать развитию облачной и ИИ-инфраструктуры Бразилии, расширяя свои собственные дата-центры в стране. По данным Datacenter Dynamics, компания объявила о намерении потратить $2,7 млрд на соответствующие проекты в течение трёх лет. В частности, в штате Сан-Паулу предполагается расширить облачную инфраструктуру в нескольких кампусах ЦОД. В Бразилии у компании есть облачный регион Brazil South в штате Сан-Паулу (введён в эксплуатацию в 2014 году), а в 2020 году IT-гигант запустил Brazil Southeast в Рио-де-Жанейро.

Глава Microsoft Сатья Наделла (Satia Nadella) уже заявил о поддержке ИИ-трансформации страны и сообщил, что новые инвестиции компании в облака и ИИ обеспечат доступ к современным технологиям, а программы обучения будут способствовать получению новых навыков, которые станут драйвером процветания людей и экономики Бразилии в эру ИИ.

По данным компании, речь идёт о крупнейшей в истории компании единовременной инвестиции в стране. В числе прочего предусмотрено обучение 5 млн человек навыкам работы с ИИ в последующие три года.

Ещё в 2014 году Microsoft запустила облачный регион São Paulo Azure в бразильском муниципалитете Кампинас, а в 2021 году его расширили до трёх зон доступности. В 2023 году появилась информация, что компания дополнительно работает над объектами в городах Ортоландия (Hortolândia) и Сумаре (Sumaré) в штате Сан-Паулу. Также в 2020 году было объявлено о намерении открыть второй облачный регион в Рио-де-Жанейро, но позже проект переквалифицировали в «регион с зарезервированным доступом».

 Источник изображения: Pedro Menezes/unsplash.com

Источник изображения: Pedro Menezes/unsplash.com

В 2023 году Microsoft подписала с AES Brasil контракт на поставки возобновляемой энергии сроком на 15 лет, забор энергии предусмотрен с ветроэлектростанции Cajuína Wind Complex, находящейся в штате Риу-Гранди-ду-Норти (Rio Grande do Norte). Коммерческая эксплуатация началась в июле 2024 года.

Инвестирует в бразильскую цифровую инфраструктуру не только Microsoft. Пару недель назад появилась информация о том, что $1,8 млрд на расширение ЦОД в стране готовится выделить и AWS, а Scala Data Centers построит в бразильском штате Риу-Гранди-ду-Сул (Rio Grande do Sul) мегакампус ЦОД на 4,75 ГВт.

Постоянный URL: http://servernews.ru/1111708
29.09.2024 [14:35], Сергей Карасёв

НПК «Атроник» представила модуль МЦП301-02 формата MicroPC на чипе Vortex 86DX3

Научно-производственная компания (НПК) «Атроник» анонсировала так называемый модуль центрального процессора МЦП301-02, выполненный в формате MicroPC. Изделие предназначено для встраиваемых применений, где важно низкое энергопотребление. Доступно семейство типовых конструктивов для использования с периферийными модулями MicroPC.

Стандарт MicroPC, предложенный фирмой Octagon Systems в 1990 году, используется в вычислительных системах ответственного назначения. Благодаря оригинальной конструкции такие решения, как утверждает «Атроник», продолжают оставаться одними из наиболее устойчивых к воздействию жёстких внешних факторов на рынке встраиваемых компьютеров.

 Источник изображения: «Атроник»

Источник изображения: «Атроник»

МЦП301-02 — модуль МЦП301 формата PC/104, укомплектованный платой-переходником PC/104 — MicroPC, осуществляющей вывод шины ISA на ножевой тыльный разъём и вывод интерфейсов ввода-вывода (Ethernet, COM, USB, GPIO, LPT) на лицевую сторону. Характеристики двух устройств идентичны, за исключением того, что МЦП301 имеет дополнительный интерфейс LVDS.

Применён двухъядерный x86-процессор Vortex86DX3, работающий на тактовой частоте 800 МГц. Есть 2 Гбайт напаянной памяти DDR3-533/667 ECC, 8 Гбайт флеш-памяти NAND и разъём для карт CompactFlash Type I/II. Реализована поддержка сетевых интерфейсов 100MbE и 1GbE, четырёх портов USB 1.1/2.0, четырёх последовательных портов, параллельного порта (LPT) с поддержкой режимов SPP/EPP, интерфейса D-Sub, двух портов DIO, а также GPIO (8 линий ввода/вывода) и 16-разрядной шины ISA.

Габариты МЦП301-02 составляют 124,5 × 123,8 × 32,0 мм, масса — 550 г. Заявленный показатель MTBF (средняя наработка на отказ) — 340 тыс. часов. Диапазон рабочих температур простирается от -40 до +85 °C. Обеспечивается совместимость с FreeDOS (предустановлена на изделиях), Linux Debian 9 (ядро 4.9) и ЗОСРВ «Нейтрино» (QNX).

Постоянный URL: http://servernews.ru/1111701
29.09.2024 [00:30], Алексей Степин

Рождение экосистемы: Intel объявила о доступности ИИ-ускорителей Gaudi3 и решений на их основе

Про ускорители Gaudi3 компания Intel достаточно подробно рассказала ещё весной этого года — 5-нм новинка стала дальнейшим развитием идей, заложенных в предыдущих поколениях Gaudi. Объявить о доступности новых ИИ-ускорителей Intel решила одновременно с анонсом новых серверных процессоров Xeon 6900P (Granite Rapids), которые в видении компании являют собой «идеальную пару». Впрочем, в компании признают лидерство NVIDIA, так что обещают оптимизировать процессоры для работы с ускорителями последней. А вот ускорителей Falcon Shores, вполне вероятно, с новой политикой Intel потенциальные заказчики не дождутся.

 Источник изображений здесь и далее: Intel

Источник изображений здесь и далее: Intel

На данный момент главной новостью является то, что в распоряжении Intel не просто есть некий ИИ-ускоритель с более или менее конкурентоспособной архитектурой и производительностью, а законченное и доступное заказчикам решение, уже успевшее привлечь внимание крупных производителей и поставщиков серверного оборудования.

Впрочем, на презентации были продемонстрированы любопытные слайды, в частности, касающиеся архитектуры и принципов работы блоков матричной математики (MME), тензорных ядер (TPC), а также устройство подсистемы памяти.

В последнем случае любопытен максимальный отход от иерархических принципов построения в пользу единого унифицированного пространства памяти, включающего в себя кеши L2 и L3, а также набортные HBM2e-стеки ускорителя. Общение с сетевым интерконнектом при этом организовано из пространства L3, что должно минимизировать задержки.

При этом сетевые порты доступны операционной системе как NIC через драйвер Gaudi3, с управлением посредством RDMA verbs. Благодаря большому количеству таких виртуальных NIC, организация интерконнекта внутри сервера-узла не требует никаких коммутаторов, а совокупная внутренняя производительность при этом достигает 67,2 Тбит/с.

Хотя основой экосистемы Gaudi3 станут в первую очередь ускорители HL-325L и UBB-платы HLB-325, есть у Intel и PCIe-вариант в виде FHFL-платы HL-338: 1,835 Пфлопс в режиме FP8 при теплопакете 600 Вт. Оно имеет только 22 200GbE-контроллера, а в остальном повторяет конфигурацию HL-325L с восемью блоками матричной математики (MME).

Эти ускорители получат пару портов QSFP-DD, каждый из которых будет поддерживать скорость 400 Гбит/с, а между собой платы в пределах одного сервера смогут общаться при помощи специального бэкплейна.

Важно то, что Gaudi3 успешно прошёл путь от анонса до становления сердцем полноценной аппаратно-программной экосистемы, в том числе благодаря ставке на программное обеспечение с открытым кодом. В настоящее время Intel в содействии с партнёрами могут предложить широчайший по масштабу спектр решений на базе Gaudi3 — от рабочих станций и периферийных серверов до вычислительных узлов, собирающихся в стойки, кластеры и даже суперкластеры.

В числе крупнейших партнёров Intel по новой экосистеме есть Dell и Supermicro, представившие серверные системы c Gaudi3. Начало массовых поставок этих систем запланировано на октябрь 2024 года. Вряд ли такие серверы будут развёртываться по одному, поэтому Intel рассказала о возможностях масштабирования Gaudi3-платформ.

Один узел с восемью OAM-модулями HL-325L, развивающий 14,7 Пфлопс в режиме FP8 и располагающий 1 Тбайт HBM станет основой для 32- и 64-узловых кластеров с 256 и 512 Gaudi3 на борту, благо нехватка пропускной способности сетевой части Gaudi3 не грозит — она составляет 9,6 Тбайт/с для одного узла. Из таких кластеров может быть составлен суперкластер с 4096 ускорителями или даже мегакластер, где их число достигнет 8192. Производительность в этом случае составит 15 Эфлопс при объёме памяти 1 Пбайт и совокупной производительности сети 9,8 Пбайт/с.

Типовой 32-узловой кластер на базе Gaudi3 Intel — это решение средней плотности с 15 стойками, содержащими не только вычислительные узлы, но и управляющие серверы, сетевые коммутаторы и подсистему хранения данных. Благодаря тому, что Intel в качестве интерконнекта для Gaudi3 избрала открытый и широко распространённый стандарт Ethernet (200GbE RoCE, 24 контроллера на ускоритель), не должно возникнуть проблем с совместимостью и привязкой к аппаратному обеспечению единственного вендора, как это имеет место быть c NVIDIA InfiniBand и NVLink.

Вкупе с программным обеспечением, основой которого является открытый OneAPI, и развитой системой техподдержки, системы на базе Gaudi3 станут надёжной основой для развёртывания ИИ-систем класса RAG, позволяющих заказчику в кратчайшие сроки запускать сети LLM с собственными датасетами без переобучения модели с нуля, говорит компания.

Именно в сферах, так или иначе связанных с большими языковыми моделями, Gaudi3 и системы на его основе должны помочь Intel укрепить свои позиции. Компания приводит данные, что Gaudi3 производительнее H100 примерно в 1,19 раза без учёта энергоэффективности, но в пересчёте «ватт на доллар» эти ускорители превосходят NVIDIA H100 уже в два раза.

Правда, H100 арсенал NVIDIA уже не ограничивается, но с массовой доступности новых решений Intel они могут оказаться привлекательнее. К тому же платформа совместима со всеми основными фреймворками, библиотеками и средствами управления. Впрочем, на примере AMD прекрасно видно, насколько индустрия привязана к решениям NVIDIA, причём в первую очередь программным.

Постоянный URL: http://servernews.ru/1111666
Система Orphus