Материалы по тегу: hardware

29.08.2024 [11:44], Сергей Карасёв

МТС Web Services нарастила GPU-мощности для обучения ИИ на 40 %

Компания MTS Web Services (MWS), дочернее предприятие МТС, объявила о наращивании мощностей, предназначенных для обработки ресурсоёмких ИИ-нагрузок. В дата-центрах «Федоровский» в Санкт-Петербурге и GreenBushDC в Москве развёрнуты новые кластеры виртуальной инфраструктуры на базе GPU.

Отмечается, что всё больше российских компаний переносят работу с ИИ в облако. Это связано с тем, что для обучения больших языковых моделей (LLM) и обеспечения их работоспособности требуются огромные вычислительные ресурсы и привлечение дорогостоящих специалистов. На фоне высокого спроса MWS расширяет свою инфраструктуру.

Утверждается, что благодаря запуску двух новых сегментов GPU-мощности MWS поднялись на 40 %. При этом компания не уточняет, какие именно ускорители задействованы в составе этих кластеров. До конца 2024 года MWS рассчитывает увеличить свои GPU-ресурсы ещё в 3–4 раза. Подчёркивается, что вычислительная инфраструктура подходит для работы с любыми ИИ-моделями во всех отраслях экономики. Доступ к мощностям можно получить из любой точки России.

 Источник изображения: pixabay.com

Источник изображения: pixabay.com

В дальнейшие планы MWS входят создание платформы для разработки, обучения и развёртывания моделей машинного обучения, внедрение уже готовых моделей ИИ для разных индустрий и направлений с доступом посредством API, а также предоставление ИИ-сервисов по модели SaaS. «Мы стремимся, чтобы как можно больше компаний вне зависимости от их величины получили возможность обучать и внедрять в бизнес свои ИИ-модели», — говорит директор по новым облачным продуктам МТС Web Services.

Постоянный URL: http://servernews.ru/1110165
28.08.2024 [16:47], Руслан Авдеев

Дата-центр xAI в Мемфисе загрязняет воздух своими генераторами, но других мощных источников энергии у ЦОД пока нет

НКО Campaign group the Southern Environmental Law Center (SELC) призывает власти расследовать деятельность компании xAI Илона Маска (Elon Musk). По данным Datacenter Dynamics, активисты обвиняют ИИ-стартап в том, что используемые на территории его дата-центра генераторы усугубляют ситуацию с загрязнением воздуха в регионе.

Представители SELC обратились в департамент здравоохранения округа Шелби (Shelby) штата Теннесси США, утверждая, что на площадке xAI в южной части Мемфиса применяется 18 генераторов, на использование которых необходимо получить разрешение властей.

ЦОД xAI расположен на месте бывшего завода Electrolux площадью 69 677 м2, который закрылся в 2022 году. Илон Маск ранее заявлял, что со временем дата-центр будет использовать до 100 тыс. ускорителей NVIDIA H100 (часть которых забрали у Tesla) для обучения и обеспечения работы языковой модели Grok. Второй кластер из 300 тыс. ускорителей B200 планируется ввести в эксплуатацию в следующем году.

 Источник изображения: Gabriel Tovar/unspalsh.com

Источник изображения: Gabriel Tovar/unspalsh.com

Для этого потребуется много энергии. В xAI пообещали вложить $24 млн в строительство подстанции, которая обеспечит ЦОД до 150 МВт (если одобрит оператор энергосети штата), но пока центр имеет доступ только к 7 МВт. Для решения проблемы подготовлены 14 генераторов Voltagrid на природном газе, каждый из которых способен обеспечить до 2,5 МВт. В письме SELC говорится, что компания Solar Turbines также установила на территории четыре турбины SMT-130 мощностью по 16 МВт.

Предполагается, что это только усугубит проблему низкого качества воздуха в округе Шелби. Уровень приземного озона в регионе уже превышал допустимые нормы в последние три года, и вероятно, то же самое произойдёт и в 2024 году. Загрязнение озоном обостряет заболевания лёгких, такие как эмфизема и хронический бронхит, и увеличивает частоту приступов астмы. Между тем, генераторы xAI, предположительно, выбрасывают около 130 тонн прекурсоров O3 — оксидов азота (NOx) — ежегодно, что делает их девятым по масштабу источником таких оксидов в округе.

 Источник изображения: Voltagrid

Источник изображения: Voltagrid

SELC, выступающая от имени нескольких жилых сообществ Мемфиса, добавила, что минимальным требованием является получение разрешений для четырёх 16-МВт турбин до их установки и ввода в эксплуатацию — даже если они временные. Также необходимо потребовать получение разрешений на малые генераторы. Департамент здравоохранения округа призвали отреагировать на эксплуатацию генераторов без разрешений и принять предусмотренные законом меры за их использование без соответствующих разрешений.

SELC уже не первый год борется со строительством дата-центра xAI. В июле группа предупредила о «вредоносных последствиях» для местных жителей из-за роста нагрузки на энергосети Мемфиса. Утверждается, что объект требует «непостижимые» 150 МВт уже к концу 2024 года — столько энергии достаточно для питания 100 тыс. домохозяйств. Это может сказаться на здоровье и даже жизнях местных жителей, поскольку во время пиковых нагрузок люди могут остаться без отопления или кондиционеров. Компания Маска также вызвала недовольство местных властей, которые заявили, что узнали о планах строительства дата-центра из средств массовой информации.

Постоянный URL: http://servernews.ru/1110107
28.08.2024 [16:33], Руслан Авдеев

Власти Ирландии сорвали проект по строительству ЦОД Google — он недостаточно экоустойчив

Планы Google по расширению сети дата-центров в районе Дублина так и не будут реализованы. По данным The Register, власти Ирландии посчитали, что проект нового ЦОД недостаточно экологичен. Неизвестно, будет ли компания обжаловать отказ. Недавно Google признала, что вместо снижения выбросов парниковых газов только наращивает их — с 2019 года выбросы выросли на 48 %. В компании объясняют это ростом сети ЦОД из-за большого спроса на ИИ-решения, но просят не переживать.

Решение было принято на прошлой неделе, но информация о нем появилась только сейчас. Тем временем совет муниципального округа Южный Дублин аннулировал разрешение сроком на 10 лет на строительство дата-центра Google площадью 72 400 м² с сопутствующей инфраструктурой на территории Grange Castle Business Park недалеко от ирландской столицы. В окрестностях Дублина фактически действует мораторий на новые ЦОД, за исключением тех, которые получили разрешение ранее.

 Источник изображения: Gregory DALLEAU/unsplash.com

Источник изображения: Gregory DALLEAU/unsplash.com

Основной причиной отказа стало негативное воздействие проекта на окружающую среду. Власти констатировали, что предложение Google неприемлемо из-за недостаточной емкости национальной электросети и нехватки источников возобновляемой энергии непосредственно площадки. Ирония в том, что местные регуляторы считают последний показатель недостаточным, если он ниже 100 %. При этом Microsoft разрешили построить новый ЦОД Grange Castle Business Park, разместив по соседству 170-МВт газовую электростанцию, которую, судя по всему, посчитали достаточно экологичной.

Совет также выразил недовольство недостаточной прозрачностью текущих PPA-соглашений, связанных с бизнесом в Ирландии, а также отсутствием подключения к ближайшей сети центрального отопления. Кроме того, Google предоставила слишком мало деталей о том, как проект повлияет на энергоснабжение после ввода в эксплуатацию в 2027 году. Также было заявлено, что предложение Google не соответствует местным правилам, связанным с сохранением и защитой «зеленой» инфраструктуры и экологическим требованиям совета. Иными словами, компания была признана недостаточно «зеленой» для строительства очередного крупного ЦОД вблизи ирландской столицы.

НКО National Trust For Ireland поддержала решение властей в своем письме, отметив, что новый объект стал бы источником эквивалента дополнительных 224 250 тонн CO2 ежегодно, что составляет 0,44 % от всех выбросов CO2 в стране. Такой рост загрязнений не соответствует принятым в Ирландии экологическим обязательствам, а правила строительства ЦОД в стране следовало бы уже пересмотреть. Отмечается, что строительство дата-центров ранее почти не контролировалось, и сейчас ЦОД фактически потребляют 21 % всей электроэнергии в стране, тогда как в 2015 году этот показатель составлял лишь 5 %.

Постоянный URL: http://servernews.ru/1110121
28.08.2024 [14:26], Руслан Авдеев

Meta✴ будет снабжать свои ЦОД в США энергией из петротермальных источников

В Meta намерены снабжать свои американские дата-центры геотермальной (петротермальной) энергией. По данным Datacenter Dynamics, компания анонсировала сделку со стартапом Sage Geosystems об использовании технологий последнего для обеспечения ЦОД электричеством.

Sage Geosystems будет использовать разработку Geopressured Geothermal System (GGS) для поставки клиенту «зелёной» энергии. Первая фаза проекта должна заработать в 2027 году. В Meta рассчитывают получить до 150 МВт базовой петротермальной мощности для своих объектов. Пока не сообщается, какие именно ЦОД будут снабжаться энергией из «безуглеродных» источников. Впрочем, в Sage проговорились, что речь идёт о местности к востоку от Скалистых гор.

В Sage Geosystems назвали проект прекрасным примером того, как государственный и частный сектор могут сотрудничать в деле перехода на «чистую» энергию и поблагодарили Министерство энергетики (DOE) за поддержку коммерциализации инновационных решений. Как сообщают в компании, в основном геотермальная энергия используется в штатах Невада, Юта и Калифорния. Что касается Meta, то компания заключила контракты на поставку более 12 ГВт электричества из возобновляемых источников по всему миру, став одним из крупнейших корпоративных покупателей возобновляемой энергии в мире.

 Источник изображения: Job Savelsberg/unsplash.com

Источник изображения: Job Savelsberg/unsplash.com

В Sage заявляют, что петротермальные системы — более распространённый и доступный источник энергии, чем гидротермальные скважины. Петротермальные системы прокачивают в замкнутом контуре воду между поверхностью Земли и подземными горячими породами. Можно бурить как собственные скважины, так и перепрофилировать некоторые «сухие» нефтяные скважины. Также Sage работает над технологиями долговременного хранения энергии. В прошлом году небольшой пилотный проект смог обеспечить 200 кВт в течение более 18 часов и 1 МВт — в течение 30 минут.

Техасская Sage Geosystems основана в 2020 году бывшими сотрудниками Shell. В раунде финансирования серии A компания привлекла $17 млн. Средства будут направлены на строительство первого коммерческого GGS-проекта компании мощностью 3 МВт в Техасе, недалеко от Сан-Антонио. Геотермальная электростанция должна заработать ещё до конца 2024 года. Ранее Sage подписала сделку с американской армией для обеспечения энергией военных объектов в Нью-Мексико и Техасе. Также она изучает возможность использования геотермальной энергетики в интересах базы ВВС США в Хьюстоне (Техас).

 Источник изображения: Federica Bisso/unsplash.com

Источник изображения: Federica Bisso/unsplash.com

Ранее Google заключила контракт с Fervo Energy и NV Energy на покупку более 100 МВт геотермальной энергии в Неваде. Соглашение о покупке «чистой» энергии (PPA) заключила с Contact Energy в Новой Зеландии компания Microsoft, также она строит геотермальный кампус в Кении вместе с G42.

В Индонезии Star Energy обсуждает с операторами ЦОД строительство объектов недалеко от геотермальных электростанций, PDG также подписала «геотермальный» контракт для своих ЦОД в Индонезии. На Филиппинах Converge заключила соглашение о поставках аналогичной энергии с местной электрокомпанией. В Калифорнии стартап CalEthos намерен построить крупный кампус с энергоснабжением из аналогичных источников. Наконец, итальянский стартап Geoveda Srl намерен построить небольшой ЦОД с геотермальным питанием в Тоскане.

Постоянный URL: http://servernews.ru/1110102
28.08.2024 [12:32], Сергей Карасёв

Sapphire Rapids Refresh для рабочих станций: Intel Xeon W-2500 и W-3500 получили до 60 ядер и до 112,5 Мбайт кеша

Корпорация Intel, по сообщению ресурса VideoCardz, представила процессоры Xeon W-2500 и W-3500 поколения Sapphire Rapids Refresh. Эти чипы предназначены для применения в рабочих станциях и высокопроизводительных настольных компьютерах. Они придут на смену семействам Xeon W-3400 и W-2400.

В серию Xeon W-2500 вошли изделия с 26, 22, 18, 14, 12, 10 и 8 ядрами. Во всех случаях поддерживается технология многопоточности. Объём кеша L3 варьируется от 22,5 до 48,75 Мбайт. Версии с 8 и 10 ядрами могут работать с памятью DDR5-4400, все другие модели — с DDR5-4800 (четыре канала). Показатель базовой мощности (Processor Base Power, PBP) варьируется от 175 до 250 Вт.

 Источник изображений: VideoCardz

Источник изображений: VideoCardz

Семейство Xeon W-2500 возглавляет модель Xeon W7-2595X с 26 ядрами: базовая частота равна 2,8 ГГц, максимальная — 4,8 ГГц. Этот чип, как и другие решения с суффиксом «X», имеет разблокированный множитель, благодаря чему обеспечивается возможность разгона. Все процессоры серии поддерживают 64 линии PCIe 5.0. Цена варьируется от $609 до $2039.

Более мощные изделия Xeon W-3500 насчитывают от 16 до 60 ядер с поддержкой многопоточности. Размер кеша L3 — от 45 до 112,5 Мбайт. Все процессоры могут работать с памятью DDR5-4800 (восемь каналов). Количество линий PCIe 5.0 равно 112. Значение PBP находится в диапазоне от 290 до 385 Вт. На вершине семейства располагается модель Xeon W9-3595X с базовой частотой 2,0 ГГц и максимальной частотой 4,8 ГГц. Цена варьируется от $1339 до $5889. Новые процессоры рассчитаны на работу с материнскими платами на чипсете Intel W790.

 Источник изображения: Intel

Источник изображения: Intel

Постоянный URL: http://servernews.ru/1110100
28.08.2024 [11:55], Руслан Авдеев

Inventec продаст AMD свою долю в ZT Systems, получив деньги и пакет акций

В рамках сделки по покупке компанией AMD поставщика серверных и облачных решений ZT Systems, компания Inventec, владеющая 10 % акций последней, выразила готовность продать свою долю за $411 289 377. По информации DigiTimes, Inventec помимо денег получит и акции AMD.

Inventec продаёт свою долю для укрепления финансовых позиций и, вероятно, концентрации усилий на других сферах бизнеса. Общая сумма сделки AMD по покупке ZT Systems составляет $4,9 млрд, 75 % стоимости будет выплачена денежными активами, оставшиеся 25 % — акциями самой AMD. В рамках сделки Inventec продаст простые акции и фондовые опционы в ZT Systems. После завершения сделки компания также получит около 884 тыс. акций AMD.

 Источник изображения: ZTSYSTEMS

Источник изображения: ZTSYSTEMS

Поскольку AMD выразила намерение продать часть бизнеса ZT Systems, отвечающую непосредственно за производство, не исключено, что Inventec впоследствии захочет выкупить её. В самой компании отказались комментировать предположение. В Wistron, тоже выпускающей серверы для гиперскейлеров, на вопрос о возможной передаче ей производственных мощностей ZT Systems сообщили, что инициатива теперь принадлежит AMD и пока планов подобного «поглощения» нет.

Inventec начала поставлять серверы ключевым облачным провайдерам в 2019 году, в том числе Amazon, Microsoft и Meta, инвестировав и в ZT Systems. Позже Inventec и ZT Systems сотрудничали над производством серверов для NVIDIA. Inventec в этой цепочке занималась установкой материнских плат и общей подготовкой шасси серверов (уровень L6), а ZT Systems отвечала за финальную сборку и тестирование готовых серверов (L10), а также за интеграцию систем на заключительном этапе (L11).

Постоянный URL: http://servernews.ru/1110113
28.08.2024 [09:44], Руслан Авдеев

ЦОД «N1» в Москве прошел сертификацию Uptime Institute с присвоением уровня Tier III

На днях дата-центр «N1», проект которого реализуется компанией «Свободные Технологии Инжиниринг», успешно прошёл проверку для получения сертификата Uptime Institute. Компания сообщает, что ЦОД будет присвоен уровень Tier III Constructed Facility.

Объект мощностью 11,5 МВт (IT-ёмкость 6,3 МВт) и площадью 4860 м2 реализуется компанией «Свободные Технологии Инжиниринг» под ключ в новом «Телекомплексе» рядом с Останкинской телебашней в Москве. ЦОД расположен в технологическом блоке последнего и имеет полностью автономную от остальной части здания инженерную инфраструктуру, 10 машинных залов, 2 MMR и специальный выделенный зал для телеком-операторов и IX.

 Источник изображения: Свободные Технологии Инжиниринг

Источник изображения: Свободные Технологии Инжиниринг

Уровень надёжности — Tier III по классификации Uptime Institute. Схема резервирования электропитания 6/5N, схема резервирования системы технологического кондиционирования — N+1, время работы от ИБП при максимальной нагрузке — не менее 15 минут. Схема электроснабжения стоек — 2N (и по два PDU). 2N-резервирование маршрутов прокладки ВОЛС, два независимых и разнесённых магистральных ввода.

ЦОД «N1» предлагает колокейшн-услуги и сопутствующие сервисы, в том числе услугу Smart Hands. Имеется 1020 стоек со средней мощностью на каждую по 6 кВт и максимальной — 10 кВт. В 2025 году планируется начать строительство на территории второй очереди ЦОД на 2000 стоек.

Постоянный URL: http://servernews.ru/1110060
28.08.2024 [09:14], Владимир Мироненко

Google поделилась подробностями истории создания ИИ-ускорителей TPU

В огромной лаборатории в штаб-квартире Google в Маунтин-Вью (Калифорния, США) установлены сотни серверных стоек с ИИ-ускорителями TPU (Tensor Processing Unit) собственной разработки, с помощью которых производится обучение больших языковых моделей, пишет ресурс CNBC, корреспонденту которого компания устроила небольшую экскурсию.

Первое поколение Google TPU, созданное ещё в 2015 году, и представляет собой ASIC для обработки ИИ-нагрузок. Сейчас компания использует такие, хотя и более современные ускорители для обучения и работы собственного чат-бота Gemini. С 2018 года TPU Google доступны облачным клиентам компании. В июле этого года Apple объявила, что использует их для обучения моделей ИИ, лежащих в основе платформы Apple Intelligence.

 TPU v1 (Источник изображений здесь и далее: Google)

TPU v1 (Источник изображений здесь и далее: Google)

«В мире есть фундаментальное убеждение, что весь ИИ, большие языковые модели, обучаются на (чипах) NVIDIA, и, конечно, на решения NVIDIA приходится львиная доля объёма обучения. Но Google пошла по собственному пути», — отметил гендиректор Futurum Group Дэниел Ньюман (Daniel Newman). Благодаря расширению использованию ИИ подразделение Google Cloud увеличило доход, и в последнем квартальном отчёте холдинг Alphabet сообщил, что выручка от облачных вычислений выросла на 29 %, впервые превысив $10 млрд за квартал.

Google была первым провайдером облачных вычислений, создавшим кастомные ИИ-чипы. Лишь спустя три года Amazon Web Services анонсировала свой первый ИИ-ускоритель Inferentia, Microsoft представила ИИ-ускоритель Azure Maia 100 в ноябре 2023 года, а в мае того же года Meta рассказала об семействе MTIA. Однако лидирует на рынке генеративного ИИ компания OpenAI, обученная на ускорителях NVIDIA, тогда как нейросеть Gemini была представлена Google спустя год после презентации ChatGPT.

В Google рассказали, что впервые задумались о создании собственного чипа в 2014 году, когда в руководстве решили обсудить, насколько большими вычислительными возможностями нужно обладать, чтобы дать возможность всем пользователям поговорить с поиском Google в течение хотя бы 30 с каждый день. По оценкам, для этого потребовалось бы удвоить количество серверов в дата-центрах. «Мы поняли, что можем создать специальное аппаратное обеспечение, <…> в данном случае тензорные процессоры, для обслуживания [этой задачи] гораздо, гораздо более эффективно. Фактически в 100 раз эффективнее, чем было бы в противном случае», — отметил представитель Google.

С выходом второго поколения TPU в 2018 году Google расширила круг выполняемых чипом задач, добавив к инференсу обучение ИИ-моделей. Процесс создания ИИ-ускорителя не только отличается высокой сложностью, но и требует больших затрат. Так что реализация таких проектов в одиночку не по силам даже крупным гиперскейлерам. Поэтому с момента создания первого TPU Google сотрудничает с разработчиком чипов Broadcom, который также помогает её конкуренту Meta в создании собственных ASIC. Broadcom утверждает, что потратила более $3 млрд в рамках реализации совместных проектов.

В рамках сотрудничества Google отвечает за собственно вычислительные блоки, а Broadcom занимается разработкой I/O-блоков, SerDes и иных вспомогательных компонентов, а также упаковкой. Самы чипы выпускаются на TSMC. С 2018 года в Google трудятся ещё одни кастомные чипы — Video Coding Unit (VCU) Argos, предназначенной для обработки видео.

Что касается TPU, то в этом году клиентам Google будет доступно шестое поколение TPU Trillium. Более того, им станут доступны и первые Arm-процессоры Axion собственной разработки. Google выходит на этот рынок с большим отставанием от конкурентов. Amazon выпустила первый собственный процессор Graviton в 2018 году, Alibaba Yitian 710 появились в 2021 году, а Microsoft анонсировала Azure Cobalt 100 в ноябре. Все эти чипы основаны на архитектуре Arm — более гибкой и энергоэффективной альтернативе x86.

Энергоэффективность имеет решающее значение. Согласно последнему экологический отчёту Google, с 2019 по 2023 год выбросы компании выросли почти на 50 %, отчасти из-за увеличения количества ЦОД для ИИ-нагрузок. Для охлаждения ИИ-серверов требуется огромное количество воды. Именно поэтому начиная с третьего поколения TPU компания использует прямое жидкостное охлаждение, которое только теперь становится практически обязательным для современных ИИ-ускорителей вроде NVIDIA Blackwell.

Постоянный URL: http://servernews.ru/1110008
28.08.2024 [00:17], Елена Копытова

512 Тбайт NVMe: HighPoint представила внешние RAID-массивы RocketStor 6541AW и 6542AW с PCIe 4.0 x16

Компания HighPoint представила NVMe DAS с возможностью формирования RAID-массивов и интерфейсом подключения PCIe 4.0 x16.

Новая серия включает модели RocketStor 6541AW и 6542AW, которые предназначены для промышленных и периферийных платформ и профессиональных рабочих станций. Хранилища оснащены соответственно четырьмя и восемью вертикальными корзинами с поддержкой горячей замены. Возможна установка NVMe SFF-накопителей U.2/U.3 корпоративного класса суммарной ёмкостью до 0,5 Пбайт. Доступно формирование до четырёх независимых массивов RAID 0/1/10, которые могут быть загрузочными с точки зрения хоста.

Каждому накопителю предоставляется четыре линии PCIe 4.0. К хосту хранилище подключается посредством CDFP-кабеля (PCIe 4.0 x16) длиной 1 м и HHFL-карты расширения Highpoint RocketRAID 1544 (тоже PCIe 4.0 x16), которая обеспечивает выделенный x16-канал связи между хостом и устройством. Highpoint подчёркивает, что и в шасси, и в адаптере используются PCIe-коммутаторы Broadcom PEX88048, которые предоставляют 48 линий PCIe 4.0 с низким уровнем задержки, что позволяет получить высокую скорость передачи данных без потерь.

 Источник изображения: RocketStor 6541AW (Источник здесь и далее: highpoint-tech.com)

Источник изображения: RocketStor 6541AW (Источник здесь и далее: highpoint-tech.com)

Поддерживается установка SED-накопителей и шифрование данных, а сами устройства используют SecureBoot, что позволяет избежать запуска неавторизованного кода во время загрузки. Кроме того, при отключении от «родного» хост-адаптера данные в хранилище становятся недоступными.

 RocketStor 6542AW с внешней платой контроллера

RocketStor 6542AW с внешней платой контроллера

RocketStor 654x оснащены вентиляторами с низким уровнем шума, а возможность ручной регулировки оборотов позволяет настраивать интенсивность охлаждения в зависимости от условий эксплуатации. Возможно и полное отключение вентиляторов. На изображении задней панели также видны порт USB 2.0 Type-C (для перепрошивки) и LAN-порт RJ45 (для инвентаризации).

Габариты RocketStor 6541AW составляют 154,94 × 130,05 × 210,06 мм при массе 5,2 кг, 6542AW — 234,95 × 122,94 × 210,18 мм и 6,7 кг. Диапазон рабочих температур простирается от +5 °C до + 55 °C. Встроенный блок питания имеет мощность 250 Вт. Гарантия составляет два года. Поставки новинок начнутся в сентябре. Пока что на сайте производителя указана только стоимость старшей модели 6542AW, которая составляет $2300.

Постоянный URL: http://servernews.ru/1110063
27.08.2024 [17:46], Руслан Авдеев

ИИ-ускорители Rebellions Rebel Quad получат 144 Гбайт памяти Samsung HBM3e

Южнокорейский стартап Rebellions представила на днях план развития своих ИИ-ускорителей. Как сообщает Business Korea, компания ускорит выпуск ИИ-чипов нового поколения, которые получат 4-нм модули памяти HBM3e производства Samsung. Samsung же будет отвечать за объединение чипов и HBM в одной упаковке.

Изначально к концу 2024 года планировалось наладить выпуск продукта Rebel Single с одним модулем памяти, но потом было решено выпустить гораздо более производительный вариант Rebel Quad с четырьмя 12-слойными (12-Hi) модулями HBM3e суммарной ёмкостью 144 Гбайт, тоже к концу текущего года. Новинка придёт на смену ускорителю ATOM, который оснащён всего лишь 16 Гбайт GDDR6.

Использование ёмкой и быстрой HBM3e-памяти считается одним из главных преимуществ Rebel Quad, по этому показателю новинки сравнимы с последними ускорители NVIDIA семейства Blackwell. При этом обещано, что новинки будут значительно энергоэффективнее решений NVIDIA и даже ускорителей Groq. Это по-прежнему серверные ускорители для обработки LLM вроде ChatGPT, но подойдут ли они для обучения ИИ-моделей, пока не уточняется.

 Источник изображения: Rebellions

Источник изображения: Rebellions

Сейчас Rebellions ориентируется на поставки комплексных ИИ-решений «стоечного уровня». В рамках концепуии Rebellion Scalable Design (RDS) будет предложены программно-аппаратные комплексы, которые позволят органично взаимодействовать многочисленным ускорителями и серверам с максимальной производительностью и энергоэффективностью. Речь идёт о решении, теоретически способном конкурировать с NVIDIA CUDA.

Постоянный URL: http://servernews.ru/1110055

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus