Лента новостей

15.06.2024 [00:25], Алексей Степин

Intel поймала AMD на подтасовке результатов в ИИ-тестах EPYC против Xeon

На Computex 2024 AMD анонсировала новое поколение серверных процессоров EPYC Turin на базе архитектуры Zen 5. При этом компания продемонстрировала слайды, из которых следует, что новые решения серьёзно опережают процессоры Intel Xeon. Так, 128-ядерный Truin сравнивается с 64-ядерным Xeon Platinum 8592+ (Emerald Rapids). AMD говорит о 2,5–5,4-кратном превосходстве, однако Intel опровергает полученные результаты и достаточно подробно разбирает вопрос тестирования в своём блоге.

Конечно, превосходство AMD в чисто количественных показателях очевидно, но в сложных вычислительных задачах, к которым относятся HPC- и ИИ-сценарии не меньшую, а то и большую роль может играть оптимизация ПО. Intel отмечает, что AMD не привела в своём анонсе конкретных сведений о версиях и настройках ПО, и, вероятнее всего, отказалась от различных расширений. Но, например, Intel Extension for PyTorch (IPEX) позволяет добиться более чем пятикратного прироста производительности по сравнению с «чистой» версией PyTorch.

Для системы с двумя Xeon Platinum 8592+ применение IPEX позволяет поднять производительность инференса в режиме INT4 с чат-ботом на базе Llama2-7B со 127 до 686 запросов в секунду при заданной задержке не более 50 мс. Для своей 256-ядерной платформы на базе Turin AMD говорит про 671 запрос — как видно, с оптимизацией результаты получаются вполне сопоставимыми.

 Источник: AMD

Источник: AMD

И потенциал для дальнейшего роста у Xeon есть: Intel сообщает, что при отключении функции Sub-NUMA Clustering результат может достигать 740 запросов. К сожалению, для других тестов компания диаграмм не опубликовала, хотя и там оптимизация позволяет добиться увеличения производительности в 1,2–2,3 раза. Этого уже не хватает, чтобы бороться с платформой Turin, которая, помимо превосходства в числе ядер, использует и более мощную 12-канальную подсистему памяти.

 Источник: Intel

Источник: Intel

Следует отметить, что Intel не сказала последнего слова: Xeon Platinum 8592+ уже не нов, а в ближайшем будущем AMD Turin придётся столкнуться с Xeon 6 с большим числом ядер. Пока эти чипы доступны лишь в исполнении с энергоэффективными ядрами, но уже в III квартале появятся и 128-ядерные Granite Rapids с производительными P-ядрами и 12-канальной памятью.

 Источник: Intel

Источник: Intel

Тем не менее, тема затронута достаточно фундаментальная: свои плюсы имеет как чисто количественный подход, которого придерживается AMD, так и подход Intel, позволяющий добиться высоких результатов при тщательной оптимизации под более комплексную архитектуру. Нельзя сказать, что результаты AMD являются мошенничеством, хотя случай и не первый — согласно тестам компании, ускоритель Instinct MI300X серьёзно опередил NVIDIA H100, но при этом AMD точно так же «забыла» про оптимизированный фреймворк TensorRT-LLM. Правда, в тот раз «честь мундира» отстоять удалось и с оптимизациями NVIDIA.

Постоянный URL: https://servernews.ru/1106533
14.06.2024 [23:15], Владимир Мироненко

Южнокорейские ИИ-стартапы Sapeon и Rebellions объединятся, чтобы вместе противостоять NVIDIA

Sapeon и Rebellions, два южнокорейский участника альянса AI Platform Alliance, сформированного в прошлом году с целью ускорения внедрения передовых решений в области ИИ, объявили о планах по объединению усилий, чтобы ускорить работу и добиться больших масштабов бизнеса.

Компания Sapeon предлагает чип X330, предназначенный для инференса и обслуживания больших языковых моделей (LLM), а также основанные на этом чипе серверы. В свою очередь, Rebellions разработала NPU ATOM для систем компьютерного зрения и использования с чат-ботами на базе ИИ. Оба производителя участвуют в программе по импортозамещению ИИ-ускорителей, CPU и иных чипов.

Сейчас Южная Корея стремится добиться технологической независимости от зарубежных поставщиков оборудования и ПО. Речь, в первую очередь, об NVIDIA. Ускорители последней в своё время не достались местному IT-гиганту Naver, который временно был вынужден заменить их процессорами Intel Xeon, а впоследствии вместе с Samsung создал собственные ИИ-чипы Mach-1.

 Источник изображения: Rebellions

Источник изображения: Rebellions

Инициатором слияния Sapeon и Rebellions выступила SK hynix, которая вместе с SK Telecom является акционером Sapeon. В своём заявлении она отметила, эти компании согласились на слияние, поскольку, по их мнению, это позволит создать компанию, способную оказать конкуренцию другим участникам глобального рынка ИИ.

Как отметил The Register, время сейчас имеет решающее значение для Sapeon и Rebellions, поскольку следующие два или три года воспринимаются как «золотое время» для создания компаний, способных стать крупными игроками в области ИИ. Поэтому предполагается провести слияние в кратчайшие сроки с завершением сделки в III квартале и запуском объединённой компании до конца 2024 года.

 Источник изображения: Sapeon

Источник изображения: Sapeon

В свою очередь, SK hynix планирует оказать помощь объединенной компании в разработке ИИ-полупроводников. Sapeon была выделена SK Telecom в отдельную компанию в 2016 году. Rebellions была создана всего четыре года назад при поддержке прямого конкурента SK Telecom в лице KT Corp., но уже договорилась с Samsung о поставке ей ИИ-чипов, которые будут производиться компанией Chaebol с использованием 4-нм процесса с интеграцией HBM3e.

Постоянный URL: https://servernews.ru/1106523
14.06.2024 [18:44], Андрей Крупин

«Базальт СПО» представила открытую библиотеку libdomain для управления службами каталогов

Компания «Базальт СПО» сообщила о доступности профессиональной аудитории открытой библиотеки libdomain, предназначенной для управления доменной IT-инфраструктурой на базе Samba, FreeIPA, Active Directory, OpenLDAP и реализации проектов по импортозамещению ПО в российских организациях.

Разработчики могут использовать libdomain вместо написания API под каждую службу каталогов. В составе библиотеки представлен модуль, который автоматически распознает, с какой именно службой каталогов происходит взаимодействие, и трансформирует запросы приложений в подходящий формат.

Библиотека выпущена под лицензией GNU GPLv2, включена в независимый открытый репозиторий проекта «Сизиф» и в 11 программную платформу (p11), являющуюся основой для разработки новых версий операционных Linux-систем семейства «Альт» и широкого спектра других программных продуктов — от софта для встроенных и мобильных устройств до программных решений для серверов предприятий, дата-центров и облачных окружений.

 Схема работы библиотеки libdomain

Схема работы библиотеки libdomain

Libdomain разработана при грантовой поддержке Фонда содействия инновациям. В планах компании «Базальт СПО» — дальнейшее развитие библиотеки и расширение её функциональных возможностей.

Постоянный URL: https://servernews.ru/1106526
14.06.2024 [16:28], Руслан Авдеев

Спрос на ЦОД в Азиатско-Тихоокеанском регионе значительно превышает предложение

В этом году дата-центры в Азии пользуются особенным спросом — инвесторы и операторы ориентируются на рост ИИ-технологий в обозримом будущем. Впрочем, как сообщает Datacenter Knowledge, компании и связанную с ЦОД инфраструктуру не только покупают, но и нередко выставляют на продажу.

Последней по времени, вероятно, может считаться продажа австралийского оператора iseek, принадлежащего британской Amber Infrastructure Group, желающей получить за бизнес AU$400 млн ($264 млн) — в распоряжении оператора имеется пять дата-центров. Крупнейшей пока считается проходящая на том же континенте сделка по продаже ЦОД-бизнеса Airtrunk, принадлежащего Канадскому совету по пенсионным инвестициям в государственном секторе и Macquarie Group. Этот бизнес оценивается в AU$15 млрд ($9,9 млрд).

Вынужденно проявляет активность и китайская сталелитейная компания Shagang, владеющая компанией GlobalSwitch и намеренная продать её на фоне потери государственных контрактов по политическим причинам. На актив уже имеются претенденты — австралийская Next DC и частная инвестиционная группа EQT.

За пределами Австралии тоже кипит деловая активность. Singtel и её партнёр KKR приобретают миноритарный пакет в ведущей в Юго-Восточной Азии, Индии и Европе сингапурской компании STT GDC. Наконец, NTT намерена приобрести 49 % в филиппинском бизнесе компании PLDT. По имеющимся данным, речь идёт о $750 млн, а сделку планируют завершить во II половине текущего года.

 Источник изображения: Finan Akbar/unsplash.com

Источник изображения: Finan Akbar/unsplash.com

Общая же сумма уже завершённых сделок в Азиатско-Тихоокеанском регионе (включая Японию) в этом году достигла $840,47 млн, по данным LSEG, это больше половины общемировых продаж в соответствующем сегменте. Когда сделки по приобретению активов вроде AirTrunk и PLDT завершатся, рекорд прошлого года в $3,45 млрд будет обновлён. По оценкам экспертов, предложение так и будет ограничено, а инвесторы сохранят высокий интерес к таким активам.

По словам CBRE, активность в разных регионах несколько отличается. Так, в Индонезии и Малайзии предпочитают строить новые кампусы, а не приобретать старые. В Японии постройкой ЦОД занялись KDDI и SoftBank. На прошлой неделе KDDI уже объявила, что построит крупнейший в Азии дата-центр с оборудованием NVIDIA. В SoftBank заявили, что подписали меморандум о взаимопонимании с Sharp, касающийся части площадки последней, там планируется построить и открыть в будущем году ИИ-ЦОД площадью 750 тыс. м2 и ёмкостью 150 МВт.

Постоянный URL: https://servernews.ru/1106503
14.06.2024 [15:20], Сергей Карасёв

«Ростех» разработал компактный модуль Com Express Type 6 Compact на процессоре «Эльбрус-2С3»

Холдинг «Росэлектроника» госкорпорации «Ростех» создал, как утверждается, самый компактный вычислительный модуль на отечественном процессоре «Эльбрус-2С3». Размеры изделия с обозначением МП21 (ТЕГР.467144.004) составляют всего 95 × 95 мм. Новинка может эксплуатироваться в суровых условиях, в частности, в составе бортовой авиационной техники.

Чип «Эльбрус-2С3» имеет два ядра МЦСТ «Эльбрус» общего назначения и 6-ядерный ускоритель 3D-графики. Объём кеша L2 составляет 2 Мбайт в расчёте на ядро. Возможна работа с оперативной памятью DDR4-2400 ECC. Реализована поддержка PCI Express 3.1, SATA-3, двух сетевых интерфейсов 1/2.5GbE и иных распространённых шин. Процессор совместим с контроллером периферийных интерфейсов «КПИ-2».

 Источник изображения: ИНЭУМ им. Брука

Источник изображения: ИНЭУМ им. Брука

Модуль МП21 в формате Com Express Type 6 Compact разработан специалистами ИНЭУМ им. Брука в составе «Росэлектроники». Тактовая частота установленного процессора «Эльбрус-2С3» составляет не менее 1,6 ГГц, а объём ОЗУ равен 8 Гбайт (ECC, один канал; опционально 4 Гбайт). Возможна установка SSD вместимостью от 60 до 480 Гбайт. Масса без опциональной теплораспределительной пластины — приблизительно 100 г.

Могут быть задействованы два интерфейса HDMI (разрешение до 4096 × 2160 точек; 60 Гц) и двухканальный LVDS (до 4096 × 2160 пикселей; 30 Гц). Упомянуто аппаратное ускорение DirectX 10, OpenGL 3.2, OpenGL ES 3, Vulkan 1.0, OpenCL 1.2, OpenVX 1.x. Возможно кодирование и декодирование материалов VP9, H.264, H.265, VC1, MJPEG.

Прочие характеристики включают два канала 1GbE, два порта SATA-3, восемь портов USB 2.0, четыре порта USB 3.0, два порта UART (уровня LVTTL), интерфейсы SPI, I2C, SMBus и пр. Питание осуществляется от источника постоянного тока 12 В. Новинка, по заявлениям разработчиков, имеет энергопотребление около 40 Вт. Диапазон рабочих температур простирается от -40 до +55 °C. Среди совместимых плат-носителей указаны БПИ (ЛЯЮИ.469535.150) и ТКПА (ЛЯЮИ.469535.147).

Отмечается, что МП21 — это полностью российская разработка, способная заменить иностранные аналоги. Устройство прошло весь цикл испытаний и готово к серийному производству. «В настоящее время это самое миниатюрное решение на базе процессора "Эльбрус-2С3". Его массогабаритные характеристики значительно повышают вариативность его использования», — отметил первый заместитель генерального директора ИНЭУМ им. Брука.

Постоянный URL: https://servernews.ru/1106484
14.06.2024 [14:42], Руслан Авдеев

AWS, но в космосе: Phantom Space и Assured Space Access создадут космическое облако Phantom Cloud

Компании Phantom Space и Assured Space Access договорились о сотрудничестве для создания облачного сервиса в космосе. По данным Datacenter Dynamics, облако Phantom Cloud будет служить резервным хранилищем данных для сторонних космических аппаратов и упростит передачу информации на Землю.

В рамках соглашения Assured Space разработает и построит телекоммуникационное оборудование для 66 спутников группировки Phantom Cloud. Партнёры будут совместно работать над созданием, запуском и эксплуатацией новой группировки. В результате предполагается сформировать сеть, к которой смогут получать доступ другие спутники для трансляции данных на Землю в режиме реального времени. В соцсети X сообщалось, что облако Phantom Cloud должно стать «AWS для космоса», обеспечивая M2M-коммуникации и комбинируя соответствующие услуги с вычислениями и облачным хранилищем на орбите.

 Источник изображения: Phantom Space

Источник изображения: Phantom Space

Более того, по словам одного из основателей и главы Phantom Space Джима Кантрелла (Jim Cantrell), который участвовал в создании SpaceX, компании хотят обеспечить базовую функциональность наземных телекоммуникационных станций непосредственно в космосе. Предполагается, что проект станет дополнением группировки Starlink, но его участники будут уделять приоритетное внимание межмашинным коммуникациям, а не людей.

По некоторым данным, Phantom Space на сегодня привлекла $27,7 млн инвестиций. Помимо разработки спутников она создаёт и космические аппараты, способные нести грузы различных типов.

Идея не вполне уникальна. Космос привлекает всё большее внимание операторов ЦОД и облачных компаний. Например, в марте сообщалось, что Lumen Orbit намерена развернуть над Землёй сеть собственных ЦОД, а стартап Aethero намерен стать «Intel или NVIDIA в космической индустрии», создавая защищённые от экстремальных условий компьютеры.

Постоянный URL: https://servernews.ru/1106496
14.06.2024 [14:41], Андрей Крупин

Президент России запретил ИБ-сервисы и услуги из недружественных стран

Президент РФ внёс изменения в указ «О дополнительных мерах по обеспечению информационной безопасности РФ» от 1 мая 2022 года. Согласно новому постановлению, с 1 января 2025 года государственным структурам, госкорпорациям и субъектам критической информационной инфраструктуры (КИИ) запрещается использовать услуги и сервисы информационной безопасности (ИБ), предоставляемые недружественными государствами.

Внесённая в указ поправка дополняет запрет на использование средств киберзащиты из недружественных стран: организациям, на которые распространяется документ, с 2025 года также запрещается использовать в своей IT-инфраструктуре системы защиты информации, странами происхождения которых являются иностранные государства, совершающие в отношении РФ, российских юридических или физических лиц недружественные действия, либо производителями которых являются компании, находящиеся под юрисдикцией таких иностранных государств, прямо или косвенно подконтрольные им либо аффилированные с ними.

 Источник изображения: pikisuperstar / freepik.com

Источник изображения: pikisuperstar / freepik.com

Помимо прочего предложенные президентом изменения содержат ряд уточнений, касающихся мер по оптимизации контроля и мониторинга за деятельностью аккредитованных центров ГосСОПКА. Ожидается, что внесённые в указ «О дополнительных мерах по обеспечению информационной безопасности РФ» дополнения будут способствовать повышению киберустойчивости экономики государства и технологической независимости отрасли кибербезопасности.

В настоящий момент на государственном уровне прорабатывается также вопрос по созданию отдельного ведомства, которое будет заниматься централизованным управлением, координированием и решением задач в сфере ИБ. Некоторые представители индустрии говорят о необходимости создания подобной госструктуры, поскольку сейчас вопросами кибербезопасности занимаются сразу несколько ведомств.

Постоянный URL: https://servernews.ru/1106506
14.06.2024 [14:05], Сергей Карасёв

Срок эксплуатации суперкомпьютеров растёт, несмотря на прекращение поддержки оборудования

Научные учреждения и организации, по сообщению HPC Wire, увеличивают период эксплуатации установленных суперкомпьютеров, несмотря на то что их поставщики прекращают поддержку соответствующего оборудования. В результате, срок службы НРС-комплексов может достигать уже 10 лет.

Типичный жизненный цикл суперкомпьютера составляет около пяти–шести лет. После этого требуется замена в связи с моральным устареванием, а также в свете появления более производительных и энергоэффективных компонентов. Кроме того, по прошествии примерно пяти лет дальнейшее обслуживание оборудования обычно становится слишком дорогим.

 Источник изображения: RIKEN

Источник изображения: RIKEN

Однако японский Институт физико-химических исследований (RIKEN) намерен эксплуатировать существующую систему Fugaku в течение десяти лет. Этот вычислительный комплекс на базе Arm-процессоров Fujitsu A64FX в 2020 году стал самым производительным суперкомпьютером в мире. В текущем рейтинге ТОР500 система занимает четвёртое место с быстродействием приблизительно 442 Пфлопс. Таким образом, Fugaku продолжит активно использоваться вплоть до 2030 года, когда ожидается появление суперкомпьютера FugakuNEXT.

Сатоши Мацуока (Satoshi Matsuoka), директор японского Центра вычислительных наук RIKEN, отметил, что зачастую НРС-системы всё ещё годны для эксплуатации спустя пять лет после запуска. Но организациям приходится устанавливать новые комплексы, поскольку производители попросту прекращают поддержку имеющихся платформ. Мацуока подчёркивает, что подобная практика должна быть прекращена.

Ливерморская национальная лаборатория им. Э. Лоуренса (LLNL) Министерства энергетики США также заявляет о том, что некоторые её НРС-системы служат в течение 7–10 лет. Большое значение для продления срока службы суперкомпьютеров имеет оптимизация ПО.

Отмечается, что средний возраст систем в списке ТОР500 по состоянию на июнь 2024 года составляет около 35 месяцев, что является рекордным показателем. Для сравнения: в период с 1995 по 2011 год это значение варьировалось в среднем от 5 до 10 месяцев. В целом, суперкомпьютеры эксплуатируются дольше, поскольку создание новых систем обходится очень дорого. А некоторые эксперты полагают, что нынешнее поколение сверхкрупных машин и вовсе будет последним в своём роде.

Постоянный URL: https://servernews.ru/1106485
14.06.2024 [13:30], Сергей Карасёв

AWS выделит $230 млн на поддержку стартапов в области генеративного ИИ, но деньги они вряд ли увидят

Облачная платформа Amazon Web Services (AWS) объявила о выделении $230 млн на поддержку стартапов по всему миру, которые специализируются на разработках в области генеративного ИИ. В частности, продолжится развитие глобальной программы AWS Generative AI Accelerator.

Отмечается, что молодые компании, особенно находящиеся на ранней стадии развития бизнеса, смогут получить поддержку AWS, в том числе наставничество и обучение, для дальнейшего развития технологий ИИ и машинного обучения. Основная часть указанной суммы будет выделена в виде кредитов на использование облачной инфраструктуры Amazon.

Что касается инициативы AWS Generative AI Accelerator, то она была запущена в апреле 2023 года. Цель программы заключается в том, чтобы вывести перспективные стартапы в области генеративного ИИ по всему миру на новый уровень. В рамках второй фазы инициативы на поддержку молодых компаний будет предоставлено около $80 млн. Заявки на участие в AWS Generative AI Accelerator будут приниматься до 19 июля 2024-го.

 Источник изображения: pixabay.com

Источник изображения: pixabay.com

Стартапы могут использовать кредиты AWS для доступа к вычислительным мощностям, платформам хранения, а также к ИИ-ускорителям Trainium и Inferentia2, которые предлагают экономичный и энергоэффективный вариант работы с ИИ-моделями. Кроме того, кредиты можно использовать для доступа к набору инструментов Amazon SageMaker.

AWS Generative AI Accelerator определит лучшие стартапы на ранней стадии, которые используют генеративный ИИ для решения сложных задач в таких областях как финансовые услуги, здравоохранение и биологические науки, СМИ и развлечения, бизнес, экология и пр. Перспективные проекты получат до $1 млн в виде кредитов AWS. Кроме того, компаниям будут предоставляться технические и бизнес-консультации. AWS объявит выбранные стартапы 10 сентября, а сама программа поддержки начнётся 1 октября.

Постоянный URL: https://servernews.ru/1106486
14.06.2024 [12:36], Сергей Карасёв

Western Digital создала самый ёмкий в мире кристалл 3D QLC NAND — на 2 Тбит

Компания Western Digital, по сообщению ресурса Tom's Hardware, продемонстрировала флеш-кристалл 3D QLC NAND самой высокой на сегодняшний день ёмкости, составляющей 2 Тбит (256 Гбайт). Такие изделия, как ожидается, приведут к появлению более вместительных и доступных SSD.

Кристалл изготовлен на основе 218-слойной производственной технологии BiCS8. Это значительное достижение по сравнению с «базовым» решением Western Digital 3D TLC ёмкостью 1 Тбит, которое также выпускается по указанной методике. Скорости чтения/записи нового изделия и показатель IOPS на данный момент не раскрываются.

 Источник изображений: Western Digital

Источник изображений: Western Digital

Кристаллы 3D QLC NAND вместимостью 2 Тбит могут быть оптимизированы по производительности и ёмкости. В первом случае энергоэффективность по сравнению с предыдущим поколением увеличивается до 32 %, во втором заявлено улучшение износостойкости до 60 %.

При объединении четырёх кристаллов нового поколения может быть получен модуль вместимостью 1 Тбайт. А связка из 16 кристаллов даёт возможность создавать SSD объёмом 4 Тбайт. Таким образом, если Western Digital и её партнёр Kioxia смогут организовать массовое производство изделий 3D QLC NAND ёмкостью 2 Тбит, это может привести к появлению сравнительно недорогих накопителей большой вместимости. В результате, Western Digital получит возможность укрепить позиции на мировом рынке SSD, в первую очередь в корпоративном сегменте.

Утверждается, что плотность новых кристаллов Western Digital на 15–19 % выше, чем у конкурентов. При этом прирост производительности достигает 50 %, тогда как энергопотребление в расчёте на 1 Гбайт хранимой информации сокращается на 13 %. Официальный анонс изделий ожидается в ближайшее время.

Постоянный URL: https://servernews.ru/1106481
Система Orphus