Лента новостей
25.12.2024 [01:00], Владимир Мироненко
Гладко было на бумаге: забагованное ПО AMD не позволяет раскрыть потенциал ускорителей Instinct MI300XАналитическая компания SemiAnalysis опубликовала результаты исследования, длившегося пять месяцев и выявившего большие проблемы в ПО AMD для работы с ИИ, из-за чего на данном этапе невозможно в полной мере раскрыть имеющийся у ускорителей AMD Instinct MI300X потенциал. Проще говоря, из-за забагованности ПО AMD не может на равных соперничать с лидером рынка ИИ-чипов NVIDIA. При этом примерно три четверти сотрудников последней заняты именно разработкой софта. Как сообщает SemiAnalysis, из-за обилия ошибок в ПО обучение ИИ-моделей с помощью ускорителей AMD практически невозможно без значительной отладки и существенных трудозатрат. Более того, масштабирование процесса обучения как в рамках одного узла, так и на несколько узлов показало ещё более существенное отставание решения AMD. И пока AMD занимается обеспечением базового качества и простоты использования ускорителей, NVIDIA всё дальше уходит в отрыв, добавляя новые функции, библиотеки и повышая производительность своих решений, отметили исследователи. ![]() Источник изображений: SemiAnalysis На бумаге чип AMD Instinct MI300X выглядит впечатляюще с FP16-производительностью 1307 Тфлопс и 192 Гбайт памяти HBM3 в сравнении с 989 Тфлопс и 80 Гбайт памяти у NVIDIA H100. К тому же чипы AMD предлагают более низкую общую стоимость владения (TCO) благодаря более низким ценам и использованию более дешёвого интерконнекта на базе Ethernet. Но проблемы с софтом сводят это преимущество на нет и не находят реализации на практике. При этом исследователи отметили, что в NVIDIA H200 объём памяти составляет 141 Гбайт, что означает сокращение разрыва с чипами AMD по этому параметру. Кроме того, внутренняя шина xGMI лишь формально обеспечивает пропускную способность 448 Гбайт/с для связки из восьми ускорителей MI300X. Фактически же P2P-общение между парой ускорителей ограничено 64 Гбайт/с, тогда как для объединения H100 используется NVSwitch, что позволяет любому ускорителю общаться с другим ускорителем на скорости 450 Гбайт/с. А включённый по умолчанию механизм NVLink SHARP делает часть коллективных операций непосредственно внутри коммутатора, снижая объём передаваемых данных. Как отметили в SemiAnalysis, сравнение спецификаций чипов двух компаний похоже на «сравнение камер, когда просто сверяют количество мегапикселей», и AMD просто «играет с числами», не обеспечивая достаточной производительности в реальных задачах. Чтобы получить пригодные для аналитики результаты тестов, специалистам SemiAnalysis пришлось работать напрямую с инженерами AMD над исправлением многочисленных ошибок, в то время как системы на базе NVIDIA работали сразу «из коробки», без необходимости в дополнительной многочасовой отладке и самостоятельной сборке ПО. В качестве показательного примера SemiAnalysis рассказала о случае, когда Tensorwave, крупнейшему провайдеру облачных вычислений на базе ускорителей AMD, пришлось предоставить целой команде специалистов AMD из разных отделов доступ к оборудованию с её же ускорителями, чтобы те устранили проблемы с софтом. Обучение с использованием FP8 в принципе не было возможно без вмешательства инженеров AMD. Со стороны NVIDIA был выделен только один инженер, за помощью к которому фактически не пришлось обращаться. У AMD есть лишь один выход — вложить значительные средства в разработку и тестирование ПО, считают в SemiAnalysis. Аналитики также предложили выделить тысячи чипов MI300X для автоматизированного тестирования, как это делает NVIDIA, и упростить подготовку окружения, одновременно внедряя лучшие настройки по умолчанию. Проблемы с ПО — основная причина, почему AMD не хотела показывать результаты бенчмарка MLPerf и не давала такой возможности другим. В SemiAnalysis отметили, что AMD предстоит немало сделать, чтобы устранить выявленные проблемы. Без серьёзных улучшений своего ПО AMD рискует еще больше отстать от NVIDIA, готовящей к выпуску чипы Blackwell следующего поколения. Для финальных тестов Instinct использовался специально подготовленный инженерами AMD набор ПО, который станет доступен обычным пользователям лишь через один-два квартала. Речь не идёт о Microsoft или Meta✴, которые самостоятельно пишут ПО для Instinct. Один из автором исследования уже провёл встречу с главой AMD Лизой Су (Lisa Su), которая пообещала приложить все усилия для исправления ситуации.
25.12.2024 [00:55], Владимир Мироненко
Netflix подал в суд на Broadcom, заявив, что VMware нарушает его патенты в области виртуализацииСтриминговый гигант Netflix подал в понедельник иск к Broadcom в окружной суд США по Северному округу Калифорнии с обвинением принадлежащего ей дочернего предприятия VMware в нарушении пяти патентов, связанных с работой виртуальных машин («патент 424», «патент 707», «патент 891», «патент 893» и «патент 122»). Как сообщает SiliconANGLE, три из этих патентов касаются использования CPU в виртуальных машинах, а два — запуска по крайней мере одной виртуальной машины с использованием балансировщика нагрузки. Согласно иску, нарушения патентов были допущены в VMware vSphere Foundation, VMware Cloud Foundation, VMware Cloud on AWS и облачных решениях, предлагаемых Microsoft, Google, Oracle, IBM и Alibaba. В частности, в вышеуказанных продуктах, по словам Netflix, допущены нарушения «патента 424». Netflix заявил, что VMware умышленно нарушает авторские права с 2012 года, когда она узнала об этом патенте. «Патент 424 был процитирован экспертом Бюро по патентам и товарным знакам США при отклонении заявки VMware, которая в конечном итоге была оформлена как патент США № 8 650 564», — указал Netflix в иске. Учитывая осведомлённость VMware об этом патенте, Netflix утверждает, что Broadcom и VMware занимались «умышленным нарушением», и попросила суд обязать Broadcom возместить убытки, размер которых в иске не указан. Патентная война Netflix и Broadcom началась в 2018 году, когда Broadcom подала в суд на Netflix, обвинив его в нарушении своих патентов на технологию потокового видео. Дела были возбуждены в Калифорнии, Германии и Нидерландах. Судебное разбирательство по иску Netflix запланировано на июнь 2025 года.
24.12.2024 [21:50], Руслан Авдеев
xAI одобрили 150-МВт подключение к энергосети, хотя местные жители опасаются роста цен и перебоев с поставками электричестваИИ-кластер xAI Colossus получил «второе дыхание». Энергоснабжающая компания Tennessee Valley Authority (TVA) решила выделить ему 150 МВт мощностей. Это значительно расширяет возможности вычислительного центра, сообщает TechRadar. В частности, теперь можно запитать от энергосети все 100 тыс. ИИ-ускорителей NVIDIA H100. Ранее такая возможность ставилась под вопрос из-за энергетических ограничений. Местные компании выражали озабоченность тем, как огромное эгнергопотребление скажется на электросети Теннесси. Когда xAI впервые запустила кластер в июле 2024 года, ему было доступно лишь 8 МВт. Поэтом временно для питания задействовали генераторы, дополненные энергохранилищами Tesla Megapack. Летом местная коммунальная компания Memphis Light, Gas & Water (MLGW) обновила имевшуюся подстанцию, чтобы обеспечить xAI подачу 50 МВт. А xAI обязалась построить за $24 млн собственную подстанцию на 150 МВт. Суперкомпьютеру Colossus для эксплуатации всех 100 тыс. ускорителей одновременно требуется около 155 МВт. MLGW и TVA пришлось убеждать местных жителей, рост спроса на энергию со стороны xAI не повлияет на надёжность электроснабжения в районе Мемфиса. По словам MLGW, 150 МВт всё ещё находятся ниже допустимого предела прогнозируемой пиковой нагрузки компании. Предпринимаются меры по обеспечения закупок электричества у TVA, если это будет необходимо. Местные экоактивисты и жители уже жалуются, что совет директоров TVA одобрил запрос xAI на энергию, не изучив последствия такого решения для жителей. Не исключено, что решение негативно скажется на ценах для физических лиц, хотя именно их интересы должны были бы быть в приоритете. В начале декабря сообщалось, что xAI получила ещё $6 млрд инвестиций и приступила к расширению Colossus до 1 млн ускорителей.
24.12.2024 [21:00], Сергей Карасёв
«Гравитон» выпустил первый GPU-сервер на российском процессоре для ИИ и НРСРоссийский производитель вычислительной техники «Гравитон» объявил о начале поставок сервера С2124Б. Это, как утверждается, первое устройство на отечественном процессоре, специально предназначенное для задач ИИ и НРС, включая работу с языковыми моделями. Новинка выполнена в форм-факторе 4U. Задействованы два неназванных 48-ядерных процессора с тактовой частотой 2 ГГц. Поддерживается оперативная память DDR4-3200 ECC. Сервер допускает установку до восьми ускорителей на базе GPU с показателем TDP до 350 Вт: их подключение осуществляется через переходную плату со встроенными PCIe-экспандерами. Могут применяться полноразмерные двухслотовые решения с интерфейсом PCIe 4.0 x16. Заявленная производительность достигает 480 Тфлопс в режиме FP64 и 26,726 Пфлопс в режимах FP8 и INT8. Во фронтальной части С2124Б могут быть размещены до 12 накопителей с интерфейсом SATA или до 12 устройств формата U.3 (NVMe). Кроме того, на лицевую панель выведены гнёзда RJ-45 для сетевых кабелей, а также порты USB Type-A. Питание обеспечивают четыре блока мощностью 1600 Вт каждый в режиме 3+1 или 2+2. «Нам удалось разработать и произвести серверы, так необходимые для сложных вычислений, на отечественном процессоре. Этот продукт станет важным шагом в развитии отечественных вычислительных технологий и позволит нашим клиентам эффективно справляться с вызовами в области обработки данных», — говорит Александр Фильченков, руководитель серверных и сетевых систем «Гравитон». Сервер планируется внести в Реестр российской промышленной продукции Минпромторга России в начале 2025 года: он будет причислен к категории радиоэлектронной продукции 1-го уровня локализации. Приём заказов на новинку уже начался. Потенциальным покупателям также предлагается оформить заявку на тестирование устройства.
24.12.2024 [20:50], Сергей Карасёв
МТС представила российское SD-WAN-решение для корпоративных сетейКомпания МТС анонсировала собственный продукт для программно-определяемых распределённых сетей (SD-WAN) корпоративного уровня. Решение, как утверждается, позволяет улучшать сервис и сокращать затраты без потерь качества. Новый продукт предоставляет корпоративным клиентам единую точку управления и мониторинга межофисной сетевой инфраструктуры. Работа осуществляется через личный кабинет, который, по заявлениям МТС, имеет удобный и интуитивно понятный интерфейс. Программно-определяемые сети (SDN) дают возможность в реальном времени определять доступные линии связи и направлять трафик по оптимальным маршрутам. Решение SD-WAN предоставляет VPN поверх любых каналов, средства онлайн-мониторинга сети в режиме 24/7, инструменты управления трафиком на основе приоритетности, автоматическое резервирование каналов и др. Кроме того, реализованы функции межсетевого экрана для контроля киберугроз и фильтрации проходящего трафика. Одним из преимуществ SD-WAN перед программным VPN является то, что новое решение функционирует как продукт оператора связи и не блокируется техническими средствами контроля. Причём за взаимодействие с регулирующими органами отвечает сама МТС. Кроме того, все элементы сети МТС — телекоммуникационные, аппаратные и программные — предоставляются «под ключ» в рамках одного договора на услуги связи. Компоненты SD-WAN работают на оптимально подобранном оборудовании. Предусмотрена также возможность предоставления услуги в виде виртуальных машин на серверах клиента, что позволяет интегрировать SD-WAN в существующую инфраструктуру. В целом, благодаря SD-WAN заказчики с множеством филиалов смогут быстро автоматизировать процесс управления параметрами сети. Для этого достаточно разово произвести настройки в личном кабинете, после чего изменения автоматически распространятся на всю сеть. В результате, компании смогут снизить операционные расходы и время на администрирование.
24.12.2024 [19:26], Владимир Мироненко
VK запустила инициативу OpenVK для публикации ПО с открытым кодомVK объявила о запуске инициативы OpenVK для публикации ПО с открытым кодом, которая «будет способствовать обмену знаний и опытом между профессионалами ИТ-отрасли», стимулируя развитие сообщества разработчиков благодаря предоставлению доступа к передовым технологиям и инструментам. Главные направления OpenVK: ИТ-системы и продукты, инструменты и библиотеки для разработчиков, а также ИИ-модели. Уже сейчас на OpenVK доступны платформа Tarantool для создания высоконагруженных приложений, система визуализации данных для мониторинга StatsHouse, дизайн-система VKUI для создания удобных пользовательских интерфейсов, инструмент для патчинга байт‑кода Android‑приложений ByteWeaver, ИИ-модели и библиотеки для их создания и т.д. В их числе есть и модель для синтеза речи EmoSpeech, которая позволяет генерировать эмоциональную и естественную речь. Согласно пресс-релизу, ресурс будет регулярно пополняться новыми продуктами, которые также принесут пользу сообществу разработчиков решений с открытым кодом. «Открытый исходный код — основной драйвер развития IT во всём мире. Без него нейросети, быстрые базы данных и современный интернет могли бы не появиться», — отметила VK, одна из первых компаний в России, которые открыли исходный код собственных проектов. «Мы понимаем, что надо не только брать из open source, но и отдавать. Поэтому мы хотим делиться функциональными инструментами и разработками, которые были созданы внутри VK и принесут реальную пользу сообществу», — подчеркнула VK.
24.12.2024 [15:41], Сергей Карасёв
Sipeed выпустила NanoKVM-PCIe — плату расширения IP-KVM с OLED-дисплеем и Wi-Fi 6Компания Sipeed анонсировала решение NanoKVM-PCIe — плату расширения с интерфейсом PCIe для организации удалённого управления IP-KVM (Keyboard, Video, Mouse). Изделие может применяться в настольных рабочих станциях, а также в стоечных серверах. Новинка представляет собой альтернативу крошечному модулю NanoKVM, вышедшему летом нынешнего года. В основу NanoKVM-PCIe положен чип Sophgo SG2002, который объединяет два ядра C906 с архитектурой RISC-V (1000 и 700 МГц), одно ядро Arm Cortex-A53, а также контроллер 8051 с частотой от 25–300 МГц. Есть нейропроцессорный блок с производительностью до 1 TOPS (INT8) и 256 Мбайт памяти DDR3. Карта располагает слотом microSD, интерфейсом HDMI с поддержкой видео 1080p60, сетевым портом 10/100MbE RJ45 с опциональной поддержкой PoE, а также двумя разъёмами USB Type-C. Дополнительно в оснащение может быть включён адаптер Wi-Fi 6 с коннектором для антенны. Особенность NanoKVM-PCIe заключается в наличии небольшого информационного OLED-дисплея с диагональю 0,49″ и разрешением 64 × 32 точки: этот экран расположен на монтажной планке. Плата имеет низкопрофильное исполнение с габаритами 66 × 57 × 18 мм. Питание (0,2 A / 5 В) может подаваться через слот PCIe, порт USB Type-C или посредством PoE. Применяется прошивка с поддержкой управления UEFI/BIOS, эмулированными USB-мышью/клавиатурой и USB-накопителем, IPMI, WoL, Tailscale, WebSSH и пр. компания Sipeed принимает предварительные заказы на новинку по цене от $42 до $58 в зависимости от выбранных опций.
24.12.2024 [14:01], Руслан Авдеев
«Открытые сетевые технологии» закрылись — ассоциация выполнила свои задачиАссоциация «Открытые сетевые технологии», учредителями которой выступали АНО «Телекоммуникационные технологии» (АНО ТТ), МТС, ГК «Криптонит» и Сколтех, прекратила существование. В ассоциацию также входили ПАО «МегаФон», ПАО «ВымпелКом», Ижевский радиозавод (ИРЗ), Дальневосточный федеральный университет (ДВФУ) и ассоциация вузов ЭКБ. Президент ассоциации объявил, что она выполнила поставленные перед ней задачи, сообщает ComNews. Процедура ликвидации юридического лица началась 10 октября 2024 года. По словам её бывшего президента Андрея Ушацкого, ключевой целью была организация взаимодействия производителей телекоммуникационного оборудования, независимых разработчиков ПО, операторов связи и других участников рынка IT и телекоммуникаций. Теперь ключевые игроки активно взаимодействуют в работе над российскими сетями связи и без специального «посредничества». ![]() Источник изображения: Michael Förtsch/unsplash.com Предполагалось, что поддержка производителей телеком-оборудования и разработчиков ПО позволила бы выйти на рынок новым поставщикам и более эффективно развивать телекоммуникационные сети. Использование открытых стандартов обеспечило бы благоприятную среду для развития российских поставщиков программных и аппаратных решений. Среди последних крупных проектов — проверка работоспособности отечественного решения 5G OpenRAN в 2022 году. В начале декабря сообщалось, что на создание российских базовых станций за три года будет направлено почти 17 млрд руб. В следующем году мобильным операторам России понадобится от 30 до 50 тыс. базовых станций. В среднесрочной перспективе для поддержания мобильной инфраструктуры в стабильном состоянии необходимо ежегодно вводить 50–80 тыс. новых станций. Для повышения пропускной способности сетей и укрепления позиций России в мировых рейтингах потребуется монтаж от 100 до 150 тыс. станций ежегодно.
24.12.2024 [13:01], Руслан Авдеев
Бразильские власти одобрили создание гигантского «ИИ-города» Scala Data CentersБразильский город Эльдораду-ду-Сул (штата Риу-Гранди-ду-Сул) принял закон, разрешающий строительство кампуса ЦОД AI City компании Scala Data Centers. Документ позволяет изменить городское зонирование и упростит бюрократические процедуры для «мегакомплекса», сообщает пресс-служба оператора. По последним данным, периметр городского зонирования будет расширен, чтобы включить предложенную площадку, предназначенную для строительства кампуса. Муниципалитет одобрил закон 3 декабря 2024 года, а 18 декабря он был окончательно утверждён. Предполагается, что проект позволит создать 3 тыс. рабочих мест — напрямую или косвенно. На начальном этапе предполагается инвестировать R$3 млрд ($490 млн), ёмкость составит 54 МВт. Суммарные инвестиции в проект могут достичь $90 млрд. Весь кампус AI City площадью 700 га в конечном итоге обеспечит ёмкость 4,75 ГВт. Относительно умеренный климат юга Бразилии позволяет обеспечить лучшие показатели PUE в латинской Америке на уровне 1,2, а индекс использования воды WUE и вовсе равен нулю, поскольку её применение в системах охлаждения не предусмотрено. Ожидается, что появление кампуса положительно скажется на экономике штата, в частности, секторе возобновляемой энергетики, за счёт которой ЦОД будут снабжаться на 100 %. По мнению местных чиновников, он дополнительно ускорит внедрение ветряных электростанций, что тоже очень важно для штата, поскольку масштабирование проекта ЦОД привлечёт инвестиции и в энергетику для удовлетворения потребностей дата-центров. В регионе уже имеются компании, заинтересованные в поставках возобновляемой энергии для нового кампуса. В августе Scala анонсировала инвестиции в компанию Serena Energia для поставки энергии ветряных электростанций. Основанная в 2020 году после покупки DigitalBridge имущества бразильской IT-компании UOL Diveo, Scala инвестировала около $1,6 млрд в дата-центры гиперскейл-уровня в Бразилии, Чили, Мексике и Колумбии. Ранее в 2024 году компания получила $500 млн на развитие от внешних инвесторов. О создании AI City сообщалось ещё в сентябре, но только теперь проект был официально одобрен и получил законодательную поддержку.
24.12.2024 [12:18], Руслан Авдеев
США планируют внести в чёрный список компанию Sophgo — она подозревается в выпуске на TSMC ИИ-чипов в интересах HuaweiАдминистрация действующего президента США Джо Байдена (Joe Biden) намерена внести в чёрный список компанию из КНР, якобы разработавшую и заказавшую у TSMC чипы, использовавшиеся в ИИ-решениях Huawei. Последняя применяла их в ускорителях Ascend 910B, сообщает Reuters. Речь идёт о китайской Sophgo, дочерней структуры поставщика оборудования для майнинга Bitmain. Это последняя в списке компаний, которые США намерены наказать за помощь Huawei. Сейчас она находится на очереди для включения в «чёрный список» Entity List, куда отправляются компании, например, угрожающие национальной безопасности или внешнеполитическим интересам Соединённых Штатов. В этом месяце Министерство торговли США уже внесло в чёрный список ряд других компаний, посчитав их частью «теневой сети» китайского техногиганта. Представители американских властей ситуацию не комментируют, а Sophgo ещё в октябре заявляла, что никогда не была прямо или косвенно вовлечена в дела с Huawei. Согласно открытым данным, компания является поставщиком китайских органов власти и государственных компаний вроде China Telecom. Также её ИИ-чипы закупались государственными университетами для разработки ИИ-инструментов и полицией для совершенствования систем видеонаблюдения. ![]() Источник изображения: Huawei Компания TechInsights разобрала ИИ-ускоритель Huawei 910B и помимо прочего обнаружила в нём чип производства TSMC, а тот уже донёс сведения до Министерства торговли США. После того как выяснилось, что собственно разработкой занималась Sophgo, TSMC прекратила её поставки. С Huawei сотрудничество TSMC прекратилось ещё в 2020 году. В TSMC отказываются комментировать результаты расследования, но, по данным Reuters, 11 ноября США просто приказали компании прекратить поставки в Китай передовых чипов, выполненных в соответствии с техпроцессом до 7 нм включительно — те модели, которые можно использовать для ИИ. В октябре Huawei объявила, что не выпускала никаких чипов с помощью TSMC с 2020 года и отказалась комментировать последние новости. Ускоритель компании Ascend 910B, выпущенный в 2022 году, считается её самым передовым вариантом. В начале 2025 года Huawei намерена начать выпуск чипов модели Ascend 910C, конкурента NVIDIA H100. В феврале сообщалось, что Sophgo договорилась с российской Softlogic о поставках последней тензорных ИИ-процессоров. |
|