Материалы по тегу: s
19.03.2024 [01:37], Сергей Карасёв
NVIDIA и Siemens внедрят генеративный ИИ в промышленное проектирование и производство
gtc 2024
nvidia
omniverse
siemens
software
ии
облако
производство
промышленность
разработка
цифровой двойник
Компании NVIDIA и Siemens сообщили о расширении сотрудничества с целью внедрения иммерсивной визуализации и генеративного ИИ в промышленное проектирование и производство. В частности, Siemens интегрирует новый программный интерфейс NVIDIA Omniverse Cloud API в свою платформу Xcelerator. Напомним, Omniverse Cloud представляет собой комплексный пакет облачных сервисов, позволяющих проектировать, публиковать, эксплуатировать и тестировать приложения метавселенной вне зависимости от местонахождения. В свою очередь, Xcelerator — интегрированный пакет ПО и сервисов для разработки приложений. NVIDIA и Siemens совмещают платформы Omniverse и Xcelerator, выводя промышленную автоматизацию на новый уровень. Партнёры объединяют обширную промышленную экосистему Xcelerator и физически точный механизм создания виртуального мира в реальном времени с поддержкой ИИ. Это позволяет создавать точные реалистичные цифровые двойники. В рамках сотрудничества Siemens, в частности, интегрирует NVIDIA Omniverse Cloud API в состав Teamcenter X (входит в Xcelerator). Облачная система Teamcenter X предоставляет пользователям безопасный доступ к данным управления жизненным циклом изделия (PLM) из любой точки мира, с любого устройства и в любое время. Благодаря использованию API Omniverse могут быть ускорены различные рабочие процессы при создании цифровых двойников, такие как изменение условий освещения, применение тех или иных материалов и пр. Отмечается, что традиционно компании в значительной степени полагались на физические прототипы при реализации крупномасштабных промышленных проектов. Такой подход является дорогостоящим, ограничивает инновации и замедляет время выхода решений на рынок. Совместная инициатива Siemens и NVIDIA позволяет устранить указанные препятствия путём создания фотореалистичных цифровых двойников, учитывающих физику реального мира. Это означает, что такие компании, как HD Hyundai (занимается судостроением, тяжёлым оборудованием и машиностроением), могут унифицировать и визуализировать сложные инженерные проекты непосредственно в Teamcenter X. В частности, API USD Query позволяет пользователям Teamcenter X перемещаться и взаимодействовать с физически точными объектами, тогда как API USD Notify обеспечивает автоматическое обновление дизайна и сцен в режиме реального времени. В дальнейшем Siemens планирует внедрить технологии NVIDIA и в другие продукты Xcelerator.
15.03.2024 [23:15], Владимир Мироненко
Amazon и Microsoft заблокируют 20 марта облачные сервисы для клиентов из РоссииMicrosoft разослала клиентам в России уведомление о том, что 20 марта прекратит подписки «на определённое программное обеспечение для управления или проектирования (включая облачные решения) для организаций, зарегистрированных в России», сообщила в своём Telegram-канале вице-президент по инвестициям Softline Елена Волотовская. По факту это может означать полное отключение доступа к облачным решениям, отметила она, добавив, что аналогичные уведомления получили российские клиенты Amazon. В письме Microsoft сообщается, что решение было принято в связи со вступлением с 20 марта в силу санкций ЕС в отношении России. «Microsoft должна прекратить действие этих подписок к 20 марта 2024 года, до будущих указаний ЕС, которые изменят это решение, или общего или специального разрешения от регулирующих органов ЕС. После 20 марта 2024 года вы не сможете получить доступ к этим продуктам или услугам Microsoft, а также к любым данным, хранящимся в них», — указано в документе. В связи с этим компания Softline рекомендовала российским компаниям, которые до сих пор пользуются услугами этих компаний, в оперативном порядке сделать резервное копирование данных со всех облачных сервисов Microsoft, Amazon и Google, в т.ч. на местах пользователя. Компания также создала информационный канал, где заказчики иностранных облачных решений смогут найти ответы и оперативно проконсультироваться по проблемам, которые могут возникнуть с 20 марта 2024 года. Некоторые другие игроки оперативно отреагировали на сложившуюся ситуацию. Так, в TrueConf сообщили о решении открыть горячую линию и начать предоставлять бесплатные лицензии на сервер ВКС и корпоративный мессенджер TrueConf Server всем организациям, срочно ищущим замену решениям Microsoft Teams и Skype for Business. Похожее предложение есть и у DION. UPD 16.03.2024: появились уточнения относительно того, что будет заблокировано Microsoft — Azure (в том числе Azure Stack) и все компоненты Microsoft 365. Кроме того, возможна деактивация развёрнутых локально Microsoft Office, SQL Server, BizTalk Server, System Center, Visual Studio. Windows Server и клиентские Windows, вероятно, затронуты не будут.
14.03.2024 [23:45], Алексей Степин
Войны ретаймеров: Astera Labs анонсировала чипы Aries 6 для PCIe 6.0Практически сразу после анонса чипов Broadcom Vantage 5 и 6 Astera представила свой вариант ретаймеров для инфраструктуры PCIe следующего поколения — серию чипов Aries 6, передаёт ServeTheHome. Высокий интерес к ретаймерам вызван теми возможностями, что открывает PCI Express 6.0 как в плане скоростей, так и в плане функциональности (CXL). А переход на новое поколение шины необходим для дальнейшего развития набирающего популярность генеративного ИИ. По мере роста скоростей PCI Express обострялась и проблема длины проводников на печатной плате, при которой сигнал достаточно устойчив и вписывается в окно требуемых характеристик. Если при переходе от PCIe 3.0 к 4.0 удалось обойтись сравнительно малой кровью, то для PCIe 5.0 уже потребовались более сложная схемотехника и более продвинутые ретаймеры. PCIe 6.0 же накладывает ещё более жёсткие требования к целостности сигнала. Платформы GPU-кластеров и СХД компактнее не становятся, так что требуемая длина проводников на печатных платах растёт, а вместе с ней растёт и важность ретаймеров, поскольку без них согласовать высокоскоростной сигнал PCIe 6.0 становится невозможно. Таким системам требуется сразу несколько подобных чипов, причём стоимость каждого из них достигает $20, так что суммарная стоимость этих компонентов на уровне целого ЦОД весьма внушительна. Новые чипы Aries 6 относятся к третьему поколению «умных» DSP-ретаймеров. Они представлены в вариантах с 8 и 16 линиями PCIe 6.0 и позволяют в три раза увеличить длину соответствующего соединения на плате, говорит Astera Labs. При этом новинки поддерживают CXL 3.x и предоставляют расширенные средства диагностики и управления COSMOS. Энергопотребление в режиме PCIe 6.0 при этом заявлено меньше, чем у Broadcom Vantage 6 — 11 Вт против 13 Вт у конкурента. Aries 6 уже протестированы на совместимость с полсотней разнообразных PCIe-соединений, включая root-комплексы и конечные устройства. И если Broadcom пока только говорит о ретаймерах для PCIe 6.0, а появление первого «кремния» Vantage 6 запланировано лишь на следующий год, то Astera Labs начала поставки образцов Aries 6 ещё в феврале. Похоже, Broadcom будет нелегко развернуться на этом рынке.
13.03.2024 [22:40], Алексей Степин
Больше флопс за те же ватты: Cerebras представила царь-ускоритель WSE-3 и подружилась с QualcommКомпания Cerebras Systems, известная своими разработками в области сверхбольших ИИ-процессоров, рассказала о третьем поколении чипов Wafer Scale Engine. В своё время компания произвела фурор, представив процессор, занимающий всю площадь кремниевой пластины (46225 мм2). В первом поколении WSE речь шла о 1,2 трлн транзисторов при 400 тыс. ядер и 18 Гбайт сверхбыстрой памяти. WSE-2 состоял из 2,6 трлн транзисторов, имел 850 тыс. ядер и 40 Гбайт интегрированной памяти. В WSE-3 разработчики перешли на использование 5-нм техпроцесса TSMC, что позволило разместить на пластине такого же размера уже 4 трлн транзисторов, составляющих 900 тыс. ядер и 44 Гбайт SRAM. Суммарная пропускная способность набортной памяти достигает 21 Пбайт/с, а внутреннего интерконнекта — 214 Пбит/с. Казалось бы, выигрыш в количестве ядер по сравнению с WSE-2 не так уж велик, однако на этот раз Cerebras сделала упор на архитектуру. Если верить заявлениям разработчиков, WSE-3 практически вдвое быстрее WSE-2 при сопоставимом уровне энергопотребления (15 кВт) и той же цене: 125 Пфлопс против 75 Пфлопс в разреженных FP16-вычислениях. WSE-3 в 62 раза быстрее NVIDIA H100, хотя и сам чип WSE-3 в 57 раз больше. WSE-3 по-прежнему требует специфического окружения. Он станет сердцем новой системы CS-3 (23 кВт), содержащей всю необходимую сопутствующую инфраструктуру, включая СЖО, подсистемы питания, а также сетевого интерконнекта Ethernet. Последний не изменился и состоит из 12 каналов со скоростью 100 Гбит/с. Для подготовки «сырых» данных по-прежнему будет использоваться внешний суперсервер. А для их хранения будут использоваться узлы MemoryX ёмкостью до 1200 Тбайт (1,2 Пбайт). Главной задачей CS-3 станет «натаскивание» сверхбольших языковых моделей, в 10 раз превышающих по количеству параметров GPT-4 и Google Gemini. Cerebras говорит о 24 трлн параметров, причём без необходимости различных ухищрений для эффективного распараллеливания процесса обучения, что требуется в случае с GPU-кластерами. По словам компании, для обучения Megatron 175B на таких кластерах требуется 20 тыс. строка кода Python/C++/CUDA, а в случае WSE-3 потребуется лишь 565 строк на Python. CS-3 поддерживает масштабирование вплоть до 2048 систем. Такая конфигурация вкупе с MemoryX сможет обучить модель типа Llama 70B всего за день. Первый суперкомпьютер на базе CS-3 — 8-Эфлопс Condor Galaxy 3 — будет скромнее и получит всего 64 стойки CS-3, которые разместятся в Далласе (США). В совокупности с уже имеющимися кластерами на базе CS-1 и CS-2 вычислительная мощность систем Cerebras должна достигнуть 16 Эфлопс. В сотрудничестве c группой G42 запланировано создание ещё шести систем CS-3, что в сумме позволит довести производительность до 64 Эфлопс. Condor Galaxy 3 будет отличаться от предшественников ещё одним нововведением: в рамках сотрудничества с Qualcomm Cerebras установит в новом кластере существенное число инференс-ускорителей Qualcomm Cloud AI100 Ultra. Каждый такой ускоритель имеет 64 ядра, 128 Гбайт памяти LPDDR4x, потребляет 140 Вт и развивает 870 Топс на INT8-операциях. Причём програмнный стек полностью интегрирован, что позволит в один клик запустить обученные WSE-3 модели на ускорителях Qualcomm. Сотрудничество Cerebras и Qualcomm носит официальный характер, его целью является оптимизация ИИ-моделей для запуска на AI100 Ultra с учетом различных продвинутых техник, таких как разреженные вычисления, спекулятивное исполнение (сочетание малых LLM для получения быстрого результата с проверкой большой LLM), использование «сжатого» формата MxFP6 для весов и других. Благодаря мощностям, предоставляемым WSE-3, цикл разработки, оптимизации и тестирования таких моделей удастся существенно ускорить, что в итоге должно обеспечить десятикратное улучшение удельной производительности новых решений.
11.03.2024 [16:47], Алексей Степин
Synopsys завершила разработку платформы Ethernet 1,6 Тбит/сИзвестный разработчик микроэлектроники, компания Synopsys сообщила о завершении работ над новым сверхскоростным вариантом Ethernet, способным работать на скорости 1,6 Тбит/с, что вдвое превышает достигнутые коммерческими решениями на сегодня скорости. Эта разработка нацелена главным образом на рынок крупных ЦОД, особенно связанных с ИИ-технологиями, предъявляющими высокие требования к характеристикам сетевых каналов и интерконнектов. В настоящее время стандарт 1.6TbE не ратифицирован IEEE, и случится это не ранее 2026 года, но Synopsys считает, что применение её наработок в этой области позволит производителям микрочипов начать работу над созданием соответствующих контроллеров уже сейчас. Предварительная версия стандарта 802.3dj, описывающего базовые характеристики таких устройств, должна быть завершена уже в этом году. Дизайн IP-блоков, созданный Synopsys, базируется именно на 802.3dj. Он предусматривает скорости 4 × 400 Гбит/с, 2 × 800 Гбит/с, либо один канал со скоростью 1,6 Тбит/с. В разработке используются блоки SerDes со скоростью 112 и 224 Гбит/с, отвечающие спецификациям OIF-112G и OIF-224G соответственно. В IP-решении Synopsys используются трансмиттеры PAM4, в которых реализована продвинутая обработка сигнала (feed-forward equalization), ресиверы же содержат продвинутый DSP. Это сочетание позволяет соединению работать при потере сигнала в канале, составляющей 45 дБ. Synopsys утверждает, что её технологии позволят реализовать Ethernet со скоростью 1,6 Тбит/с с 50 % экономией площади кремния. Продвинутая архитектура коррекции ошибок при этом должна обеспечить латентность на 40 % ниже в сравнении с классической реализацией. В состав решения Synopsys входят блоки MAC, PCS, контроллер физического уровня (PHY) на основе прошедших тестирование и доказавших свою эффективность SerDes-блоков 224G, а также IP-модуль верификации, который должен помочь разработчикам чипов ускорить и упростить разработку новых сверхскоростных Ethernet-чипов. Все IP-компоненты доступны сейчас и ими уже воспользовались многочисленные клиенты, сообщает Synopsys. Новая разработка Synopsys получила одобрение со стороны консорциума Ethernet.
09.03.2024 [13:51], Сергей Карасёв
Astera Labs рассчитывает привлечь в ходе IPO более $500 млнСтартап Astera Labs поделился подробностями о процедуре первичного публичного размещения акций (IPO), осуществить которую планируется в ближайшее время. Компания рассчитывает привлечь свыше $500 млн и получить оценку приблизительно $4,0–$4,5 млрд. Информация о планах Astera Labs по выходу на биржу появилась в начале февраля 2024 года. Тогда говорилось, что процедура может состояться в марте. Позднее стартап направил документы об IPO в Комиссию по ценным бумагам и биржам США (SEC). И вот теперь раскрыты детали об этом процессе. ![]() Источник изображения: Astera Labs Предложение включает 14 788 903 обыкновенные акции, которые предоставит собственно Astera Labs, и 3 011 097 обыкновенных ценных бумаг, которые будут проданы некоторыми из существующих акционеров компании. Таким образом, общий объём размещения составляет 17 800 000 акций. Ожидается, что цена бумаг в ходе IPO окажется на отметке $27–$30. В случае размещения по верхней границе указанного диапазона Astera Labs сможет получить до $534 млн. Кроме того, андеррайтеры будут иметь 30-дневный опцион на приобретение до 2 670 000 дополнительных обыкновенных акций у Astera Labs по цене первоначального публичного размещения. Бумаги начнут торговаться на Nasdaq Global Select Market под тикером «ALAB». Помощь в осуществлении IPO окажут Morgan Stanley, JP Morgan, Barclays, Deutsche Bank Securities, Evercore ISI, Jefferies, Needham & Company, Stifel, Craig-Hallum Capital Group, Roth Capital Partners, Loop Capital Markets и Siebert Williams Shank.
07.03.2024 [14:12], Владимир Мироненко
Индивидуальный подход: разработчик специализированных ИИ-чипов Taalas привлёк $50 млн инвестицийСтартап Taalas Inc., занимающийся разработкой специализированных чипов ИИ, объявил о выходе из скрытого режима (stealth mode) и привлечении $50 млн инвестиций в ходе двух раундов финансирования, которые возглавили Quiet Capital и венчурный капиталист Пьер Ламонд (Pierre Lamond). Taalas была основана выходцами из Tenstorrent, ещё одного разработчика ИИ-ускорителей. Практически все чипы ИИ оптимизированы для ускорения перемножения матриц, что необходимо для работы нейронных сетей, отметил ресурс SiliconANGLE. Некоторые чипы имеют дополнительные оптимизации, ориентированные на конкретные случаи использования ИИ. Например, ИИ-ускоритель NVIDIA H200 оснащён увеличенным объёмом высокоскоростной памяти для ускорения инференса больших языковых моделей (LLM). Taalas занимается дальнейшим развитием этой концепции. Как сообщил ресурс The Information, компания разрабатывает ускорители, которые не просто оптимизированы для обработки ИИ-нагрузок, а построены с учётом требований конкретной нейронной сети. Компания считает, что такой подход сделает её чипы значительно быстрее, чем ИИ-ускорители общего назначения от ведущих производителей. ![]() Источник изображения: Taalas «Коммерческое использование ИИ требует 1000-кратного улучшения вычислительной мощности и эффективности — цель, которая недостижима с помощью нынешних поэтапных подходов, — заявил Любиша Бажич (Ljubisa Bajic), сооснователь и гендиректор Taalas. — Путь вперёд — реализовать внедрение моделей глубокого обучения в кремнии — это самый верный путь к устойчивому ИИ». Разработка собственного ускорителя может занять годы и потребовать сотни миллионов долларов инвестиций. Также создание чипов, оптимизированных для разных алгоритмов искусственного интеллекта, вероятно, будет сопряжено с серьезными техническими проблемами. С целью их решения компания разрабатывает автоматизированный рабочий процесс проектирования, который, по её словам, позволит ускорить вывод полупроводников на рынок. Один из разрабатываемых Taalas чипов будет содержать достаточно памяти для хранения «большой модели ИИ» без надобности во внешней оперативной памяти, что позволит ускорить обработку данных. Taalas планирует выпустить свой первый чип для больших языковых моделей в III квартале 2024 года и начать его поставку клиентам в I квартале 2025 года.
06.03.2024 [23:05], Владимир Мироненко
AWS отменила плату за выгрузку данных при переезде на другую платформу, последовав примеру Google CloudAmazon Web Services Inc. сообщила об отмене так называемой «платы за выход», которую взимала с клиентов при перемещении больших объёмов данных из своего облака в связи с переходом на другую платформу. Ранее о таком же решении объявила Google Cloud. Компания заявила в своём блоге, что предложение нацелено на пользователей, которые хотят навсегда перенести большие объёмы данных из AWS. Как полагает ресурс SiliconANGLE, решение AWS связано с требованиями Европейского закона о данных (EU Data Act), принятого в январе этого года и заставившего облачных провайдеров упростить переход клиентов к конкурентам. Требования закона вступят в силу позже в этом году. Вместе с тем в AWS заявили, что её предложение также распространяется на клиентов, использующих мультиоблачный подход, и на тех, кто хочет вернуть свои данные назад. До этого AWS позволила клиентам бесплатно выгружать до 100 Гбайт данных со своих облачных платформ, но для крупнейших клиентов этого было явно недостаточно. Плата за исходящий трафик была значительной, и они фактически оказались заложниками облака Amazon. Компания сообщила в своем блоге, что клиентам, прежде чем перенести свои данные на альтернативную платформу, необходимо будет связаться с сотрудниками службы поддержки. После утверждения заявки клиента ему будет предоставлено достаточное количество кредитов на передачу данных для выполнения миграции. Предоставленные кредиты DTO будут действительны в течение 60 дней. За это время клиент должен полностью завершить переход. Подход к миграции Amazon почти такой же, как у Google Cloud, хотя есть различия. Google Cloud тоже требует, чтобы клиенты получили одобрение, прежде чем приступить к реализации перехода, но настаивает на том, чтобы клиенты полностью закрыли свои учётные записи, чтобы можно было претендовать на предоставление кредитов, тогда как AWS этого не делает.
05.03.2024 [21:51], Руслан Авдеев
AWS и DataVolt потратят $10 млрд на строительство ЦОД в Саудовской АравииВласти Саудовской Аравии заявили, что компании, включая Amazon Web Services (AWS) намерены вложить более $10 млрд в строительство дата-центров на территории страны. Bloomberg сообщает, что пустынное королевство намерено диверсифицировать и модернизировать зависимую от нефти экономику в рамках инициативы Saudi Vision 2030. Сделки анонсировали в ходе ежегодного мероприятия LEAP в столице Эр-Рияде. Предполагается поддержка развития на территории Саудовской Аравии технических стартапов. Одна только AWS потратит $5,3 млрд на создание нового облачного региона к 2026 году, а также поможет в обучении местных разработчиков. В прошлом году техногигант наряду с Google и Microsoft открыл в стране региональную штаб-квартиру — меры были приняты в ответ на новые правила, согласно которым зарубежные компании должны организовать деятельность в стране, чтобы избежать потери государственных контрактов. Масштабные инвестиции Amazon станут своеобразным магнитом для других компаний и привлечения иностранных средств, пишет Bloomberg — страна намерена стать технологическим хабом для всего Ближнего Востока. Ещё $5 млрд инвестирует местный оператор ЦОД DataVolt на строительство кампуса ёмкостью более 300 МВт. IBM намерена выделить $250 млн на центр по разработке ПО, а сервис-провайдер ServiceNow потратит $500 млн на локализацию своих сервисов. Намерена открыть центр производства и выполнения заказов в стране и компания Dell. По данным Datacenter Dynamics, многие зарубежные бизнесы временно приостанавливали инвестиции в Саудовскую Аравию с 2018 года по политическим мотивам, но уже в конце 2020 года Google без лишнего шума анонсировала открытие облачного региона в Саудовской Аравии при сотрудничестве с нефтяной Aramco — регион запустили ещё в прошлом ноябре. Microsoft тоже строит ЦОД и выступает против призывов правозащитников и политиков отменить строительство. Наконец, в последние годы регионы запустили Oracle и Huawei. Более того, по некоторым данным саудовские спецслужбы, возможно, взламывали смартфон основателя Amazon Джеффа Безоса (Jeff Bezos), но, похоже, между властями Саудовской Аравии и AWS всё же достигнут необходимый баланс интересов для дальнейшего развития бизнеса Amazon в стране.
05.03.2024 [18:59], Руслан Авдеев
Атомное облако: AWS приобрела гигаваттный кампус ЦОД, запитанный от АЭСОблачный гигант Amazon Web Services (AWS) приобрёл у Talen Energy Corporation кампус ЦОД, строящийся у атомной электростанции Susquehanna в Пенсильвании (США). По данным Datacenter Dynamics, ещё на минувшей неделе Talen объявила о продаже кампуса «крупному облачному провайдеру». В презентации для инвесторов было раскрыто, что речь идёт об AWS. Кампус Cumulus Data площадью более 485 га впервые анонсировали ещё в 2021 году — он находится в непосредственной близости от принадлежащей Talen АЭС мощностью 2,5 ГВт. Компания начала строительство в 2021 году и завершила первый объект гиперскейл-уровня на 28,9 тыс. м2 и 48 МВт в 2023 году. Параллельно возводилась отдельная ферма для криптомайнинга для компании TeraWulf, но она, похоже, не является частью сделки с Amazon. Площадка и активы Cumulus Data проданы за $650 млн — $350 млн выплачены сразу, ещё $300 млн будут выплачены после завершения этапов строительства, запланированных на 2024 год. Дополнительно предусмотрена и гарантированная продажа «безуглеродной» электроэнергии станции Susquehanna по фиксированной цене, которая может быть пересмотрена только через 10 лет. В Talen уже сообщили, что довольны сделкой, которая принесла выгода и обеспечила возврат инвестиций. Ожидается, что в конечном итоге ёмкость кампуса AWS достигнет 960 МВт. У компании есть обязательства по минимальному потреблению энергии, они будут увеличиваться в течение нескольких лет с шагом в 120 МВт. Впрочем, у AWS остаётся возможность единовременно ограничить обязательства лимитом в 480 МВт. В рамках сделки предусмотрены и другие договорённости. Например, Talen обязуется поставлять с АЭС электричество кампусу AWS в рамках PPA. Электростанция Susquehanna Steam Electric мощностью 2,5 ГВт была сдана в эксплуатацию в 1983 году — это одна из крупнейших атомных станций в США. Теперь ей владеет Talen Energy, основанная в 2015 году. В 2020 году компания основала Cumulus Growth для инвестиций «на стыке цифровой инфраструктуры и энергетики», а также Cumulus Coin, занимающуюся майнингом криптовалют. В России с 2018 года действует дата-центр «Калининский», расположенный у одноимённой АЭС в Тверской области. |
|