Материалы по тегу: ии
|
24.06.2026 [18:24], Владимир Мироненко
OpenAI и Broadcom представили кастомный ускоритель Jalapeño для ИИ-инференсаOpenAI и Broadcom представили кастомный чип Jalapeño, разработанный в тесном сотрудничестве «в соответствии с видением OpenAI будущего инференса LLM». Согласно первым тестам, ускоритель первого поколения обеспечивает производительность на ватт значительно выше, чем у современных аналогов. Как сообщает OpenAI, Jalapeño был разработан с нуля для текущих и будущих LLM. Благодаря использованию ИИ-моделей OpenAI от начала проектирования до выхода на производство чипа потребовалось всего лишь девять месяцев. OpenAI отметила, что разрабатывала Jalapeño, «руководствуясь своим планом развития моделей, ядер, систем обслуживания и потребностей продукта, совместно с партнёрами Broadcom и Celestica». Чип спроектирован не как отдельный ускоритель, а как часть масштабируемого програмнно-аппаратного комплекса. Инженерные образцы Jalapeño работают в лаборатории с задачами машинного обучения на целевой частоте и энергопотреблении, включая GPT‑5.3‑Codex‑Spark. Компания пообещала предоставить подробный технический отчёт о производительности ускорителя в ближайшие месяцы. Как сообщает Bloomberg, по словам генерального директора Broadcom Хока Тана (Hock Tan), на данный момент ускоритель демонстрирует экономию средств примерно на 50 % по сравнению с типовыми ИИ-ускорителями. Сообщается, что архитектура чипа снижает перемещение данных и обеспечивает баланс вычислительных и сетевых ресурсов, а также памяти для достижения фактического использования, гораздо более близкого к теоретической пиковой производительности. Реализация аппаратных и сетевых технологий Broadcom, включая Tomahawk, помогают вывести платформу на крупномасштабный производственный уровень. OpenAI отметила, что стремится создать полный стек для продукта. Она не только разрабатывает передовые модели и решения на их основе. Компания проектирует инфраструктуру под ними: архитектуру чипов, ядра, системы памяти, сети, управление, системы развёртывания и пользовательский опыт. Благодаря этому каждый слой стека может быть оптимизирован для достижения главной цели компании: сделать свои модели быстрее, надёжнее и доступнее для пользователей. Стремясь оптимизировать затраты на ИИ-инфраструктуру, Amazon (Trainium), Google (TPU), Meta✴ (MTIA) и Microsoft (Maia) тоже работают над собственными кастомными ИИ-ускорителями. Во многом это связано и с желанием снизить зависимость от чипов NVIDIA.
24.06.2026 [12:50], Руслан Авдеев
Microsoft запустила свой самый мощный ИИ ЦОД Fairwater в Висконсине — через два года после анонсаОфициально заработал самый мощный дата-центр Microsoft, расположенный в Маунт-Плезант (Mount Pleasant, Висконсин). Компания объявила, что полностью завершила строительство ЦОД чуть более чем через два года после первого анонса, сообщает Datacenter Dynamics. В начале июня о старте работы сообщала NVIDIA. По словам Microsoft, ЦОД стал домом для мощнейшего ИИ-суперкомпьютера в мире Кампус в Маунт-Плезант относится к проекту Fairwater и является частью ИИ-кластера из множества зданий. Microsoft развивает площадку в Маунт-Плезант уже несколько лет. Изначально компания получила в распоряжение землю, на которой Foxconn рассчитывала построить новые производственные мощности. Строительство началось в 2023 году, изначально предполагалось освоить более 127 га и построить три объекта общей площадью 111 485 м2.
Источник изображения: Microsoft В конце 2023 года облачный гигант получил разрешение на дополнительное расширение ещё на 404 га и с тех пор занимался покупками необходимой земли, включая участок на 64 га в августе прошлого года. Компания купила его за $43 млн. В январе 2026 года компания получила разрешение на строительство ещё 15 зданий ЦОД на территории кампуса. Кампус поможет обеспечить внедрение новых ИИ-инноваций в мировом масштабе, на местном уровне будут созданы «долгосрочные экономические возможности» за счёт создания сотен рабочих мест для высококвалифицированных сотрудников и дальнейших инвестиций в регион. Представители Маунт-Плезант заявили, что речь идёт об исторической вехе. Благодаря инвестициям Microsoft локация станет «точкой притяжения» для инноваций и технологического развития. По оценкам Microsoft, с 2024 по 2028 гг. компания инвестирует на местном уровне $4,7 млрд в строительство объектов гиперскейл-уровня в штате. Второй объект кампуса, как ожидается, будет завершён в 2028 году. Дополнительно Microsoft запустила ЦОД проекта Fairwater в Атланте (Джорджия) в ноябре 2025 года.
24.06.2026 [12:35], Руслан Авдеев
Мэры 40 крупнейших городов мира подписали пакт о смягчении действия ЦОД на энергетику и водоснабжениеГлавы 40 крупнейших городов планеты договорились о совместной работе для снижения растущего негативного воздействия дата-центров на системы электроснабжения, качество водных ресурсов и состояние жилых сообществ, сообщает Datacenter Dynamics. В ходе мероприятия London Climate Action Week было заключено соглашение The Global Pact for Urban Data Centers. Предполагается задать стандарты использования низкоуглеродной энергии и более эффективно интегрировать дата-центры в городскую среду в ходе планирования. Ожидается, что правила будут адаптироваться под местные условия, а рамочное соглашение будет рассматриваться как руководство при принятии решений по планированию и выдаче разрешений, а также организации взаимодействия между компаниями и властями. По словам одного из участников пакта, дата-центры сделали сильнейший «удар» по энергосетям со времён массового внедрения кондиционеров в 1950-е годы. Но если на распространение кондиционеров ушли десятилетия, то мощности ЦОД стремительно выросли всего за несколько лет. Дальнейшие действия на рынке ЦОД должны основываться на четырёх принципах. В первую очередь предусмотрено использование уже бывших в эксплуатации территорий и объектов с «уважением» к местным сообществам при координации усилий с локальными правительствами для минимизации ущерба здоровью жителей.
Источник изображения: Alexander Fastovets/unsplash.com Кроме того, предполагается публиковать оценки устойчивости ЦОД и их безопасности для общественного здоровья по измеряемым критериям. Также спрос на электричество необходимо будет удовлетворять без строительства новых электростанций на ископаемом топливе, расширения уже действующих или открытия выведенных из эксплуатации станций такого типа. Наконец, необходимо будет обеспечить справедливое распределение расходов путём прямого финансирования модернизации энергетической, водной и сетевой инфраструктуры с использованием схемы «справедливой доли» при ценообразовании, тесно связанной с метриками устойчивого развития. По некоторым данным, новый пакт необходим на фоне беспрецедентного спроса со стороны сектора ЦОД. Так, в Финиксе и округе насчитываются 225 действующих и запланированных дата-центров, которые могут почти удвоить спрос города на электричество. Руководство Лондона заявляет, что ИИ и ЦОД будут играть ключевую роль в будущем процветании городов по всему миру, но жители городов имеют право рассчитывать на то, что рост будет управляться «ответственно». Действия в рамках пакта будут координироваться НКО C40 Cities — по сути это сеть из около 100 крупнейших городов мира, представители которых совместно работают над контролем климата. Как свидетельствуют результаты исследования Rest of World, около 80 % всех ЦОД мира построены в не слишком благоприятных климатических условиях. Поэтому обеспечить выполнение многочисленных условий пакта будет особенно трудно.
24.06.2026 [12:00], Сергей Карасёв
Dell представила сервер PowerEdge XE8812 на базе NVIDIA Vera Rubin NVL4Компания Dell Technologies анонсировала сервер PowerEdge XE8812 для ресурсоёмких нагрузок ИИ и HPC. Устройство, относящееся к семейству Dell AI Factory with NVIDIA, ориентировано на использование в составе стоечной платформы Dell PowerRack 9100, основанной на стандартах OCP. Модель PowerEdge XE8812 выполнена на архитектуре NVIDIA Vera Rubin NVL4, которая включает четыре ускорителя Rubin. Таким образом, в составе стойки могут быть задействованы в общей сложности до 144 GPU, что обеспечивает высочайшую плотность вычислений. Сама стойка Dell PowerRack 9100 соответствует стандарту ORv3. Она поддерживает работу с оборудованием суммарной мощностью более 300 кВт. Реализовано прямое жидкостное охлаждение, которое охватывает как CPU, так и GPU. Интегрированный контроллер удалённого доступа Dell (iDRAC) позволяет настраивать, обновлять и контролировать серверы PowerEdge дистанционно из любой точки с подключением к сети. В целом, как отмечает Dell, переход на платформу Vera Rubin обеспечивает 50-% прирост объёма памяти в расчёте на сокет и GPU по сравнению с решениями NVIDIA предыдущего поколения. В сочетании с библиотеками NVIDIA CUDA-X это даёт предприятиям возможность запускать крупные ИИ-модели и симуляции полностью в оперативной памяти. Сервер предназначен для решения сложных задач, таких как, например, молекулярное моделирование. Поставки PowerEdge XE8812 планируется организовать в начале следующего года.
24.06.2026 [01:23], Владимир Мироненко
Европа получит 35 суперкомпьютеров на чипах NVIDIANVIDIA объявила о разработке по всей Европе 35 суперкомпьютеров на базе её чипов, которые позволят более 3 млн исследователей ускорить проведение научных исследований и внедрение промышленных инноваций в сфере ИИ. Это крупнейшее за год расширение в Европе сети суперкомпьютеров, охватывающее национальные суперкомпьютерные центры, ИИ-фабрики и академические исследовательские институты. Эти системы будут поддерживать исследования в области климатологии, здравоохранения, декарбонизации чистой энергетики, квантовых вычислений и фундаментальной науки. Работу большей части европейских ИИ-фабрик обеспечивают платформы Blackwell и Hopper, при этом с прошлого года было развернуто или анонсировано 800 Эфлопс вычислительных мощностей для ИИ. Эти суперкомпьютеры, включая обновлённый EuroHPC MareNostrum5 AI Барселонского суперкомпьютерного центра (BSC-CNS), Blue Swan (BavariaAI), IT4LIA, HammerHAI Центра высокопроизводительных вычислений в Штутгарте (HLRS) и ИИ-фабрика Mimer Национальной академической суперкомпьютерной инфраструктуры Швеции (NAISS), основаны на передовой ИИ-инфраструктуре NVIDIA, говорит компания. Так, суперкомпьютер MareNostrum 5 будет дооснащён системами GB300 NVL72 и GB200 NVL4, объединённых интерконнектом NVIDIA Quantum-X800 InfiniBand. Система, обеспечивающая производительность до 20 Эфлопс при обучении ИИ и 33 Эфлопс при ИИ-инференсе, позволит ускорить работу генеративного ИИ, климатическое моделирование, исследования в области здравоохранения и биотехнологий, устойчивого сельского хозяйства, энергетических систем и госсервисов. Система Blue Swan (BavariaAI) добавит 1 тыс. ускорителей (GB200 NVL4 и Quantum-2 InfiniBand) суперкомпьютерным центрам FAU Erlangen и LRZ. Платформа обеспечит производительность до 11 Эфлопс при обучении ИИ и 22 Эфлопс при ИИ-инференсе. Она будет поддерживать инициативу Баварии по созданию базовых моделей, продвигая открытые мультимодальные модели для науки, государственного управления, исследований в области здравоохранения, робототехники и т.д. HammerHAI (HLRS) представляет собой первую в Германии ИИ-фабрику с более чем 850 GPU на базе GB200 NVL4 с Quantum-X800 InfiniBand. Суперкомпьютер HammerHAI, обеспечивающий производительность до 8 Эфлопс при обучении ИИ и 15 Эфлопс при ИИ-инференсе, обеспечит исследователям и промышленным пользователям безопасную ИИ-инфраструктуру для инженерного моделирования, инференса и научных исследования. Суперкомпьютер Mimer EuroHPC AI Factory (NAISS), размещённый в Линчёпингском университете (LiU, Швеция), будет использовать 100 систем GB200 NVL4 и сеть ConnectX-8. Обеспечивая производительность до 4 Эфлопс при обучении ИИ и около 7 Эфлопс при ИИ-инференсе, Mimer AI Factory будет способствовать развитию шведской ИИ-экосистемы в таких областях, как биологические науки, материаловедение, автономные системы, доверенный ИИ и т.д. Наконец, ИИ-фабрика IT4LIA с более чем 8 тыс. GPU на базе GB200 NVL4 с Quantum-X800 InfiniBand и ПО NVIDIA AI Enterprise обеспечивает производительность в размере 82 Эфлопс при обучении ИИ и 164 Эфлопс при ИИ-инференсе.
24.06.2026 [01:02], Владимир Мироненко
Дата-центры важнее людей: Oracle сократила за прошедший финансовый год 21 тыс. сотрудниковКомпания Oracle сократила штат примерно на 13 % в 2026 финансовом году, завершившемся 31 мая 2026 года, о чём она сообщила в годовом отчёте, направленном в Комиссию по ценным бумагам и биржам США (SEC) и опубликованном 22 июня. Как указано в документе, по состоянию на 31 мая 2026 года в Oracle работало 141 тыс. сотрудников, тогда как годом ранее штат включал 162 тыс. человек. То есть сокращения коснулись 21 тыс. рабочих мест. Расходы компании на выходные пособия и другие затраты, связанные с увольнениями, составили $1,84 млрд, что почти в пять раз больше, чем в 2025 финансовом году. В документе сообщается, что корректировка численности персонала была вызвана различными факторами, включая изменения в управлении и продуктах, проблемы с производительностью, изменения в стратегии и приобретения. Ранее сообщалось, что Oracle рассматривает возможность сокращения штата на 20–30 тыс. сотрудников в целях экономии, что позволило бы получить около $8–$10 млрд свободного денежного потока, поскольку традиционные финансовые институты всё меньше доверяют стратегии Oracle, в первую очередь из-за сделок с OpenAI. Расширение ИИ-инфраструктуры и строительство ЦОД требует значительных средств. Как сообщает Data Center Dynamics, в этом году Oracle выделила около $45 млрд заёмных и собственных средств на строительства ЦОД для своих клиентов, включая AMD, Meta✴, Nvidia, OpenAI, TikTok, xAI и т.д. Осенью прошлого года компания взяла на себя дополнительные $18 млрд долга, а в начале этого сообщила, что намерена взять в долг ещё $50 млрд на строительство ИИ ЦОД и уже выпустила новые облигации на $25 млрд. Финансовый директор Oracle Хилари Максон (Hilary Maxson) сообщила в ходе последнего квартального отчёта, что компания планирует привлечь $40 млрд в виде заёмных и акционерных средств в 2027 финансовом году, включая «уже объявленный выпуск акций на сумму $20 млрд», но не «ожидает привлечения дополнительного заемного финансирования в 2026 календарном году». Капитальные затраты Oracle в 2026 финансовом году составили $55,7 млрд, и ожидается, что в 2027 финансовом году они увеличатся до $90–$95 млрд.
23.06.2026 [16:29], Руслан Авдеев
SpaceX предоставит стартапу Reflection AI ИИ-мощности на $6,3 млрдКомпания SpaceX подписала крупное соглашение о предоставлении вычислительных мощностей стартапу Reflection AI, работающему над созданием открытых ИИ-моделей и ИИ-агентов. Пока это последняя из не принадлежащих империи Маска компаний, запросивших у него доступ к инфраструктуре Colossus, сообщает CNBC. В рамках соглашения Reflection немедленно получит доступ к системам NVIDIA GB300. Стартап согласился платить SpaceX по $150 млн ежемесячно, начиная с 1 июля 2026 года до 2029 года. Общий объём платежей составит около $6,3 млрд, если соглашение будет действовать до конца названного срока. Через три месяца после старта проекта любая из сторон сможет расторгнуть контракт, уведомив об этом партнёра за 90 дней. Аналогичные соглашения о предоставлении вычислительных мощностей подписаны с Anthropic и Google, а вот Cursor была выкуплена xAI. Reflection стратегически отличается от них — это ИИ-хаб с фокусом на open source моделях: в момент, когда государства и корпорации стремятся избавиться от зависимости от закрытых ИИ-систем. Время как нельзя подходящее — после закрытия доступа к Anthropic к Fable и Mythos интерес к открытым решениям снова вырос. Reflection как раз и делает ставку на отказ от зависимости от закрытых моделей для критически важных задач. Последняя оценка стартапа составила $25 млрд. Он пытается создавать открытые модели, способные конкурировать с передовыми ИИ-системами OpenAI, Anthropic и Google. Впрочем, пока стартап не выпустил ни одной крупной передовой модели, хотя активно взаимодействует с заказчиками из числа госструктур и, в числе прочих, ответственных за национальную безопасность. Так, компания связана с программой Genesis Mission Министерства энергетики США (DoE) и участвует в ИИ-инициативах Пентагона.
23.06.2026 [16:09], Руслан Авдеев
Большой апгрейд: Microsoft построит 2-ГВт ИИ ЦОД в техасском ПекосеMicrosoft объявила об одном из крупнейших разовых увеличений мощностей ЦОД в истории компании. В Пекосе (Pecos, Техас) она строит кампус на 2 ГВт. В следующие 5–7 лет многомиллиардная инвестиция поможет осуществить инновации нового поколения с прицелом на долгосрочную перспективу, говорит компания, у которой уже есть успешный опыт развития ЦОД в регионе Сан-Антонио в течение более чем десяти лет. Новый объект дополнит крупные ЦОД проекта Fairwater в Атланте и Висконсине. Спрос клиентов на ИИ и облака продолжит расти, и для его удовлетворения потребуется не просто больше мощностей ЦОД, а предсказуемых, устойчивых мощностей, способных быстро масштабироваться, говорит Microsoft. Именно поэтому кампус в Пекосе получит собственные генерирующие мощности непосредственно на площадке, что позволит вводить объекты в эксплуатацию в темпе, необходимом клиентам, с сохранением устойчивой работы. Энергетическая инфраструктура оплачивается самой Microsoft. При этом компания руководствуется принципом Community First, в соответствии с которым уделяется внимание интересам местного населения. Помимо создания новых рабочих мест, компания будет инвестировать в подготовку кадров, в первую очередь для своих же ЦОД, и поддержку малого бизнеса. Впрочем, инвестиции касаются не только непосредственно ЦОД, но и поддержки НКО и прочих структур. Кроме того, компания систематически повышает энергоэффективность своей инфраструктуры. В Техасе она законтрактовала уже 4,7 ГВт энергии из возобновляемых источников и продолжает наращивать возможности в этой сфере по мере изменения спроса. На начальном этапе кампус ЦОД будет работать от расположенной рядом газовой электростанции «за счётчиком», оснащённой системой Selective Catalytic Reduction для снижения выбросов оксидов азота. В дальнейшем планируется подключить кампус к электросети и сделать генерирующие мощности частью региональной электросистемы. Также Microsoft планирует использовать в своих ЦОД замкнутые системы охлаждения, существенно сокращающие потребность в чистой воде. Планируется минимизировать зависимость от источников пресной воды в целом, используя, где можно, непитьевую воду. По данным Converge! Digest, Microsoft и Chevron подписали соглашение сроком на 20 лет о покупке «чистой» энергии в рамках инициативы Project Kilby в Западном Техасе. Строительство генерирующих мощностей будет осуществляться дочерней структурой Chevron — Energy Forge One совместно с Engine No. 1. Поэтапно будут введены 2,67 ГВт генерируюших мощностей, преимущественно на базе газовых турбин GE Vernova, а также Caterpillar (Solar Turbines). Окончательное решение об инвестициях будет принято до конца 2026 года, подача энергии должна начаться в 2028 году.
23.06.2026 [11:41], Руслан Авдеев
Micron и Anthropic анонсировали стратегическое партнёрство для масштабирования ИИ-инфраструктуры нового поколенияMicron Technology анонсировала стратегическое соглашение с Anthropic, касающееся проектирования архитектуры памяти и СХД для ИИ, вопросов поставок и спроса, внедрения ИИ Claude внутри корпоративной структуры Micron и стратегических инвестиций в Anthropic в раунде финансирования серии H. Соглашение напрямую связывает спрос передовых ИИ-моделей с вопросами разработки инфраструктуры, поставок и внедрения ИИ-решений. По словам Micron, революция в области ИИ навсегда повысила роль памяти и решений для хранения данных, как в сфере ЦОД, так и, в частности, периферийных вычислений. Поэтому компании займутся разработкой инфраструктуры нового поколения. Как считают в Anthropic, стратегия компании зависит от того, насколько качественно выстроены уровни технологического стека, а память и вычислительные системы влияют на то, насколько эффективно можно обучать Claude и эксплуатировать его. По мере роста спроса на Claude будут масштабироваться и мощности. Ключевым для сотрудничества является целенаправленная работа над технологиями памяти и хранения данных, позволяющая эффективнее масштабировать ИИ-системы. Портфолио Micron включает HBM, DRAM и SSD, что обеспечивает высокую производительность, энергоэффективность и оптимизацию совокупной стоимости владения при обучении и инференсе.
Источник изображения: Micron Micron и Anthropic намерены проанализировать работу подсистем памяти и хранения при разных нагрузках, а также то, как они будут взаимодействовать в пределах всего стека. Ожидается, что это повысит производительность памяти и хранилищ данных, повысит энергоэффективность и обеспечит ИИ-инфраструктуре Anthropic более выгодную «экономику токенов». Помимо технического сотрудничества, компании договорились о поставках памяти и систем хранения данных из портфолио Micron. Это позволит последней поддержать активный рост Anthropic и будущее масштабирование её ИИ-инфраструктуры. Micron уже внедрила модели Claude для ускорения выполнения задач разработки и выполнения более передовых агентных сценариев для инженерных и корпоративных задач, а также производства. Утверждается, что эти модели уже отвечают за инновации и заметный рост производительности Micron. По мере усложнения и роста автономности систем компания рассчитывает найти новые способы проектирования своих решений, создания и управления масштабными процессами. Помимо технологического сотрудничества и соглашения о поставках, Micron осуществила стратегические инвестиции в раунде серии H ($65 млрд). Это отражает общий фокус компании на развитии инфраструктуры, нужной для поддержки следующего поколения систем искусственного интеллекта.
22.06.2026 [19:14], Владимир Мироненко
Законопроект о регулировании ИИ в России кардинально сократили и упростили22 июня в комиссии правительства по законопроектной деятельности пройдёт рассмотрение законопроект «О поддержке развития технологий ИИ в РФ», который, по словам источника «Коммерсанта», должны внести в Госдуму до конца недели. Сообщается, что документ претерпел значительные изменения по сравнению с первоначальным вариантом. Его сократили до 13 страниц и 13 статей, при этом действие законопроекта распространяется только на большие фундаментальные модели (LLM) с более 1 млрд параметров. Модели с меньшим количеством параметров, в том числе open source, были исключены из первоначального варианта законопроекта также, как и формулировка «доверенные» модели, после чего в нём теперь указаны только «суверенные» и «национальные». Отмечается, что от добавления в документ «доверенных» моделей для КИИ отказались, так как требования к софту, куда относится и ИИ, уже прописаны ФСТЭК и ФСБ. На объектах КИИ можно будет использовать только с «суверенные» и «национальные» модели, разработка которых может рассчитывать на господдержку. В документе указано, что «суверенная» модель ИИ может быть разработана на всех этапах только российским юрлицом и использоваться только на инфраструктуре в РФ. «Национальная» модель должна быть существенно разработана российским юрлицом, хотя её компоненты могут быть open source. Основные положения законопроекта вступают в силу с 1 сентября 2026 года, положения о полномочиях правительства (применение моделей, их определение, обязанности разработчиков и т. д.) — с 1 марта 2027 года. Если же до 1 марта 2027 года уже внедрены ИИ-модели, не подпадающие под критерии документа, переходный период для них продлён до 1 сентября 2032 года в случае, если данные обрабатываются в РФ. «Коммерсантъ» отметил, что в итоговой версии отказались от требования обеспечить маркировку синтезированного ИИ контента и усилить ответственность владельцев ИИ-сервисов за правонарушения при использовании технологии. Также из первоначальной версии были исключены вопросы, касающиеся регулирования ИИ ЦОД и практически полностью — вопросы, касающиеся авторского права. |
|
