Материалы по тегу: ии
26.08.2025 [22:13], Руслан Авдеев
IBM и AMD займутся разработкой новых вычислительных архитектур на стыке квантовых и классических подходовAMD и IBM анонсировали разработку нового поколения вычислительных архитектур, в основе которых лежат квантовые компьютеры и HPC-системы. Речь идёт о т.н. «квантово-центричных супервычислениях», сообщает пресс-служба AMD. Команды намерены продемонстрировать первые результаты до конца текущего года. Компании сотрудничают над разработкой масштабируемых, open source платформ, способствующих переосмыслению будущего вычислений с использованием лидерства IBM в сфере квантовых компьютеров и ПО для них, а также ведущей роли AMD в сфере HPC и ИИ-ускорителей. По словам главы IBM Арвинда Кришны (Arvind Krishna), квантовые вычисления со временем позволят «симулировать» реальный мир и представлять информацию принципиально новым способом. Комбинация технологий IBM и AMD позволят построить мощную гибридную модель, оставляющую позади традиционные вычисления. В новой архитектуре квантовые компьютеры будут работать в тандеме с HPC-кластерами и ИИ-инфраструктурой с использованием CPU, ИИ-ускорителей и прочих вычислительных модулей. При таком гибридном подходе различные части задачи решаются оптимальным для них типом оборудования. Например, в будущем квантовые компьютеры смогут моделировать поведение атомов и молекул, а классические ИИ-суперкомпьютеры — анализировать большие массивы данных. Вместе эти технологии смогут решать реальные задачи в беспрецедентном масштабе и с беспрецедентной скоростью, говорят компании. ![]() Источник изображения: Yue WU/unsplash.com Компании изучают способы интеграции CPU, FPGA и ИИ-ускорителей AMD с квантовыми компьютерами IBM для совместного ускорения выполнения принципиально новых алгоритмов. Ключевым планом сотрудничества является разработка систем коррекции ошибок, что является важнейшим шагом на пути к созданию отказоустойчивых квантовых компьютеров, которые IBM планирует выпустить к 2030 году. Также компании планируют изучить, как именно open source решения вроде Qiskit могли бы выступить катализаторами развития и внедрения новых алгоритмов, использующих квантово-центричные супервычисления. IBM уже начала работать в направлении интеграции квантовых и традиционных систем. Недавно она заключила соглашение с японским НИИ RIKEN о подключении своего модульного квантового компьютера IBM Quantum System Two к одному из самых быстрых суперкомпьютеров мира Fugaku. Суперкомпьютеры Frontier в Ок-Риджской национальной лаборатории (ORNL) и El Capitan в Ливерморской национальной лаборатории (LLNL) полагаются на CPU и ускорители AMD. Другими словами, на чипах AMD работают два из быстрейших суперкомпьютеров из мирового рейтинга TOP500.
26.08.2025 [13:47], Руслан Авдеев
Crusoe расширит ИИ-мощности в исландском ЦОД atNorth ICE02Crusoe Energy и atNorth объявили о расширении мощностей Crusoe Cloud на 24 МВт в ЦОД ICE02 в Исландии. Дата-центр принадлежит atNorth и работает на «чистой» энергии. Новый проект должен удовлетворить растущий спрос на услуги Crusoe Cloud в Европе и Северной Америке, сообщает пресс-служба Crusoe. Для поддержки новой инициативы Crusoe получила от инвестиционной группы Victory Park Capital (VPC) кредитную линию на $175 млн. Расширение предусматривает использование современных решений NVIDIA, в том числе GB200 NVL72, а также внедрение СЖО. Дата-центр atNorth ICE02 на 100 % снабжается геотермальной энергией и энергией ГЭС. По словам Crusoe, расширения мощностей позволит ускорить удовлетворение «невероятного» спроса на Crusoe Cloud. atNorth сообщает, что в компании рады успехам Crusoe, достигнутым в обслуживании клиентов с использованием её исландского ЦОД. Расширение ICE02 — ключевой этап стратегии развития Crusoe в Европе, реализация которой стартовала в декабре 2023 года. Площадка предлагает доступ к телеком-сетям с низкими задержками и подключение по нескольким подводным кабелям — доступ к ресурсам получат не только европейские клиенты, но и компании из Северной Америки. Расширение регионального присутствия компании также включает и ввод в эксплуатацию недавно анонсированного ЦОД в Норвегии. ![]() Источник изображения: Crusoe Crusoe Cloud представляет собой масштабируемую платформу для выполнения ИИ-задач нового поколения. Crusoe Cloud считается экономичным решением, позволяющим разработчикам и иным IT-специалистам сосредоточиться на инновациях, не уделяя лишнего внимания инфраструктуре. В марте сообщалось, что Crusoe окончательно избавилась от криптобизнеса для концентрации усилий на ИИ-проектах. Тогда же компания привлекла $225 млн на закупку чипов NVIDIA для развития облачной ИИ-инфраструктуры. Компания является одним из ключевых подрядчиков проекта OpenAI Stargate, но попутно развивает и собственное ИИ-облако.
25.08.2025 [18:15], Руслан Авдеев
China Mobile заказала CUDA-совместимые ИИ-ускорители Kunlunxin на сумму более ¥1 млрдKunlunxin, «дочка» китайского IT-гиганта Baidu, получила от China Mobile заказ на ИИ-ускорители, совместимые с программной экосистемой NVIDIA CUDA, на сумму более ¥1 млрд ($140 млн), сообщает передаёт Reuters. Чипы достанутся поставщикам China Mobile, включая H3C и ZTE. Кроме того, компания закупит ускорители у Huawei. Заключение контракта — часть более широкой стратегии Китая по обретению технологического суверенитета в ИИ-секторе. В апреле Baidu успешно развернула кластер и 30 тыс. чипов собственной разработки — ИИ-ускорителей третьего поколения P800 Kunlun, способных обучать модели уровня DeepSeek. Технологический прогресс подчеркивает потенциал китайских разработок и позиционирует Baidu и Kunlunxin как ключевых игроков на рынке ИИ-ускорителей. Успех Kunlunxin и других китайских бизнесов может иметь важные последствия для мировой индустрии ИИ-ускорителей, в которой пока доминирует NVIDIA. По мере прогресса китайских технологий, позиции NVIDIA могут оказаться под вопросом, особенно в Поднебесной и на других рынках. Развитие технологий происходит на фоне технологического соперничества между США и Китаем. Практически сразу после послаблений США на поставки H20 Китай развернул активную кампанию против этих чипов, поэтому NVIDIA затормозила выпуск H20 и готовит для местного рынка другой, более мощный ускоритель. Глава NVIDIA Дженсен Хуанг (Jensen Huang) критиковал запреты на экспорт ИИ-полупроводников в Китай, подчёркивая, что из-за этого прогресс собственных технологий в КНР только ускорится.
25.08.2025 [11:00], Руслан Авдеев
В России подскочил спрос на дорогие серверы из-за ажиотажа вокруг ИИВ сравнении с 2023 годом серверы и СХД в России в 2024 году подорожали на 24–30 % за ед., ожидается и дальнейший рост цен в текущем году. Соответствующее исследование провела компания «СТРИМ консалтинг» при содействии консорциума «Вычислительная техника» (АНО «ВТ»), сообщают «Ведомости». Для исследования использовали результаты опроса поставщиков аппаратных решений, разработчиков коммерческого ПО, дистрибуторов и системных интеграторов. Росстат сообщает, что инфляция в 2024 году составила 9,52 %. Другими словами, цены в данном сегменте рынка росли в 2,5–3 раза быстрее уровня «средней по стране» официальной инфляции. Учитывались результаты как микробизнесов, так и гигантов с выручкой свыше 25 млрд руб., а также траты органов власти всех уровней. В расчёт принимались поставки отечественных производителей, параллельный импорт и «восстановленные» решения. Траты покупателей серверов в 2024 году выросли на 25 % в сравнении с 2023-м и составили 284 млрд руб., расходы на СХД выросли на 19 %, составив 145,5 млрд руб. В то же время в количественном выражении было куплено на 4 % меньше продуктов в той и другой категории, более 197 тыс. серверов и более 65 тыс. СХД. Важно, что интерес к ИИ вызвал рост спроса на оборудование с ИИ-ускорителями — в 2024 году таких решений продано втрое больше, чем в 2023-м, хотя точной статистики не приводится. Рост цен подтверждается российскими производителями IT-оборудования и системными интеграторами. Например, Fplus регистрирует рост цен в 2024 году на 10–15 %, приблизительно на том же уровне цены растут и в 2025 году. По статистике Fplus, корпоративные заказчики приобретали в 2024 году примерно втрое больше отечественных серверов, чем зарубежных. ![]() Источник изображения: Matthieu Beaumont/unsplash.com В «Кроке» утверждают, что цены выросли в 2023 году на 15–40 % в сравнении с 2021 годом, продолжают они расти и в 2024–2025 гг. Отчасти виноваты в этом и новые требования регуляторов, потребовавших обязательной маркировки серверного оборудования с 1 марта 2025 года, что не может не сказываться на цене. В ближайшем будущем рост составит 10-20 %, в зависимости от категории оборудования. В Yadro отметили, что средние цены на серверное оборудование и СХД напрямую не связаны со спросом, поскольку в 2024 году цена на серверы в целом сохраняла стабильность или даже снижалась, но заказчики стали чаще выбирать более дорогие и сложные продукты, что может сказаться на динамику цен в отрасли. По мнению экспертов, на динамике цен отражаются разные факторы. Так, переход на ИИ-ускорители удорожает серверы, а многое российское ПО не всегда оптимизировано под оборудование, поэтом иногда приходится покупать избыточные ресурсы. В числе причин роста цен «СТРИМ консалтинг» назвала инфляцию, рост курса доллара, усложнение логистики и удорожание компонентов. На цене сказались и необходимость параллельного импорта и усложнение логистики.
25.08.2025 [09:55], Сергей Карасёв
Решение задач мониторинга с использованием NetPing Monitoring Server 90Z04В данной статье мы рассмотрим пример применения устройств NetPing для обеспечения надёжного мониторинга и управления инфраструктурой организации, охватывающей серверные помещения, складские зоны и офисные пространства. При управлении IT-инфраструктурой организации могут сталкиваться со следующими трудностями:
Для решения таких задач требуется устройство, которое могло бы:
В качестве решения мы предлагаем использовать как основной элемент системы мониторинга устройство NetPing Monitoring Server 90Z04, оснащённое предустановленным сервером Zabbix для контроля состояния оборудования и IT-систем. Устройство поддерживает до 1000 измеряемых метрик одновременно, что позволяет отслеживать различные параметры сети и серверного оборудования 24/7. Основные характеристики устройства:
Область мониторинга и оборудование, задействованное в данной задачеНа рисунке ниже представлены основные узлы сети и подключаемые к NetPing Monitoring Server 90Z04 устройства. Офис
Удаленный склад
Серверный шкафВсе устройства подключены к управляемым розеткам NetPing Monitoring Server 90Z04:
Подключенные датчики
Питание устройства
Результаты использования устройства NetPing Monitoring Server 90Z04
NetPing Monitoring Server 90Z04 — это эффективное решение для организаций, которым требуется надёжный контроль за состоянием IT-инфраструктуры и автоматизация процессов управления. Его функциональные возможности, такие как поддержка системы Zabbix, мониторинг сетевых устройств и удалённое управление электропитанием, делают его идеальным выбором для малых и средних предприятий, которым необходимо обеспечить стабильную работу IT-систем. Поддержка и контактная информацияЧтобы получить подробную консультацию, обращайтесь в службу технической поддержки. Специалисты помогут выбрать оптимальное решение, соответствующее конкретным требованиям и условиям эксплуатации.
Группа компаний NetPing с 2005 года разрабатывает и производит устройства для мониторинга и удаленного управления энергопитанием серверного оборудования. Устройства NetPing полезны компаниям, которые используют IT-оборудование, инженерам и системным администраторам, сервисным компаниям и провайдерам, а также компаниям-интеграторам проектов IT-инфраструктуры. NetPing ― ваш надежный партнер в обеспечении стабильности и безопасности серверной инфраструктуры! ![]()
24.08.2025 [23:18], Сергей Карасёв
NeuReality готовит чип NR2 для оркестрации инференсаКомпания NeuReality раскрыла предварительную информацию об изделии NR2 — чипе второго поколения, предназначенном специально для оркестрации инференса. Изделие представляет собой более эффективную альтернативу связке CPU и NIC в высокопроизводительных системах ИИ. Чип первого поколения NR1 дебютировал в июне нынешнего года. Изделие может применяться в связке с любым GPU или ИИ-ускорителем. При этом, как утверждается, NR1 позволяет повысить эффективность использования GPU почти до 100 % по сравнению со средним показателем в 30–50 % при традиционном сочетании CPU и NIC в современных серверах. В состав NR1 входят четыре декодера видео/изображений, 16 DSP для аудио/речи, 16 векторных DSP общего назначения, два порта 10/25/50/100GbE и пр. Характеристики NR2 на данный момент полностью не раскрываются. Известно, что в основу решения положена платформа Arm Neoverse Compute Subsystems (CSS) V3. Чип может объединять до 128 ядер, оптимизированных для масштабных рабочих нагрузок обучения моделей ИИ и инференса. По сравнению с оригинальной версией в NR2 реализована более глубокая интеграция между CPU-блоком и NIC для координации ИИ-моделей в реальном времени, дезагрегации на основе микросервисов, потоковой передачи токенов, оптимизации KV-кеша и оркестровки. В целом, как отмечает NeuReality, чипы серии NR представляют собой качественно новый класс изделий, способных управлять рабочими нагрузками инференса с непревзойдённой эффективностью. Гипервизор ИИ в сочетании с ядрами Arm Neoverse обеспечивает оптимальную оркестровку и максимальную загрузку доступных ресурсов.
24.08.2025 [22:05], Татьяна Золотова
От резистора до ПК: производство российского IT-оборудования «Инферит» во ФрязиноНа заводе «Инферит» (кластер «СФ ТЕХ» ГК Softline) в подмосковном наукограде Фрязино на площади 7 тыс. м2 разместились демонстрационная зона, офис, собственный ЦОД, отделы НИОКР и промышленного дизайна, сборочное производство, производство электронных модулей (линия поверхностного монтажа, участок выводного монтажа, ОТК, сложной диагностики и тестирования, промывки и разделения заготовок), сервисный центр и склады. Завод занимается разработкой и прототипированием изделий, производством материнских плат для ПК, моноблоков, ноутбуков; модули оперативной памяти DIMM, SODIMM; модули ввода-вывода ПК, ноутбуков. В демонстрационной зоне расположена продукция вендора: системные блоки, мини-компьютеры, неттопы, моноблоки, ноутбуки, серверы, системы хранения данных (СХД), периферийные устройства. Для некоторых изделий «Инферит» пользуется контрактным производством, заказывая отдельные детали у партнеров. Для создания материнских плат «Инферит» использует текстолит российского и зарубежного производства. В среднем производство одной платы занимает примерно 110 секунд. В цехе поверхностного монтажа две линии. Малая линия используется для изготовления изделий с небольшим количеством компонентов. Это, например, обратная сторона некоторых плат и дополнительные заготовки вроде плат расширений. На большой линии можно устанавливать сразу множество мелких SMD-компонентов и более крупные элементы, например, процессорные сокеты или разъёмы под оперативную память. Обе линии оборудованы корейскими машинами Hanwha («дочка» Samsung). Заготовки будущих плат отправляются в загрузчик, а затем в так называемые магазины, которые и продвигаются по конвейеру. Если на малой линии производится одна сторона платы, которую потом необходимо перевернуть и переправить на большую линию, то она отправляется в промежуточный конвейер. На заготовки лазером наносится внутренний датакод (QR), который позволяет отслеживать все процессы изготовления электронных модулей. Перед основным этапом монтажа система пылеудаления очищает заготовки от загрязнений. Далее трафаретный принтер наносит паяльную пасту через трафарет с апертурами (отверстиями), полностью соответствующими контактным площадкам на будущей плате, и проводится оптическая 3D-инспекция. Затем на пасту устанавливается необходимый набор компонентов. На длинной линии за это отвечают сразу три станка. Первый, самый быстрый (установка до 92 тыс. компонентов в час), работает только с самыми маленькими элементами. Второй станок работает с компонентами среднего размера и может размещать до 80 тыс. компонентов в час. Ну а третий станок размеренно работает с крупными деталями. На малой линии стоит один станок, зато универсальный. Он может устанавливать до 40 тыс. компонентов в час. Все станки автоматически проверяют корректность размещения компонентов. Заготовки с пастой и компонентами попадают в печь конвекционного оплавления. Одновременно в ней может находиться до восьми плат, а в самой печи есть 24 настраиваемые зоны. После печи заготовки попадают в накопительный буфер с охлаждением. После очередной, ещё более тщательной 3D-инспекции почти готовые платы уходят либо на корректировку, если у них нашлись дефекты, либо отправляются далее. Отдел технического контроля при проверке корректирует дефекты и отправляет на участок выводного монтажа. Здесь происходит ручной монтаж (набивка) выводных компонентов, размещение модулей в технологическую оснастку, подача их в оснастке в установку селективной пайки, где каждый вывод нужного компонента паяется волной припоя. После каждого вида монтажа — тестирование. Если проблему не удается исправить, то изделием займутся специалисты на участке диагностики и сложного ремонта. На участке подготовки происходит промывка и разделение мультизаготовок. В сборочном цехе продукцию собирают в готовое изделие. После изделия уходят на упаковку, а затем на склады. В 2024 году «Инферит» продал более 500 серверов и более 50 тыс. компьютеров, а до конца этого года компания планирует наладить производство DDR5 и модулей памяти SSD, развернув для них новую площадку на заводе. По данным компании, «Инферит» сейчас занимает 5–7 % от общего рынка отечественных производителей в B2B-сегменте в денежном выражении. Цель к 2030 году – занять 10 %. Больше половины продаж приходится на персональные компьютеры, на ноутбуки приходится 20 % продаж, а, например, моноблоки пользуются спросом в госсекторе.
22.08.2025 [22:44], Владимир Мироненко
Связанные одной целью: NVIDIA Spectrum-XGS Ethernet объединит несколько ЦОД в одну ИИ-суперфабрикуNVIDIA анонсировала Spectrum-XGS Ethernet, масштабируемую технологию для объединения распределённых ЦОД в унифицированные гигантские ИИ-фабрики. Похожее решения не так давно предложила и Broadcom, анонсировав коммутаторы Jericho4. На фоне роста спроса на обработку ИИ-нагрузок отдельные ЦОД достигают пределов допустимой мощности, но выход за пределы одного объекта связан с трудностями из-за ограничений существующей сетевой инфраструктуры с высокой задержкой, джиттером и непрогнозируемой производительностью. NVIDIA позиционирует Spectrum-XGS Ethernet как революционное дополнение к платформе NVIDIA Spectrum-X Ethernet, которое устраняет эти ограничения. Решение служит третьим столпом ИИ-вычислений, выходящим за рамки вертикального и горизонтального масштабирования, и предназначено для повышения производительности и масштабируемости Spectrum-X Ethernet для объединения нескольких распределённых ЦОД в массивы ИИ-фабрик, способных обрабатывать ИИ-нагрузки в гигантских масштабах. «Индустриальная революция в области ИИ уже началась, и гигантские ИИ-фабрики являются важнейшей инфраструктурой, — заявил генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang) — С помощью NVIDIA Spectrum-XGS Ethernet мы расширяем возможности по масштабированию, объединяя ЦОД в городах, странах и континентах в огромные ИИ-суперфабрики». Spectrum-XGS Ethernet дополняет платформу Spectrum-X алгоритмами, которые динамически адаптируют сеть с учётом расстояния между объектами ЦОД. Решение опирается на усовершенствованный автоматический контроль перегрузки, точное управление задержками и сквозную телеметрию. По словам NVIDIA, Spectrum-XGS Ethernet практически удваивает производительность работы библиотеки коллективных коммуникаций NVIDIA NCCL, ускоряя взаимодействие множества ускорителей и множества узлов и обеспечивая предсказуемую производительность в географически распределённых ИИ-кластерах. В результате несколько ЦОД будут работать как единая ИИ-фабрика, полностью оптимизированная для подключения на больших расстояниях. CoreWeave одной из первых внедрит Spectrum-XGS Ethernet в свои ЦОД. Сама NVIDIA не новичок в распределённых ИИ-вычислениях — её собственные кластеры для внутренних нужд размещались в нескольких дата-центрах США.
22.08.2025 [18:08], Владимир Мироненко
Новейшие ИИ-технологии помогут трансформировать обучение, сделав его полностью персонализированнымСектор образования всегда отличался своей инновационностью, но в последние годы образовательные технологии (EdTech) претерпели беспрецедентную трансформацию. Стремительное развитие ИИ-технологий сделало EdTech-решения более персонализированными, доступными и привлекательными, заметно отразившись на методах обучения студентов, работе преподавателей и образовательных учреждений — от виртуальных классов и адаптивных платформ обучения до виртуальных ИИ-преподавателей и инструментов оценки. Одним из наиболее значимых достижений в области EdTech является переход от универсального обучения к персонализированному. ИИ-платформы позволяют анализировать поведение, прогресс и успеваемость учащихся в режиме реального времени, и с учётом этого корректировать планы уроков. Если, например, у учащегося будут обнаружены пробелы в конкретных навыках, ему будут автоматически предоставлены упражнения для их устранения. Это не только поможет учащимся успешно осваивать учебную программу в своем собственном темпе, но и сохранит им мотивацию к решению реальных задач. Еще одним прорывом в сфере образовательных технологий на основе ИИ стало появление иммерсивных образовательных сред. В настоящее время в преподавании широко используются инструменты на основе технологий виртуальной (VR) и дополненной (AR) реальности, позволяя более наглядно раскрывать сложные нюансы в области науки, техники и медицины. Способствуя более глубокому вовлечению в суть предмета, интерактивные возможности сокращают разрыв между теорией и практикой. Представьте себе студента-биолога, изучающего кровеносную систему человека в 3D, или ученика-историка, совершающего виртуальную экскурсию по Древнему Риму. ИИ также позволяет автоматизировать рутинную работу, включая выставление оценок за задания, создание учебных материалов и управление посещаемостью, благодаря чему преподаватели могут уделять больше внимания наставничеству. Автоматизированные системы оценивания, интеллектуальные инструменты составления расписания и генераторы учебных программ, управляемые ИИ, снижают затраты времени преподавателей на решение административных задач, предупреждая эмоциональное выгорание и способствуя повышению эффективности обучения. Даже такие продвинутые инструменты, как детекторы ИИ, всё чаще используются для проверки эссе, выявления плагиата и предоставления обратной связи в режиме реального времени для обеспечения академической честности и качества контента. Также одним из наиболее важных элементов использования ИИ сфере образовании считается прогнозирующая аналитика. ИИ на основе имеющихся данных может прогнозировать успеваемость учащихся, выявлять тех, кто подвержен риску отставания, и оперативно рекомендовать меры по предотвращению подобных случаев. Это позволяет преподавателям и учреждениям упреждать возникновение проблем, повышая качество обучения. Использование ИИ в EdTech открывает огромные перспективы, но также поднимает вопросы об обеспечении конфиденциальности, справедливости и предвзятости. Использование данных учащихся требует ответственного подхода и строгих мер предосторожности при их сборе и хранении. Кроме того, возникает риск увеличения разрыва в уровне образования, поскольку не у всех учащихся есть равный доступ к передовым цифровым инструментам. Программисты и разработчики политик должны уделять приоритетное внимание инклюзивности, прозрачности и справедливости по мере развития отрасли, считают эксперты. Слияние ИИ и EdTech, скорее всего, приведёт к гиперперсонализированному образованию, в рамках которого студенты будут иметь доступ к индивидуальной образовательной экосистеме, основанной на интеллектуальных помощниках, иммерсивном моделировании и обратной связи в режиме реального времени. По мере развития генеративного ИИ появятся полностью автономные виртуальные преподаватели, ведущие обучение по нескольким дисциплинам, со взаимодействием, максимально приближённым к человеческому. Следует отметить, что цель образовательных технологий на базе ИИ заключается не в том, чтобы заменить преподавателей, а в том, чтобы расширить их возможности, усилить воздействие и создать более инклюзивную, эффективную и увлекательную образовательную среду для всех учащихся.
22.08.2025 [17:23], Руслан Авдеев
Google: медианный промпт Gemini потребляет 0,24 Вт·ч энергии и 0,26 мл водыКомпания Google опубликовала документ, в котором описывается методология измерения потребления энергии и воды, а также выбросов и воздействия на окружающую среду ИИ Gemini. Как утверждают в Google, «медианное» потребление энергии на одно текстовое сообщение в Gemini Apps составляет 0,24 Вт·ч, выбросы составляют 0,03 г эквивалента углекислого газа (CO2e), а воды расходуется 0,26 мл. В компании подчёркивают, что показатели намного ниже в сравнении со многими публичными оценками, а на каждый запрос тратится электричества столько же, сколько при просмотре телевизора в течение девяти секунд. Google на основе данных о сокращении выбросов в ЦОД и декарбонизации энергопоставок полагает, что за последние 12 месяцев энергопотребление и общий углеродный след сократились в 33 и 44 раза соответственно. В компании надеются, что исследование внесёт вклад в усилия по разработке эффективного ИИ для общего блага. Методологии расчёта энергопотребления учитывает энергию, потребляемую активными ИИ-ускорителями (TPU), CPU, RAM, а также затраты простаивающих машин и общие расходы ЦОД. При этом из расчёта исключаются затраты на передачу данных по внешней сети, энергия устройств конечных пользователей, расходы на обучение моделей и хранение данных. Впрочем, по мнению некоторых экспертов, данные вводят в заблуждение, поскольку часть информации не учитывается. Так, не принимается в расчёт «косвенное» использование воды, поскольку считается только вода, которую ЦОД применяют для охлаждения, хотя значительная часть водопотребления приходится на генерирующие мощности, а не на их потребителей. Кроме того, при учёте углеродных выбросов должны приниматься во внимание не купленные «зелёные сертификаты», а реальное загрязняющее действие ЦОД в конкретной локации с учётом использования «чистой» и «обычной» энергии в местной электросети. OpenAI также недавно оказалась в центре внимания экспертов и общественности, поскольку появилась информация, что её новейшая модель GPT-5 потребляет более 18 Вт·ч электроэнергии, до 40 Вт·ч на ответ средней длины. Сам глава компании Сэм Альтман (Sam Altman) объявил, что в среднем на выполнение запроса тратится около 0,34 Вт∙ч и около 0,32 мл воды. Это несколько больше, чем заявленные показатели Google Gemini, однако, согласно расчётам исследователей, эти цифры, скорее всего, актуальны для GPT-4o. |
|