Лента новостей
26.05.2024 [22:25], Александр Бенедичук
«Гигафабрика» для ИИ: стартап xAI Илона Маска хочет построить суперкомпьютер со 100 тыс. NVIDIA H100Как сообщает Reuters со ссылкой на The Information, Илон Маск планирует построить гигантский суперкомпьютер для своего ИИ-стартапа xAI для работы над следующей версией чат-бота Grok. Запуск предполагаемого суперкомпьютера ожидается к осени 2025 года, при этом, по словам Маска, xAI может сотрудничать с Oracle. Для обучения Grok 2 использовалось около 20 тыс. ускорителей NVIDIA H100, а для Grok 3 и более поздних версий потребуется уже 100 тыс. NVIDIA H100. После завершения строительства суперкомпьютер будет как минимум в четыре раза больше самых больших существующих на сегодняшний день GPU-кластеров, утверждается в презентации, сделанной для инвесторов в мае. Семейство ускорителей NVIDIA доминирует на рынке ИИ-чипов для ЦОД, но из-за высокого спроса их может быть трудно приобрести. Маск основал xAI в прошлом году в качестве конкурента OpenAI и Google. Маск также был соучредителем OpenAI и членом совета директоров до 2018 года. В феврале этого года он подал иск к OpenAI и соучредителям Альтману и Брокману, посчитав, что они нарушили соглашение о некоммерческом характере деятельности.
26.05.2024 [13:24], Руслан Авдеев
Эрик Шмидт: будущие суперкомпьютеры США и Китая будут окружены пулемётами и колючей проволокой и питаться от АЭС
hardware
hpc
аэс
безопасность
ии
информационная безопасность
китай
суперкомпьютер
сша
цод
энергетика
Бывший генеральный директор Google Эрик Шмидт (Eric Schmidt) прогнозирует, что в обозримом будущем в США и Китае большие суперкомпьютеры будут заниматься ИИ-вычислениями под защитой военных баз. В интервью Noema он подробно рассказал о том, каким видит новые ИИ-проекты, и это будущее вышло довольно мрачным. Шмидт поведал о том, как правительства будут регулировать ИИ и искать возможности контроля ЦОД, работающих над ИИ. Покинув Google, бизнесмен начал очень тесно сотрудничать с военно-промышленным комплексом США. По его словам, рано или поздно в США и Китае появится небольшое число чрезвычайно производительных суперкомпьютеров с возможностью «автономных изобретений» — их производительность будет гораздо выше, чем государства готовы свободно предоставить как своим гражданам, так и соперникам. Каждый такой суперкомпьютер будет соседствовать с военной базой, питаться от атомного источника энергии, а вокруг будет колючая проволока и пулемёты. Разумеется, таких машин будет немного — гораздо больше суперкомпьютеров будут менее производительны и доступ к ним останется более широким. Строго говоря, самые производительные суперкомпьютеры США принадлежат Национальным лабораториям Министерства энергетики США, которые усиленно охраняются и сейчас. Как заявил Шмидт, необходимы и договорённости об уровнях безопасности вычислительных систем по примеру биологических лабораторий. В биологии широко распространена оценка по уровням биологической угрозы для сдерживания её распространения и оценки уровня риска заражения. С суперкомпьютерами имеет смысл применить похожую классификацию. Шмидт был председателем Комиссии национальной безопасности США по ИИ и работал в Совете по оборонным инновациям. Также он активно инвестировал в оборонные стартапы. В то же время Шмидт сохранил влияние и в Alphabet и до сих пор владеет акциями компании стоимостью в миллиарды долларов. Военные и разведывательные службы США пока с осторожностью относятся к большим языковым моделям (LLM) и генеративному ИИ вообще из-за распространённости «галлюцинаций» в таких системах, ведущих к весьма правдоподобным на первый взгляд неверным выводам. Кроме того, остро стоит вопрос сохранения секретной информации в таких системах. Ранее в этом году Microsoft подтвердила внедрение изолированной от интернета генеративной ИИ-модели для спецслужб США после модернизации одного из своих ИИ-ЦОД в Айове. При этом представитель Microsoft два года назад предрекал, что нынешнее поколение экзафлопсных суперкомпьютеров будет последним и со временем все переберутся в облака.
25.05.2024 [20:50], Сергей Карасёв
EdgeCortix представила ИИ-ускоритель SAKURA-II Edge AI с производительностью до 60 TOPSКомпания EdgeCortix, по сообщению CNX Software, анонсировала ускоритель SAKURA-II Edge AI, предназначенный для выполнения ИИ-задач на периферии. Новинка, как утверждается, способна справляться с обработкой больших языковых моделей (LLM), больших визуальных моделей (LVM) и пр. В основу изделия положен нейропроцессорный движок с архитектурой Dynamic Neural Accelerator (DNA) второго поколения. Заявленная производительность достигает 60 TOPS на операциях INT8 и 30 Тфлопс на операциях BF16. Ускоритель может нести на борту 8, 16 или 32 Гбайт памяти LPDDR4x с пропускной способностью 68 Гбайт/с. Есть 20 Мбайт памяти SRAM. Заявленное типовое энергопотребление составляет 8 Вт. Изделие имеет упаковку BGA с размерами 19 × 19 мм. Диапазон рабочих температур простирается от -40 до +85 °C. Для ускорителя доступен программный комплект MERA с поддержкой PyTorch, TensorFlow Lite и ONNX. Помимо собственно ускорителя SAKURA-II Edge AI, компания EdgeCortix представила решения на его основе. Это, в частности, модуль формата M.2 2280: он использует интерфейс PCIe Gen 3.0 x4, а энергопотребление равно 10 Вт. Доступны модификации с 8 и 16 Гбайт памяти LPDDR4. Стоят такие модули $249 и $299. Кроме того, выпущены однослотовые низкопрофильные карты расширения с интерфейсом PCIe 3.0 x8. Такие устройства существуют в вариантах с одним и двумя чипами SAKURA-II Edge AI. Во втором случае производительность удваивается и достигает 120 TOPS на операциях INT8 и 60 Тфлопс на операциях BF16. Младшая версия оснащена 16 Гбайт памяти и имеет энергопотребление 10 Вт. Старший вариант несёт на борту 32 Гбайт памяти и обладает энергопотреблением 20 Вт. Цена — $429 и $749 соответственно.
25.05.2024 [20:34], Сергей Карасёв
Infineon готовит блоки питания мощностью до 12 кВт для ИИ-серверовКомпания Infineon Technologies AG поделилась планами по выпуску блоков питания следующего поколения для серверов, ориентированных на выполнение ресурсоёмких задач ИИ и НРС в дата-центрах. Готовящиеся устройства обеспечат высокую мощность и улучшенную эффективность. Infineon отмечает, что на фоне стремительного развития технологий ИИ возрастает энергетическая нагрузка в ЦОД. Современные ускорители на базе GPU обладают энергопотреблением до 1 кВт, а к концу текущего десятилетия этот показатель, как ожидается, достигнет 2 кВт и более. Это порождает необходимость в создании передовых блоков питания для серверного оборудования. На сегодняшний день в ассортименте Infineon присутствуют блоки питания мощностью 3 кВт и 3,3 кВт. К выпуску готовятся решения на 8 кВт и 12 кВт. Утверждается, что разработка новинок стала возможной благодаря интеграции трёх полупроводниковых материалов: кремния (Si), карбида кремния (SiC) и нитрида галлия (GaN). Такая комбинация, по заявлениям компании, позволяет добиться наилучших результатов с точки зрения производительности, эффективности и надёжности в высоконагруженных системах. Инновационные блоки питания помогут снизить энергопотребление и выбросы CO2, что будет способствовать сокращению эксплуатационных расходов в течение срока службы. По утверждениям Infineon, устройства обеспечивают эффективность до 97,5 %. Удельная мощность увеличена до 100 Вт/дюйм3 по сравнению с 32 Вт/дюйм3 у доступного блока питания на 3 кВт. Это обеспечивает дополнительные преимущества в плане плотности компоновки и экономии средств. Отмечается, что блок питания мощностью 8 кВт подходит для стоек с ИИ-оборудованием общей мощностью до 300 кВт. Это устройство станет доступно в I квартале 2025 года. О сроках начала продаж модели мощностью 12 кВт пока ничего не сообщается. При этом крупные операторы всё чаще предпочитают варианты с единой DC-шиной на уровне стойки.
24.05.2024 [22:01], Андрей Крупин
Исследование: основной целью хакеров при атаках на промышленность является шпионажКаждая третья успешная кибератака на предприятия промышленной отрасли имеет признаки шпионажа. Об этом свидетельствуют результаты исследования компании «Солар», в основу которого легли данные анализа попыток кибератак на клиентов центра Solar JSOC; аналитики внешних киберугроз, проведённой центром Solar AURA; аналитики центра расследований Solar 4RAYS и работ, проведённых отделом анализа защищённости. Согласно представленным в исследовании сведениям, за последние три года на сектор промышленности было совершено около 600 тысяч попыток кибератак. Основную часть инцидентов составили операции с пользовательскими учётными записями и контролем над ними. Это попытки подбора пароля (в том числе от критичных систем), административный доступ за пределы сети (указывает на использование средств ОС для удалённого доступа), многочисленные блокировки учётных записей (говорит о множественных попытках брутфорса). ![]() Источник изображения: пресс-служба компании «Солар» Распределение инцидентов показывает, что основной проблемой в рамках мониторинга и реагирования на киберугрозы является различного рода вредоносное программное обеспечение на конечных устройствах разной критичности, а также нелегитимное ПО, например, майнеры. Это связано с масштабами распределённых инфраструктур и сложностью контроля соблюдения политик ИБ в них. При этом мощности используемого на предприятиях оборудования дают злоумышленникам достаточно ресурсов для добычи криптовалюты. По словам экспертов, вывести из строя промышленное предприятие крайне сложно — индустриальные сегменты и системы хорошо защищены, к тому же они часто работают в закрытом режиме и не имеют связи с внешним IT-периметром. Однако корпоративные сети, где может храниться информация о строении АСУ ТП, учётные данные и прочая информация, все ещё имеют достаточно уязвимостей. В связи с этим в промышленной сфере более актуальными становятся проблемы шпионажа и несанкционированного доступа к данным.
24.05.2024 [21:17], Владимир Мироненко
Обойдёмся без Oracle: «Ростелеком» создаст собственную биллинговую систему с СУБД от «СберТеха»«Ростелеком» планирует создать собственную импортонезависимую биллинговую систему на базе отечественной СУБД Platform V Pangolin от «СберТеха», сообщил вице-президент «Ростелекома» Дарий Халитов. В настоящее время «Ростелеком» использует для биллинга решения американской Oracle. В интервью «Ведомостям» Халитов рассказал, что ядро билинговой системы собираются «полностью импортозаместить и использовать на уровне страны». Он добавил, что компания сейчас параллельно внедряет решение у себя в периметре и занимается рефакторингом, «меняя его логику работы с иностранной СУБД Oracle на российскую базу данных». Миграция доверена дочерней «ОС групп», решениями которой пользуются, в частности, «Netbynet, «Эр-телеком» и «ВымпелКом» («Билайн»). Халитов уточнил, что решение будет совместимо с основными российскими СУБД — Postgres Pro, Pangolin и др., а также с ОС ALT Linux, «Ред ОС» и др. Опрошенные «Ведомостями» эксперты и представители рынка отметили, что «Мегафон» использует биллинговую систему Nexign, владельцем которой и является. Nexign уже отказалась от ПО Oracle и других зарубежных поставщиков. «Билайн» выкупил исходный код используемой им системы Amdocs и локализовал его. МТС пока использует Foris, но уже готовит систему Telecom Platform собственной разработки. Tele2 тоже создаёт собственную систему Bercut, передают «Ведомости».
24.05.2024 [19:55], Сергей Карасёв
Angara Security создала ИБ-платформу предиктивной аналитики на основе баз данных угроз ФСТЭК и MITREРоссийская компания Angara Security объявила о запуске специализированной платформы предиктивной аналитики для автоматического определения статистически наиболее вероятных тактик, техник и процедур хакерских группировок при совершении атак на компании с учётом их отраслевой принадлежности и имеющихся цифровых активов. Тактики и цели киберпрестпников динамически меняются в силу ряда факторов, говорит компания. Это могут быть геополитическая обстановка, какие-либо резонансные события, обнаружение уязвимостей нулевого дня и пр. Например, по итогам 2023 года, на 120 % увеличилось количество политически мотивированных кибератак. Кроме того, растёт число кибергруппировок, нацеленных на объекты критической инфраструктуры (КИИ). ![]() Источник изображения: pixabay.com Новая платформа Angara Security позволяет выполнять автоматическую атрибуцию киберугроз по отраслевой принадлежности компаний. Это даёт возможность формировать превентивные тактики и меры защиты IT-инфраструктуры. Кроме того, упрощается планирование инвестиций в развитие ИБ. Платформа разработана экспертами Angara SOC на основе данных международной классификации MITRE ATT&CK, базы данных угроз безопасности ФСТЭК и собственной практики расследования и реагирования на инциденты ИБ. Система определяет наиболее вероятные тактики хакерских группировок на основе профиля организации (кодов ОКВЭД). При формировании результатов учитывают имеющиеся данные о злоумышленниках и их деятельности. Отмечается, что платформа способствует снижению ущерба благодаря принятию обоснованных решений в области ИБ. Система помогает при адаптации и приоритизации правил выявления кибератак, а также при разработке стандартов аудита. Аналитики Angara SOC также отмечают, что в 2024 году в фокусе внимания киберпреступников остаются государственные организации, финансовый сектор, e-commerce, СМИ, страховые компании, IT-сектор и промышленность.
24.05.2024 [15:36], Руслан Авдеев
Подводный интернет-кабель Google Umoja впервые напрямую свяжет Африку с АвстралиейКомпания Google прокладывает первый в истории оптоволоконный кабель Umoja, который напрямую свяжет африканский континент с австралийским. Bloomberg сообщает, что это поможет улучшить соединение наименее обеспеченных доступом в интернет частей света. А со стороны Южной и Северной Америки до Австралии дотянется целая сеть кабелей Google: Humboldt, Honomoana и Tabua. Umoja дополнит цифровую магистраль Google Equiano, которая соединяет Африку с Европой. Новая линия будет заканчиваться в Кении, пройдя по суше через Уганду, Руанду, Конго, Замбию, Зимбабве и Южную Африку до того, как пересечёт океан по дороге в Австралию. Наземный участок Umoja построен в сотрудничестве с Liquid Intelligent Technologies — речь идёт о масштабируемой магистрали через Африку, включающую точки доступа, которые позволят другим странам воспользоваться преимуществами новой инфраструктуры. Благодаря новой инфраструктуре улучшится связность Африки с другими частями света — в этом году континент пострадал из-за обрывов кабелей, сейчас его с остальным миром связывают немногие подводные и ограниченные наземные цифровые маршруты, из-за чего перенаправлять трафик в случае форс-мажорных ситуаций довольно трудно. Дополнительно Google подпишет заявление о сотрудничестве с кенийским Министерством информационных коммуникаций и цифровой экономики, чтобы ускорить развитие совместных проектов в сфере кибербезопасности, повышения квалификации, внедрения ИИ и др. ![]() Источник изображения: Google На этой неделе Microsoft также объявила о намерении построить в Кении дата-центр за $1 млрд с питанием от геотермальной энергии — это лишь часть многолетнего плана, в ходе которого будут наращиваться облачные мощности на востоке Африки. Всё это, как считается, часть большого плана США по наращиванию присутствия и влияния на африканском континенте и противостоянию здесь Китаю и России.
24.05.2024 [15:09], Сергей Карасёв
Разработчик «компрессора» для оперативной памяти ZeroPoint получил первые инвестицииСтартап ZeroPoint Technologies AB, разрабатывающий специализированные аппаратные решения для сжатия данных в высокопроизводительных системах, объявил о проведении раунда финансирования Series A, в ходе которого на развития привлечено €5 млн. ![]() Источник изображений: ZeroPoint ZeroPoint — это дочерняя компания Технического университета Чалмерса (Chalmers University of Technology) в Гётеборге (Швеция). Стартап запущен с целью коммерциализации исследований в области методов сжатия данных, которые его соучредители Пер Стенстрём (Per Stenström) и Ангелос Арелакис (Angelos Arelakis) проводили в вузе. Скорость, с которой серверный процессор может извлекать данные из DRAM, напрямую влияет на его производительность, а значит, и на быстродействие всей системы в целом. При этом, как заявляет ZeroPoint, обычно до 70 % хранимых данных являются избыточными. Одним из способов ускорить процесс получения информации является сжатие. Однако исторически применение этого метода было непрактичным, поскольку даже самые продвинутые алгоритмы компрессии относительно медленны, что сводит на нет любую потенциальную выгоду. ZeroPoint решает проблему с помощью, как утверждается, первого в своём роде подхода с аппаратным ускорением. Технология сочетает в себе сверхбыстрое сжатие данных без потерь и на лету, уплотнение в реальном времени и «прозрачное» управление памятью. Для выполнения этих задач применяется небольшой IP-блок Ziptilion-BW, который может быть интегрирован практически с любым стандартным контроллером памяти и совместим с (LP)DDR4/5 и HBM. ZeroPoint заявляет, что предложенный подход позволят увеличить эффективную ёмкость памяти в 2–4 раза, а также обеспечивает повышение производительности на Ватт до 50 %. Таким образом, общая стоимость владения серверами в дата-центрах может быть снижена на 25 %. Утверждается, что технология ZeroPoint в 1000 раз быстрее, чем другие существующие методы сжатия. ZeroPoint использует проприетарные методы, которые динамически определяют, какие именно данные можно сжать и каким именно образом. Для дополнительного ускорения извлечения данных в устройство интегрирован собственный кеш. Раунд финансирования Series A возглавила мюнхенская компания Matterwave Ventures. Средства также предоставили Industrifonden, Climentum Capital и Chalmers Ventures. Деньги будут использованы для дальнейших разработок и коммерциализации технологии. Компания также предлагает «компрессоры» для L2/L3-кеша и CXL/NVMe-устройств, ускоритель для zram/zswap и блок (де-)шифрования.
24.05.2024 [14:44], Руслан Авдеев
Microsoft и G42 за $1 млрд построят в Кении ЦОД на геотермальной энергии
g42
hardware
microsoft
microsoft azure
африка
геотермальная энергетика
кения
цод
экология
энергетика
Microsoft и G42, базирующаяся в ОАЭ, объединили усилия для постройки дата-центра в Кении. Его электропитание будет обеспечиваться за счёт геотермальной энергии. Datacenter Knowledge сообщает, что это лишь начальная часть многолетнего плана, в рамках которого будут значительно увеличены облачные мощности на востоке Африки. В конце прошлого года Кения уже заявляла о намерении направить $4,5 млрд на «зелёные» проекты: 200-МВт ЦОД EcoCloud, геотермальную энергетику и умное сельское хозяйство. G42 займётся инвестициями на первом этапе и будет отвечать за строительство объекта в Олкарии, где расположено немало геотермальных источников. Это важно для континента, где перебои с электроэнергией — скорее норма, чем исключение. Кроме того, проект отвечает планам Microsoft по декарбонизации своей деятельности. Первая очередь обеспечит 100 МВт и будет введена в эксплуатацию в ближайшие пару лет. Для полной реализации проекта потребуется 1 ГВт, причём пока не сообщается, сколько времени пройдёт до ввода всех объектов в эксплуатацию и во сколько это обойдётся. Microsoft намерена использовать первую очередь объекта для создания восточноафриканского региона Azure. Пока ближайший к клиентам из Кении ЦОД Microsoft расположен в Южной Африке. В рамках новой сделки кенийские власти согласились перенести больше своих сервисов в облака, что, по расчётам Microsoft, будет стимулировать спрос в целом. Новый ЦОД предложит ИИ-сервисы и облачные вычисления и ближайшим странам вроде Уганды, Руанды и Танзании. ![]() Источник изображения: Matt Palmer/unsplash.com Инициатива Microsoft и G42 анонсирована накануне встречи американского и кенийского президентов, намеренных объявить об укреплении связей между странами для противостояния китайскому и российскому влиянию в регионе. Компании вроде Huawei активно вкладывают деньги в Африку, создавая ЦОД, интернет-сервисы, системы слежения и умные энергосети. А экспансия в Кении — лишь часть проекта ОАЭ по получению влияния в Африке, куда Эмираты готовы инвестировать $100 млрд. В апреле Microsoft согласилась инвестировать $1,5 млрд в G42. Активное участие в сделке приняла администрация президента США — предположительно, G42 согласилась прекратить ведение бизнеса с компаниями КНР, включая Huawei, и обязалась использовать вместо китайских американские технологии. При этом президент Microsoft Брэд Смит (Brad Smith) должен войти в состав совета директоров G42, а последняя будет использовать облако Azure для своих ИИ-проектов. В Кении G42 будет работать над большими языковыми моделями для суахили и английского, а также французского и других локальных языков. Также компания будет создавать ИИ-модели для сельского хозяйства и других сфер деятельности, а Microsoft будет отвечать в том числе за киберзащиту местных клиентов и поможет обеспечить широкополосным интернетом около 40 % населения Кении уже к концу следующего года. Ожидается, что прибыль партнёры начнут получать через несколько лет. |
|