Материалы по тегу: s
28.03.2024 [22:01], Владимир Мироненко
Databricks представила открытую LLM DBRX, превосходящую GPT-3.5 TurboАмериканский стартап в сфере аналитики больших данных и машинного обучения Databricks объявил о выходе DBRX, большой языковой модели (LLM) общего назначения, которая, по его словам, превосходит в стандартных бенчмарках все существующие LLM с открытым исходным кодом, а также некоторые проприетарные ИИ-модели. Стартап заявил, что открывает исходный код модели, чтобы побудить пользователей отказаться от коммерческих альтернатив. Он отметил, что согласно исследованию Andreessen Horowitz LLC, почти 60 % лидеров в области ИИ-технологий заинтересованы в увеличении использования или переходе на open source, если открытые модели после тюнинга примерно соответствуют по производительности проприетарным моделям. ![]() Источник изображений: Databricks «Я считаю, что самые ценные данные хранятся внутри предприятий. ИИ как бы исключён из этих сфер, поэтому мы пытаемся реализовать это с помощью моделей с открытым исходным кодом», — цитирует ресурс SiliconANGLE заявление гендиректора Databricks Али Годси (Ali Ghodsi) на брифинге с журналистами. По словам Годси, лучше всего DBRX подходит для сфер, где критически важны управление и безопасность, например, для финансовых услуг и здравоохранения, или там, где важен тон ответов, например, в области самообслуживании клиентов. DBRX использует архитектуру Mixture of Experts (MoE, набор экспертов), которая делит процесс обучения между несколькими специализированными «экспертными» подсетями. Каждый «эксперт» владеет определёнными навыками, а исходный запрос оптимальным образом распределяется между «экспертами». Вице-президент Databricks по генеративному ИИ, перешедший в компанию вместе с приобретением MosaicML, соучредителем которой он был, заявил, что MoE работает даже лучше человека. Хотя DBRX с 132 млрд параметром почти в два раза больше Llama 2, она всё равно вдвое быстрее. Также сообщается, что DBRX превзошла существующие LLM с открытым исходным кодом Llama 2 70B и Mixtral-8x7B (тоже MoE), а также запатентованную GPT-3.5 Turbo в тестах на понимание языка, программирование, математику и логику. Обучение модели на общедоступных и лицензированных источниках данных в течение двухмесячного периода обошлось Databricks всего в $10 млн с использованием 3 тыс. ускорителей NVIDIA H100. По словам компании, при создании приложений генеративного ИИ модель DBRX можно использовать вместе с Databricks Mosaic AI, набором унифицированных инструментов для создания, развёртывания и мониторинга моделей ИИ. Базовая модель DBRX Base и продвинутая модель DBRX Instruct доступны по открытой лицензии для исследований и коммерческого использования на GitHub и Hugging Face. Разработчики могут уже сегодня создавать свои варианты DBRX на основе собственных данных на платформе Databricks.
28.03.2024 [21:03], Руслан Авдеев
Nautilus запустила линейку инфраструктурных решений EcoCore для модульных ЦОДNautilus Data Technologies запустила новую серию решений для модульных дата-центров на основе разработанных ранее технологий охлаждения. По данным Datacenter Dynamics, новый проект предлагает варианты для ЦОД ёмкостью до 2,5 МВт. По словам Nautilus, EcoCore расширяет эффективность сборных конструкций и упрощает процесс строительства, позволяя интегрировать рабочее пространство с техническими помещениями и размещать MEP-компоненты (электрику, водоснабжение и вентиляцию) на крыше. Конструкция использует четыре CDU-установки для кондиционирования, каждая из которых способна отводить до 833 кВт тепла. Система поддерживает как традиционные варианты охлаждения, так и современные жидкостные. Основной модуль электропитания (PEU) обеспечивает мощность 1250 кВт (415 В, три фазы), но есть и точно такой же резервный (N+1). Новинка будет развёрнута в Start Campus в Синише (Португалия) — впервые за пределами собственных мощностей Nautilus. EcoCore, по словам компании, соответствует запросам Start по организации бесперебойной работы серверов высокой плотности с СЖО. Компании договорились о сотрудничестве в прошлом году и заключили «многомегаваттное» соглашение. Первый модуль EcoCore будет развёрнут в ходе первой фазы строительства кампуса Start. В Nautilus и Start заявляют, что экобезопасные технологии первой задают новый стандарт в индустрии, обеспечивая непревзойдённые эффективность и адаптивность. Nautilus известна прежде всего проектами плавучих ЦОД и системой охлаждения дата-центров речной или морской водой. Пока компания выступает лишь оператором ЦОД-баржи в Стоктоне (Калифорния), но планирует построить и наземный объект в Мэне. Также в работе находятся и другие проекты в США, Франции и Ирландии. Меморандумы о взаимопонимании заключены в Таиланде и на Филиппинах. Впрочем, появление EcoCore, похоже, указывает на желание стать поставщиком решений для других операторов. Принадлежащая инвестиционному фонду Davidson Kempner и британской British Pioneer Point Partners компания Start намерена построить 495-МВт кампус площадью 60 га в Португалии. Компании заявили, что Nautilus поставит охладительные системы и для второй фазы проекта, предусматривающего расширение на 120 МВт. Ранее Start оказалась вовлечена в коррупционный скандал.
28.03.2024 [02:10], Владимир Мироненко
Atos планирует достичь соглашения о реструктуризации долгов к июлюНаходящийся в сложном финансовом положении французский IT-холдинг Atos расширил переговоры о реструктуризации долгов, включив в них держателей ценных бумаг, планируя заключить к июлю всеобъемлющее соглашение, пишет DatacenterDynamics со ссылкой на заявление Atos, сделанное после публикации отчёта о рекордных убытках за 2023 год. На данный момент долги холдинга составляют €4,65 млрд, причём €3,65 млрд необходимо погасить до конца 2025 года. Согласно отчёту, убытки Atos за прошлый год составили €3,44 млрд, превысив более чем в три раза убытки в 2022 году, равные €1,01 млрд. После публикации результатов стоимость акций Atos упала до нового исторического минимума в €1,59/шт. По сравнению с предыдущим годом выручка Atos почти не изменилась, увеличившись всего на 0,4 % до €10,6 млрд евро. Как утверждает холдинг, убытки большей частью возникли в результате обесценения активов обоих его подразделений — Eviden и Tech Foundations, созданных в рамках плана по оздоровлению, призванного вернуть бизнес к росту. Хотя первоначальная идея заключалась в том, чтобы управлять Eviden и Tech Foundations как отдельными публично зарегистрированными компаниями под эгидой Atos, долговые проблемы, с которыми столкнулся холдинг, привели к тому, что оба подразделения были выставлены на продажу. Как сообщается в пресс-релизе, переговоры по поводу потенциальной продажи Tech Foundations компании EPEI завершились ничем. Ранее было объявлено об отказе Airbus от планов покупки подразделения холдинга Big Data and Security (BDS). «Мы продолжим управлять Tech Foundations и Eviden как отдельными предприятиями и использовать сильные стороны их соответствующих предложений с помощью скоординированной стратегии выхода на рынок», — отметил холдинг.
26.03.2024 [16:06], Сергей Карасёв
«Аэродиск» представила СХД Engine AQ на платформе «Аквариуса»Компания «Аэродиск» анонсировала системы хранения данных серии Engine AQ, построенные на аппаратной платформе «Аквариуса». Изделия подходят для широкого круга задач, таких как виртуализация, базы данных, видеонаблюдение и высоконагруженные приложения корпоративного класса. В семейство вошли СХД среднего уровня Engine AQ 440/450/460 на базе Aquarius FS440/FS450/FS46. Они оснащаются процессорами Intel Xeon, а объём оперативной памяти в стандартной конфигурации составляет 256 Гбайт. Первая из названных систем выполнена в формате 4U с двумя контроллерами в едином корпусе. Допускается установка 24 накопителей SFF/LFF с интерфейсом SAS. Модификация FS450 использует шасси 2U+2U с двумя отдельно стоящими контроллерами: применяются дисковые модули расширения с общим количеством накопителей до 608 в расчёте на систему. Форм-фактор дисковых полок — 2U (12 × LFF/SFF), 2U (24 × SFF), 4U (24 × LFF/SFF), 4U (60 × LFF) и 4U (72 × LFF). Наконец, система FS46 получила исполнение 4U с двумя контроллерами в едином корпусе. Предусмотрены отсеки для 24 накопителей SFF/LFF с интерфейсом SAS. ![]() Источник изображения: «Аэродиск» Говорится, что одной из ключевых особенностей СХД серии Engine AQ является возможность репликации данных, что значительно повышает надёжность хранения информации. Кроме того, поддерживается организация метрокластера, обеспечивающего бесперебойную работу и доступность данных в распределённых вычислительных средах. «Новая СХД представляет собой идеальное решение для организаций, стремящихся максимизировать производительность и надёжность своих информационных систем с возможностью гибкой настройки под специфические бизнес-потребности», — говорится в сообщении «Аэродиска». Возможна организация All-Flash массивов исключительно на основе SSD. Архитектура обеспечивает дублирование всех компонентов СХД, что позволяет организовать доступность данных на уровне 99,999 %. В перспективе планируется выпуск СХД начального уровня Engine AQ «Лайт» для предприятий малого и среднего бизнеса.
25.03.2024 [15:07], Руслан Авдеев
AWS намерена вложить $5,8 млрд в строительство ЦОД в Южной Корее и уже приобрела участок для первого объектаГиперскейлер Amazon Web Services (AWS) приобрёл земельный участок для строительства дата-центра в Южной Корее и уже получил разрешение на возведение соответствующего объекта. По данным TelecomPaper, покупкой занималось дочернее подразделение — Amazon Corporate Services Korea. И это только часть масштабного плана инвестиций в ЦОД на территории страны. По имеющимся сведениям, дочернее предприятие Amazon приобрело землю и другую недвижимость в окрестностях города Инчхон — разрешение на строительство получено недавно. ЦОД будет занимать площадь 32,475 м2 — речь идёт о комплексе высотой в семь этажей общей ёмкостью около 100 МВт. Кампус будет включать четыре дата-центра, а также телекоммуникационную площадку. Общий план AWS значительно масштабнее. Ещё в прошлом году компания заявила о намерении вложить в местную облачную инфраструктуру ₩7,85 трлн (более $5,8 млрд) в течение 5 лет, а таже сформировать 12,3 тыс рабочих мест. Теперь же сообщается, что AWS завершила подготовку подробного проекта кампуса ЦОД и начала выбирать подрядчика, готового взяться за непосредственную реализацию проекта. Amazon эти сообщения не комментирует. Это не единственный масштабный проект, связанный со строительством дата-центров в Южной Корее. В феврале 2024 года появилась информация о намерении создать в стране кластера из 50 ЦОД общей ёмкостью 1 ГВт, по 20 МВт каждый.
23.03.2024 [15:53], Сергей Карасёв
VK купила YClients почти за 4 млрд руб.Интернет-холдинг VK завершил сделку по приобретению YClients — крупнейшей российской платформы онлайн-записи и автоматизации бизнеса в сфере услуг. В начале 2024 года VK выплатил 1,2 млрд руб. в качестве отложенного вознаграждения за покупку сервиса, тогда как общая стоимость актива составила 3,9 млрд руб. В обнародованном финансовом отчёте VK говорится, что соглашение о покупке 100% долей в группе компаний YClients было заключено в декабре 2023-го. Эта SaaS-платформа предназначена для онлайн-записи, автоматизации работы с клиентской базой и уведомлениями. Кроме того, она предоставляет функции аналитики, финансового и складского учёта, позволяет вести программу лояльности и осуществлять другие бизнес-процессы. ![]() Источник изображения: YClients YClients разрабатывает различные облачные продукты, такие как «Арника», «Дента», SQNS и др. Их пользователями являются около 45 тыс. представителей малого и среднего бизнеса, а ежемесячно компания обрабатывает более 18 млн записей. VK планирует осуществить «бесшовную интеграцию» сервисов Yclients в свои платформы. В частности, на сегодняшний день «Календарь Mail.ru» интегрировался с платформой автоматизации YClients, добавив возможность автоматического создания события через онлайн-запись или приложение YPlaces. Благодаря этому пользователи могут добавить напоминание о предстоящем мероприятии в свой «Календарь Mail.ru» с помощью одной кнопки. В YClients доступна интеграция с IP-телефонией: Telefon-IP, Hotlead, Mango Office. Благодаря этому ускоряется обработка звонков. Можно контролировать поток входящих вызовов и сохранять записи разговоров, чтобы анализировать их и оперативно реагировать на нестандартные ситуации. Кроме того, поддерживается интеграция с кассовым оборудованием. YClients даёт возможность следить за всеми скидками, бонусами, сертификатами и абонементами в фоновом режиме. В целом, с помощью YClients клиент может встроить форму для записи на собственный сайт и 15 популярных партнёрских площадок, где пользователи ищут те или иные услуги.
22.03.2024 [16:15], Сергей Карасёв
IBS: более четверти российских компаний перешли на импортонезависимые альтернативы SAPОпрос, проведённый группой компаний IBS, показал, что приблизительно 28 % российских организаций в сфере крупного бизнеса отказались от ERP-систем SAP и перешли на альтернативные импортонезависимые решения. Ещё треть предприятий начали процесс миграции, тогда как 33 % планируют перейти на отечественные продукты в ближайшие два года. В 2022 году SAP заявила о том, что покинет российский рынок. 20 марта 2024 года компания закрыла российским пользователям доступ к своим облачным сервисам. К концу 2023 года на отечественные аналоги софта SAP перешли только 15–20 % российских компаний. Согласно результатам исследования IBS, в настоящее время SAP занимает две трети — 66 % — российского рынка ERP-систем. Ещё около 30 % контролирует 1С, а третье место удерживает «Галактика» с долей приблизительно 2 %. При этом 40 % компаний, которые уже перешли на 1С, решают вопрос обслуживания системы силами франчайзи, 28 % — пользуются услугами IT-сервисных компаний, а у 32 % есть собственные группы поддержки. 57 % пользователей систем 1С готовы в ближайшее время передать их поддержку на аутсорс, поскольку услуги профильных компаний стоят дешевле, чем собственная команда. Но 19 % заказчиков из-за специфики бизнеса продолжат осуществлять обслуживание собственными силами. При выборе подрядчика одним из ключевых факторов является наличие большого опыта по сопровождению систем — об этом заявили 32 % респондентов. Ещё 30 % назвали важным критерием стоимость услуги, а 25 % указали на необходимость присутствия в команде подрядчика высококлассных специалистов. «Мы видим существенный рост спроса на услуги поддержки отечественных ERP-систем, бесспорным лидером среди которых является 1С. По нашей оценке, за 2023 год интерес на аутсорсинг именно по решениям этого вендора вырос на 63 %, что подтверждают результаты нашего опроса», — говорит руководитель дирекции продаж IBS.
21.03.2024 [22:21], Сергей Карасёв
Eviden создаст для Дании ИИ-суперкомпьютер Gefion на базе NVIDIA DGX SuperPOD H100Компания Eviden, дочерняя структура Atos, объявила о заключении соглашения с Датским центром инноваций в области искусственного интеллекта (Danish Centre for AI Innovation) на создание передового суперкомпьютера для решения ИИ-задач. Вычислительный комплекс под названием Gefion, как ожидается, заработает до конца текущего года. Как сообщается, в основу Gefion ляжет платформа NVIDIA DGX SuperPOD. Конфигурация включает 191 систему NVIDIA DGX H100, а общее количество ускорителей NVIDIA H100 составит 1528 штук. Говорится о применении интерконнекта NVIDIA Quantum-2 InfiniBand. В состав суперкомпьютера также войдут 382 процессора Intel Xeon Platinum 8480C поколения Sapphire Rapids. Эти чипы насчитывают 56 ядер (112 потоков), работающих на частоте 2,0/3,8 ГГц. Для подсистемы хранения выбрано решение DataDirect Networks (DDN). Ожидаемая ИИ-производительность Gefion на операциях FP8 составит около 6 Эфлопс. В рамках проекта Eviden отвечает за доставку компонентов комплекса, монтаж и пуско-наладочные работы. Система разместится в дата-центре Digital Realty. Её питание будет на 100 % обеспечиваться за счёт энергии из возобновляемых источников. Датский центр инноваций в области ИИ принадлежит фонду Novo Nordisk Foundation и Экспортно-инвестиционному фонду Дании. При этом Novo Nordisk Foundation, основанный в Дании ещё в 1924 году, представляет собой корпоративный фонд с филантропическими целями. Его видение заключается в улучшении здоровья людей, повышении устойчивости общества и планеты. Отмечается, что Novo Nordisk Foundation обеспечит финансирование центра в размере примерно 600 млн датских крон (около $87,5 млн), а Экспортно-инвестиционный фонд — 100 млн датских крон ($14,6 млн).
21.03.2024 [18:27], Сергей Карасёв
Astera Labs привлекла более $700 млн в ходе IPO, а оценка компании выросла до $5,5 млрдКомпания Astera Labs провела первичное публичное размещение акций (IPO) на бирже Nasdaq. Стоимость ценных бумаг составила $36, что значительно выше ранее объявленного диапазона в $27–$30. В результате Astera Labs смогла привлечь приблизительно $712,8 млн. По итогам IPO рыночная стоимость компании оценивается в $5,5 млрд. О том, что Astera Labs намерена выйти на биржу, стало известно в начале февраля 2024 года. Позднее стартап направил документы об IPO в Комиссию по ценным бумагам и биржам США (SEC), а затем раскрыл подробности размещения. IPO проведено при поддержке Morgan Stanley, JP Morgan, Barclays, Deutsche Bank Securities, Evercore ISI, Jefferies, Needham & Company, Stifel, Craig-Hallum Capital Group, Roth Capital Partners, Loop Capital Markets и Siebert Williams Shank. ![]() Источник изображения: Astera Labs Как теперь сообщается, в рамках IPO предложены 19,8 млн обыкновенных акций. Из них 16 788 903 бумаги реализованы непосредственно Astera Labs, а ещё 3 011 097 акций — акционерами компании. Кроме того, андеррайтеры получили 30-дневный опцион на приобретение до 2 970 000 дополнительных обыкновенных акций у Astera Labs по цене первоначального публичного размещения (за вычетом андеррайтинговых скидок и комиссий). Бумаги уже начали торговаться на Nasdaq под тикером ALAB. Стоимость ценных бумаг Astera Labs по итогам первого дня торгов достигла $62,03, что соответствует росту примерно на 72 % по сравнению с начальной ценой размещения. Это свидетельствует о высоком интересе инвесторов к компании на фоне стремительного развития технологий ИИ. Astera Labs проектирует решения, позволяющие серверным компонентам обмениваться данными с высокой скоростью. Компания предлагает решения PCIe, CXL и Ethernet.
21.03.2024 [00:51], Владимир Мироненко
Облачный ИИ-суперкомпьютер AWS Project Ceiba получит 21 тыс. суперчипов NVIDIA GB200
aws
b100
dgx cloud
gb200
gtc 2024
hardware
nvidia
ии
инференс
информационная безопасность
облако
суперкомпьютер
Amazon Web Services (AWS) и NVIDIA объявили о расширении сотрудничества, в рамках которого ускорители GB200 и B100 вскоре появятся в облаке AWS. Кроме того, компании объявили об интеграции Amazon SageMaker с NVIDIA NIM для предоставления клиентам более быстрого и дешёвого инференса, о появлении в AWS HealthOmics новых базовых моделей NVIDIA BioNeMo, а также о поддержке AWS обновлённой платформы NVIDIA AI Enterprise. Сотрудничество двух компаний позволило объединить в единую инфраструктуру их новейшие технологии, в том числе многоузловые системы на базе чипов NVIDIA Blackwell, ПО для ИИ, AWS Nitro, сервис управления ключами AWS Key Management Service (AWS KMS), сетевые адаптеры Elastic Fabric (EFA) и кластеры EC2 UltraCluster. Предложенная инфраструктура и инструменты позволят клиентам создавать и запускать LLM с несколькими триллионами параметров быстрее, в больших масштабах и с меньшими затратами, чем позволяли EC2-инстансы с ускорителями NVIDIA прошлого поколения. AWS предложит кластеры EC2 UltraClusters из суперускорителей GB200 NVL72, которые позволят объединить тысячи чипов GB200. GB200 будут доступны и в составе инстансов NVIDIA DGX Cloud. AWS также предложит EC2 UltraClusters с ускорителями B100. Amazon отмечает, что сочетание AWS Nitro и NVIDIA GB200 ещё больше повысит защиту ИИ-моделей: GB200 обеспечивает шифрование NVLink, EFA шифрует данные при передаче между узлами кластера, а KMS позволяет централизованно управлять ключами шифрования. Аппаратный гипервизор AWS Nitro, как и прежде, разгружает CPU узлов, беря на себя обработку IO-операций, а также защищает код и данные во время работы с ними. Эта возможность, доступная только в сервисах AWS, была проверена и подтверждена NCC Group. Инстансы с GB200 поддерживают анклавы AWS Nitro Enclaves, что позволяет напрямую взаимодействовать с ускорителем и данными в изолированной и защищённой среде, доступа к которой нет даже у сотрудников Amazon. Чипы Blackwell будут использоваться в обновлённом облачном суперкомпьютере AWS Project Ceiba, который будет использоваться NVIDIA для исследований и разработок в области LLM, генерация изображений/видео/3D, моделирования, цифровой биологии, робототехники, беспилотных авто, предсказания климата и т.д. Эта первая в своём роде машина на базе GB200 NVL72 будет состоять из 20 736 суперчипов GB200, причём каждый из них получит 800-Гбит/с EFA-подключение. Пиковая FP8-производительность системы составит 414 Эфлопс. |
|