Материалы по тегу: ии

23.08.2024 [14:19], Руслан Авдеев

Принадлежащая Indosat индонезийская Lintasarta запустила ИИ-облако Merdeka на базе решений NVIDIA

Занимающаяся IT-услугами индонезийская компания Lintasarta запустила облачный ИИ-сервис GPU Merdeka. По данным Datacenter Dynamics, бизнес принадлежит Indosat и будет предлагать услуги в формате GPU-as-a-Service (GPUaaS). Ранее в этом году было объявлено, что NVIDIA и Indosat построят в Индонезии ИИ ЦОД стоимостью $200 млн в Суракарте (Surakarta).

Речь идёт о суверенном ИИ-облаке на основе серверов с восемью NVIDIA H100 (SXM). Сам ЦОД поддерживает до 20 кВт на стойку. Как заявляют в Indosat, благодаря знаковому партнёрству с NVIDIA, компания намерена демократизировать доступ к облачным ИИ-сервисам, сделав соответствующие услуги более доступными в Индонезии и соседних странах. Также компания намерена ускорить рост индонезийской цифровой экономики.

 Источник изображения: Harry Kessell/unsplash.com

Источник изображения: Harry Kessell/unsplash.com

Облако Merdeka, по словам Lintasarta, является важной вехой на пути превращения в специализирующуюся на ИИ технологическую компанию. Ожидается, что технологии и опыт Lintasarta помогут стране в достижении целей стратегии 2045 Golden Indonesia Vision.

IT-система страны нуждается в модернизации. Совсем недавно хакеры заблокировали правительственный ЦОД в стране, потребовав за ключ дешифровки $80 млн, из-за чего нарушилась работа государственных и медицинских учреждений, транспортной инфраструктуры и т.п. Выяснилось, что резервных копий почти никто не делал. В конце концов злоумышленники бесплатно прислали ключ и извинились, но репутация страны в области IT оказалась подпорчена. При этом соседняя Малайзия стремительно наращивает компетенции в области ЦОД и ИИ, намереваясь стать региональным IT-лидером.

Постоянный URL: http://servernews.ru/1109903
23.08.2024 [11:04], Сергей Карасёв

Российские госкомпании заинтересовались отечественными серверами с четырьмя процессорами

Министерство промышленности и торговли РФ (Минпромторг), по сообщению газеты «Коммерсантъ», направило в консорциум «Вычислительная техника» (АНО ВТ) письмо с просьбой предоставить информацию о производстве в России серверов, поддерживающих установку четырёх процессоров.

Запрос направлен на имя главы АНО ВТ. Ведомство просит предоставить сведения о 4-сокетных системах, статусе их производства и ведущихся разработках. Говорится, что в Минпромторг начали поступать заявки на такое оборудование от госкомпаний для исполнения постановления правительства №2013 «О минимальной доле закупок товаров российского происхождения».

 Источник изображения: Fplus

Источник изображения: Fplus

Как пишет «Коммерсантъ», на сегодняшний день производить серверы с четырьмя процессорами могут только две российские компании — Fplus и Yadro. В частности, Fplus в мае нынешнего года представила систему «Буран-SR242» (SR-242E31-624T) для решения ИИ-задач, работы с большими данными, создания цифровых двойников, НРС-нагрузок и т.д. Эта платформа поддерживает использование четырёх чипов Intel Xeon Sapphire Rapids с TDP до 350 Вт. Ожидается, что «Буран SR-242» войдет в реестр российской электроники в III квартале 2024 года.

Fplus намерена организовать выпуск 4-сокетных серверов на предприятии холдинга в Подмосковье. Планируется, что до конца 2024 года будет изготовлено около 500 таких систем, а в 2025-м — ещё 2 тыс. Компания Yadro, в свою очередь, намерена освоить производство серверов с четырьмя процессорами на заводе «Ядро фаб Дубна». Выпуск таких устройств будет налажен «в ближайшее время».

Директор департамента серверных и сетевых систем компании «Гравитон» считает, что российские производители 4-сокетных серверов могут столкнуться с трудностями по возврату инвестиций. Связано это с тем, что количество заказчиков, скорее всего, будет ограниченным. Еще одним препятствием может стать высокая стоимость компонентов.

Постоянный URL: http://servernews.ru/1109888
23.08.2024 [08:17], Руслан Авдеев

Гиперскейлеры стремительно застраивают США дата-центрами для ИИ

Согласно исследованию CBRE, количество строящихся дата-центров стремительно растёт из-за бума ИИ-систем, передаёт The Register. При этом, как сообщается в докладе, на ведущих рынках Северной Америки за последний год рост составил около 70 %, достигнув рекордных 3,87 ГВт. В числе самых быстрорастущих регионов — Атланта, где объёмы строительства ЦОД выросли на 76 % год к году до примерно 1,3 ГВт. В Техасе (Остине и Сан-Антонио) строится 463 МВт новой ёмкости ЦОД, вчетверо с лишним больше, чем годом ранее.

Быстрая экспансия сдерживается недостатком доступной ЦОД электроэнергии и длительным временем создания критической инфраструктуры, необходимой для ввода объектов в эксплуатацию. Впрочем, даже когда эти объекты заработают, только около 20 % их ресурсов будут доступны обычным пользователям, порядка 80 % на 3,87 ГВт уже зарезервировано гиперскейлерами, облачными провайдерами и операторами ЦОД, сдающими ИИ-ускорители в аренду.

В CBRE сообщают, что ёмкость ЦОД на ключевых рынках в I половине 2024 года выросла на 10 %, объекты на 1,1 ГВт заработали в прошлом году. Однако доступность ёмкостей всё равно ограничена, поскольку в среднем в указанных регионах свободны всего 2,8 % ресурсов. Впрочем, при желании можно обратиться к менее популярным территориям вроде Центрального Вашингтона, Миннеаполиса, Хьюстона или Денвера, поскольку на второстепенных рынках Северной Америки свободны 10 %.

 Источник изображения: CBRE

Источник изображения: CBRE

Недостаток новых ЦОД и высокий спрос ведёт к росту цен, хотя не такому быстрому, как в прошлом году. Средний ежемесячный запрос составляет 250–500 кВт на ключевых рынках, рост в I квартале 2024 года составил 7 % до $174/кВт в месяц. Арендная плата, как ожидается, продолжит расти и во II полугодии, во многом из-за роста стоимости строительства и оборудования. Тенденция также обусловлена и использованием более ресурсоёмких ИИ-ускорителей. Например, потребление одного ускорителя NVIDIA Blackwell может достигать 1200 Вт, он изначально рассчитан на использование СЖО.

По мнению экспертов CBRE, в результате строительство новых ЦОД будет только дорожать. С другой стороны, менее требовательным пользователям могут стать более доступными плохо оснащённые старые дата-центры, не готовые для работы с современными ускорителями. Прогнозируется, что второстепенные рынки в Северной Индиане, Айдахо, Арканзасе и Канзасе благодаря обилию дешёвой земли и энергии могут стать новыми центрами развития ЦОД.

 Источник изображения: CBRE

Источник изображения: CBRE

Что касается энергии, то дефицит трансформаторов, переключателей и генераторов продолжится ещё четыре года, что не может не сказаться на времени строительства дата-центров. В CBRE отмечают, что клиенты, желающие получить требуемую ёмкость в срок, должны заключать соглашения за 2–4 года до предполагаемого ввода объектов в эксплуатацию.

Постоянный URL: http://servernews.ru/1109852
22.08.2024 [23:31], Владимир Мироненко

Microsoft изменила отчётность, чтобы полнее отражать вклад ИИ в финансовые результаты

Microsoft изменила принцип формирования отчётности своих бизнес-подразделений, в связи с чем часть доходов от поиска и новостной рекламы теперь отражается в финансовых результатах подразделения облачных вычислений Azure. Microsoft объяснила изменения стремлением дать инвесторам более чёткое представление о вкладе ИИ в работу компании, пишет Reuters.

Вместе с тем доходы от услуг ИИ и речевых технологий, которые предлагает подразделение Nuance, теперь будут относиться к сегменту Productivity and Business Processes (офисные приложения Office и Office 365, Dynamics CRM) вместо сегмента Intelligent Cloud, включающего облачные сервисы, а также Enterprise Services, Windows Server и SQL Server.

 Источник изображения: Pixabay

Источник изображения: Pixabay

В компании сообщили, что изменения позволят привести структуру отчётности в соответствие с тем, как управляется её бизнес. Компания уже откорректировала показатели выручки по подразделениям за последний финансовый год и пересмотрела свой прогноз на квартал с июля по сентябрь. Microsoft — одна из немногих крупных технологических компаний, которая отдельно сообщает о вкладе ИИ в своей выручке, поскольку большинство компаний ещё не увидели большого прироста от инвестиций в ИИ.

В прошлом месяце компания сообщила, что ИИ обеспечил большее влияние на рост показателей Azure в последнем квартале, несмотря на общее замедление бизнеса. Также Microsoft ожидает ускорение роста показателей Azure во II половине 2025 финансового года. Согласно обновлённому прогнозу, в I квартале 2025 финансового года подразделение Intelligent Cloud получит выручку в пределах от $23,80 млрд до $24,10 млрд по сравнению с предыдущим прогнозам в размере $28,6–$28,9 млрд. Ожидаемый доход подразделения Productivity and Business Processes в I квартале находится в диапазоне от $27,75 до $28,05 млрд по сравнению с предыдущим прогнозом в пределах от $20,3 до $20,6 млрд.

Постоянный URL: http://servernews.ru/1109866
22.08.2024 [18:15], Елена Копытова

Lambda Labs и SK Telecom построят крупнейший в Южной Корее облачный ИИ-кластер

Стартап Lambda Labs, специализирующийся на предоставлении в аренду облачных ИИ-мощностей, заключил партнёрство с крупнейшей южнокорейской телекоммуникационной компанией SK Telecom (SKT), пишет DataCentre Dynamics. В рамках сотрудничества SK Telecom до конца года развернёт облачную ИИ-платформу Lambda AI Cloud в дата-центре SK Broadband в Касане (Gasan). Со временем планируется разместить в ЦОД тысячи ускорителей.

«SKT разделяет наше видение того, как сделать GPU-вычисления такими же повсеместными, как электричество», — говорит генеральный директор и соучредитель Lambda Стивен Балабан (Stephen Balaban). «Учитывая быстрый темп инноваций в области ИИ, происходящих в Южной Корее, мы рады сотрудничать с SKT в их миссии по превращению своей компании и страны в глобальную ИИ-державу».

ЦОД в Касане был запущен в 2021 году. На тот момент он имел ёмкость 46 МВт и площадь 69,3 тыс. м². SKT говорит, что сейчас площадка предлагает до 44 кВт на стойку. SK Broadband также управляет дата-центрами в Сочхо (Seocho), Илсане (Ilsan) и Пундангу (Bundang). «Мы построим крупнейший в Корее кластер ускорителей, чтобы повысить конкурентоспособность национального ИИ, и выйдем на мировой рынок», — сказал Ким Кён Док (Kim Kyeong Deog), вице-президент и глава корпоративного подразделения SK Telecom.

 Источник изображения: Lambda Labs

Источник изображения: Lambda Labs

Какие именно ускорители будут использоваться в ИИ-облаке, не уточняется, хотя Lambda традиционно полагается на чипы NVIDIA. SK Group владеет долями в южнокорейских разработчиках ИИ-ускорителей Sapeon и Rebellions, которые объединятся под началом SK, чтобы вместе противостоять NVIDIA. В свою очередь в прошлом месяце SKT объявила об инвестировании $200 млн в американскую компанию Smart Global Holdings (Penguin Solutions), которая занимается ИИ- и HPC-инфраструктурой. А для Lambda сотрудничество с SKT стало первым за пределами Северной Америки, где компания управляет двумя ЦОД.

Постоянный URL: http://servernews.ru/1109851
22.08.2024 [15:40], Владимир Мироненко

YADRO переработала архитектуру ПО в СХД TATLIN.UNIFIED: мгновенные снимки и прочие апдейты

Компания YADRO объявила о выходе обновления программного обеспечения v3.1 для систем хранения данных TATLIN.UNIFIED первого и второго поколения, включающего целый ряд значительных функциональных изменений, разработанных в ответ на актуальные потребности российских заказчиков.

YADRO TATLIN.UNIFIED — российская гибридная СХД корпоративного уровня, обеспечивающая блочный доступ к данным по протоколам FC и iSCSI и поддерживающая одновременное использование дисковых и твердотельных накопителей.

В обновлённой версии ПО полноценно реализована технология создания мгновенных снимков (snapshot, снапшот), позволяющая получать снимки тома («ресурса» в терминологии TATLIN.UNIFIED) или группы томов для быстрого восстановления данных в случае их потери или поломки, выполнять резервное копирование данных через Backup Agent, а также создавать компактные временные копии мастер-тома для чтения и записи.

 Источник изображений: YADRO

Источник изображений: YADRO

Для реализации функции снапшотов в архитектуре TATLIN.UNIFIED были сделаны фундаментальные изменения. Был добавлен «маппер» (пул косвенной адресации), позволяющий динамически отображать адресное пространство тома на физический адрес, используя дополнительное хранилище с мета-данными. Речь идёт о «тонких» томах с косвенной адресацией, обеспечивающих высокую гранулярность работы с данными на уровне 4K-блоков. При этом используется технология Redirect-On-Write, позволяющая превратить паттерн случайной нагрузки в последовательную запись на диск, увеличивая производительность. Таким образом, эффективно реализовано создание снимков, клонирование и откат к выбранному снимку.

Косвенная адресация как раз и позволяет создавать мгновенные снимки, не занимающие дополнительного места, поскольку фактически речь идёт только о создании копии мета-данных со ссылками на физические адреса хранения. Новые данные в родительском ресурсе (или клоне), естественно, записываются в новые физически блоки, если, конечно, они не совпадают с уже имеющимися. В дальнейшем «маппер» послужит фундаментом для реализации таких функций, как дедупликация и компрессия данных. По словам разработчиков, снапшоты делают их на шаг ближе к асинхронной репликации и метро-кластеру.

Наконец, ресурсы с косвенной адресацией (до 8 шт.) можно объединить в группы консистентности, для которых гарантируется очередность записи в момент снятия снимка. Фактически в этот момент ресурсы замораживаются, чтобы не нарушить целостность данных во время создания снапшота. На данный момент ведутся работы по интеграции с zVirt, Basis DynamiX, Киберпротект и RuBackup, что позволит создавать консистентные с точки зрения приложений снимки. Кроме того, упомянута интеграция с OpenStack в рамках TATLIN.SATELLITES.

Также был усовершенствован интерфейс WebUI: переработаны разделы «Логическая структура» и «Аппаратная платформа», добавлена секция со списком документации в настройках системы, расширена интеграция с корпоративными каталогами для файлового протокола SMB, доработан механизм Call Home.

Постоянный URL: http://servernews.ru/1109771
22.08.2024 [09:23], Руслан Авдеев

ЦОД в Вирджинии потребляют огромные объёмы питьевой воды, а развитие ИИ только усугубляет ситуацию

Озабоченность экоактивистов вероятным воздействием ЦОД на природу штата Вирджиния (США) стала ещё серьёзнее. Financial Times сообщает, что потребление воды дата-центрами выросло почти на ⅔ в сравнении с 2019 годом, а рост спроса на ИИ только ухудшает положение.

Северная Вирджиния давно считается мировой столицей ЦОД, там работает порядка 300 соответствующих объектов. По данным Financial Times, за последние пять лет потребление воды в некоторых округах выросло почти на ⅔ — соответствующие данные были собраны энтузиастами благодаря законам о свободе информации, передаёт The Register. Около 7 млн м3 воды было использовано в 2023 году, тогда как в 2019 году — около 4,3 млн м3. В ЦОД вода используется в основном для охлаждения.

В обозримом будущем ожидается рост расхода воды, связанный с ИИ, поскольку соответствующее оборудование потребляет всё больше энергии и работает безостановочно. Так, на одну беседу с ChatGPT уходит примерно поллитра воды. При этом некоторые ЦОД находятся в регионах с дефицитом питьевой воды — даже части Вирджинии страдают от засух. Более того, во время засух и жаркой погоды дата-центрам требуется больше воды, чем обычно.

 Источник изображения: Jack B/unspalsh.com

Источник изображения: Jack B/unspalsh.com

Хотя именно в Вирджинии, согласно данным Northern Virginia Technology Council, с 2015 по 2023 гг. ёмкость объектов увеличилась в пять раз. Экоактивисты, политики и просто неравнодушные граждане, обеспокоенные тем, что ЦОД занимают всё больше земли и тратят всё больше энергии и воды, сформировали НКО Virginia Data Center Reform Coalition в попытке остановить бесконтрольный рост дата-центров в штате.

Так, в одном из отчётов заявляется, что ЦОД, обслуживаемые коммунальными службами только в округе Лаудон (Loudoun) Северной Вирджинии, увеличили использование питьевой воды более чем на 250 % с 2019 по 2023 гг. Впрочем, представитель компании Aquatech заявил, что большинство ЦОД в округе используют переработанные сточные воды, которые иначе просто слили бы в Чесапикский залив, а многие новые ЦОД вообще не забирают воду для охлаждения.

Крупнейшие операторы вроде AWS берут на себя обязательства по снижению потребления воды, компания ещё в 2022 году анонсировала намерение стать «водно-положительной» к 2030 году. Впрочем, в Microsoft, наоборот, признали, что в прошлом году потребление воды на её объектах выросло на треть — виной тому именно развитие генеративных ИИ-систем. Дефицит водных ресурсов наблюдается и в других регионах. Так, британская Thames Water пригрозила урезать подачу воды дата-центрам или взвинтить цены.

Постоянный URL: http://servernews.ru/1109708
22.08.2024 [00:13], Руслан Авдеев

Alibaba и Tencent отметили стабилизацию спроса на облачные CPU и рост спроса на ИИ-ускорители

Спрос на CPU-мощности в ключевых китайских облаках Alibaba Cloud и Tencent Cloud выровнялся и теперь клиентов больше интересуют ИИ-ускорители, сообщает The Register. Рост спроса на предложения, связанные с ИИ, зарегистрировала и Lenovo.

На прошлой неделе Alibaba и Tencent опубликовали квартальную отчётность, выручка Alibaba Cloud выросла год к году на 6 % до $3,7 млрд. Tencent не раскрывает показатели гиперскейл-сегмента, но отмечает рост спроса на облачные сервисы, благодаря чему квартальные показатели подразделения Business Services выросли год к году на «десятки процентов».

Представитель Tencent объявил инвесторам, что бизнес по аренде ИИ-ускорителей переживает настоящий бум. Впрочем, абсолютные показатели достаточно скромные в сравнении с американским рынком, поскольку у КНР меньше хорошо финансируемых ИИ-стартапов. По некоторым данным, местные стартапы часто располагают $1–$2 млрд, тогда как в США объём инвестиций может достигать и $10–$90 млрд. Tencent в любом случае не теряет клиентов даже на фоне замещения CPU на GPU.

В Alibaba сообщают, что спрос на ИИ-продукты и связанные технологии очень большой, причём он всё ещё далёк от удовлетворения. Для Alibaba Cloud во II половине 2024 года прогнозируется двузначный рост в процентах и большая часть выручки придётся на ИИ-продукты. При этом в Alibaba констатируют, что спрос на традиционные вычисления в облаке на базе классических процессоров ограничен, большая часть роста связана именно с ИИ-продуктами на основе ускорителей.

 Источник изображения:  Growtika/unsplash.com

Источник изображения: Growtika/unsplash.com

В Lenovo тоже сообщили, что в подразделении Infrastructure Solutions Group (ISG) зарегистрирован рекордный рост выручки до $3,2 млрд — это на 65 % выше год к году, частично благодаря спросу на ИИ-решения, причём и на базе обычных серверов, и на базе систем с ИИ-ускорителями. Инвесторам объявили, что оживлённые вложения в ИИ-инфраструктуру и улучшение поставок ускорителей помогут компании вырасти.

Пока же ISG отчиталась о квартальных убытках в объёме $37 млн. Впрочем, это лучше, чем $60,4 млн убытков в аналогичном квартале прошлого года и $97 млн в прошлом квартале. В ходе отчёта экспертов заинтересовало, почему рост выручки на 65 % не привёл к прибыльности соответствующего бизнеса. В самой компании обещают дальнейшую оптимизацию бизнеса в соответствии с требованиями эры гибридных и ИИ-вычислений. Другими словами, не исключены увольнения и/или сокращение продуктовых линеек.

Постоянный URL: http://servernews.ru/1109761
21.08.2024 [12:15], Елена Копытова

«Базис» расширил возможности DevOps-конвейера разработки Basis Digital Energy

Компания «Базис», российский разработчик решений для организации динамической инфраструктуры, виртуальных рабочих мест и оказания облачных услуг, выпустила новую версию 1.3.0 своего DevOps-конвейера для организации полного цикла разработки, тестирования и сопровождения информационной системы Basis Digital Energy, одного из ключевых продуктов в экосистеме компании. В новом релизе были добавлены более 30 новых функций, расширяющих возможности Digital Energy, в том числе обеспечивающих работу в закрытом контуре организации, проверку кластера на соответствие стандартам CIS Benchmark и расширенную совместимость с Basis Dynamix, платформой для управления виртуальными средами.

Переносите старые кластеры и создавайте новые

Одним из ключевых новшеств версии 1.3.0 стала возможность создания кластера типа Digital Energy. Теперь администратор может инициировать создание виртуальной машины в Basis Dynamix — другом флагманском решении экосистемы «Базис» — с последующей передачей управления в Digital Energy. Вместе с этим появилась возможность добавлять и удалять управляющие и рабочие узлы кластера Digital Energy, а также проверять их на соответствие стандартам безопасности CIS Benchmark. В качестве операционной системы узла кластера могут использоваться ОС «Альт» и Ubuntu.

Если в организации уже существуют кластеры от какого-либо поставщика, их можно добавить в Basis Digital Energy через конфигурационный файл Kubernetes. После этого можно будет управлять приложениями внутри кластера через веб-интерфейс Basis Digital Energy.

Для улучшения качества работы с кластерами были добавлены функция формирования журнала заданий, позволяющая видеть историю и результаты выполнения всех заданий внутри созданного кластера, и функция автомасштабирования (в бета-версии). Последняя в случае исчерпания ресурсов узла распределяет копии ресурсоемкого приложения по другим узлам внутри кластера, а при необходимости может заказывать новые виртуальные машины (ВМ) в Basis Dynamix, подключать их к уже существующему кластеру и распределять копии приложения по этим ВМ. Все это обеспечивает запущенному приложению нужные ресурсы для вычислений и одновременно позволяет избежать сбоев в его работе.

 Рис 1. Окно создания кластера (Источник здесь и далее: «Базис»)

Рис 1. Окно создания кластера (Источник здесь и далее: «Базис»)

Работайте с локальным кластером в закрытом контуре

Другим ключевым новшеством Basis Digital Energy 1.3.0 стала поддержка локальных (непубличных) репозиториев чартов, пакетов, образов приложений и контейнеров. Возможность развернуть кластер в закрытом контуре важна в первую очередь для организаций с высокими требованиями к защите информационных систем, например, для субъектов КИИ. Невозможность получить из интернета удаленный доступ к кластерам существенно уменьшает поверхность атаки на IT-системы организации, т.е. увеличивает ее защищенность.

Назначайте пользователям роли

Дополнительную защиту от информационных угроз обеспечат новая ролевая модель пользователей и средства разграничения доступа. В Basis Digital Energy 1.3.0 стало возможно настраивать политики с ограничением действий различных пользователей внутри продукта. Более того, благодаря гибкости ролевой модели, для каждого пользователя может создаваться своя политика.

Также в новой версии Digital Energy появились два инструмента авторизации, интегрированные в Basis Dynamix — через decs3o и Basis Virtual Security; выбор зависит от текущей конфигурации продукта. Благодаря этим инструментам сотрудник организации может практически бесшовно работать с различными продуктами в рамках экосистемы «Базис».

 Рис. 2. Интерфейс редактирования списка пользователей

Рис. 2. Интерфейс редактирования списка пользователей

Расширяйте возможности с помощью плагинов и приложений

В релизе Basis Digital Energy 1.3.0 появилась поддержка наиболее популярных на рынке плагинов CNI (Container Networking Interface) — Flannel и Calico, а также двух инструментов контейнеризации — containerd и CRI-O. Подключить плагины как сетевые интерфейсы и включить в кластер средства работы с контейнерами, альтернативные Docker, можно при создании кластера типа Digital Energy. В дальнейшем список поддерживаемых плагинов и инструментов будет расширяться.

Наконец, в версии 1.3.0 появилась возможность через веб-интерфейс буквально парой кликов установить ряд популярных приложений, в числе которых Longhorn, Jenkins, GitLab, Vault, Redmine и множество других. Ранее установка этих (и любых других) приложений была возможна только через командную строку, а при таком подходе описание конфигураций для приложений отнимало много сил и времени.

 Рис. 3. Интерфейс установки приложений

Рис. 3. Интерфейс установки приложений

«В нашей экосистеме Digital Energy является одним из самых быстроразвивающихся продуктов, поэтому в каждом релизе количество новых возможностей измеряется десятками. Версия 1.3.0 принесла нашим заказчикам инструменты для работы с кластерами, в том числе кластерами типа Digital Energy, обновленную ролевую модель пользователей, поддержку работы в закрытом контуре и другие преимущества. Мы поставили перед собой задачу сделать из Digital Energy лучший продукт на рынке и вполне осознаем, что это долгий и непростой путь, но уверены, что движемся в правильном направлении. Об этом говорят результаты независимых тестов: недавно наше решение вошло в первую тройку рейтинга российских платформ Kubernetes по версии отраслевого портала CNews», — отметил Дмитрий Сорокин, технический директор «Базис».

Реклама | ООО "БАЗИС" ИНН 7731316059 erid: F7NfYUJCUneLtX1CkiPD

Постоянный URL: http://servernews.ru/1109661
21.08.2024 [11:23], Сергей Карасёв

Amazon купила разработчика ИИ-чипов Perceive за $80 млн для развития LLM на периферии

Компания Xperi объявила о заключении соглашения по продаже своего подразделения Perceive, которое занимается разработкой специализированных ИИ-чипов. Покупателем является Amazon, сумма сделки составляет $80 млн в виде денежных средств. Завершить поглощение планируется до конца 2024 года.

Perceive со штаб-квартирой в Сан-Хосе (Калифорния, США) создаёт ИИ-решения для работы с большими языковыми моделями (LLM) на периферийных устройствах. Такое оборудование обычно обладает ограниченными возможностями в плане вычислительных ресурсов, средств подключения и хранения данных. Чипы Perceive проектируются с учетом особенностей edge-платформ.

В частности, Perceive разработала процессор Ergo AI. Утверждается, что он позволяет запускать «нейронные сети ЦОД-класса» даже на устройствах с самыми жёсткими требованиями к энергопотреблению. Это могут быть системы конференц-связи и носимые гаджеты. Отмечается, что Ergo AI может поддерживать самые разные ИИ-нагрузки — от классификации и обнаружения объектов до обработки аудиосигналов и языка.

 Источник изображения: Perceive

Источник изображения: Perceive

Как именно Amazon намерена использовать решения Perceive, не уточняется. Но известно, что Amazon приобретает разработчика ИИ-чипов через своё подразделение Devices & Services, в которое входят голосовой помощник Alexa, интеллектуальные колонки и устройства серий Echo и Fire TV.

Ожидается, что сделка не потребует одобрения со стороны регулирующих органов. После поглощения большинство из 44 сотрудников Perceive присоединятся к Amazon. Perceive, которую возглавляют со-генеральные директоры Мурали Дхаран (Murali Dharan) и Стив Тейг (Steve Teig), имеет сотрудников в США, Канаде, Ирландии, Румынии и Эстонии. Лаборатория Perceive в Бойсе (Айдахо, США) продолжит функционировать.

Нужно отметить, что подразделение Amazon Web Services (AWS) уже не один год разрабатывает собственные аппаратные решения для ИИ-задач и облачных платформ. Это, в частности, чипы семейства Graviton и ИИ-ускорители Trainium. В конце 2023 года дебютировало изделие Graviton4 с 96 ядрами Arm для широкого спектра нагрузок. К выпуску готовится мощный ускоритель Trainium 3, энергопотребление которого может достигать 1000 Вт.

Постоянный URL: http://servernews.ru/1109758
Система Orphus