Материалы по тегу: ии

24.01.2025 [23:38], Владимир Мироненко

Платформа GenAI от DigitalOcean упростит создание ИИ-агентов

Облачный провайдер DigitalOcean представил платформу GenAI, которая позволяет использовать базовые модели от сторонних поставщиков для создания и развёртывания агентов ИИ за считанные минуты без необходимости глубоких знаний в области ИИ или машинного обучения. Как сообщает DigitalOcean, интуитивно понятная работа в GenAI позволяет клиентам вне зависимости от уровня подготовки настраивать агентов с доступом к надёжным конвейерам данных и многоагентным командам.

DigitalOcean GenAI позволяет компаниям создавать чат-боты на основе базовых моделей сторонних поставщиков (Anthropic, Meta, Mistral и др.) для анализа документов, семантического поиска, создания изображений и т.д. Платформа создана так, чтобы быть независимой от фреймворков. Платформа упрощает и создание агентов, специфичных для конкретных вариантов использования, привнося контекстные данные в базовые LLM.

Клиенты смогут не только извлекать неструктурированные данные из файлов, но и структурированные данные из баз данных или обращаясь к API, чтобы дополнять подсказки и задействовать Retrieval Augmented Generation (RAG), обеспечивая агентам доступ к точной и актуальной информации. С помощью вызываемых функций можно дописать кастомный код, чтобы расширить возможности своего агента.

 Источник изображения: DigitalOcean

Источник изображения: DigitalOcean

Встроенные ограничители (guardrails) позволяют повысить достоверность ответов агента, помогая отфильтровывать неправильные или ненадлежащие результаты. А возможность частных подключений и наличие готового интерфейса для чат-ботов упрощают запуск этих агентов на веб-сайте клиента. В будущем появится возможность обращаться к источникам данным по URL, поддержка конвейеров AgentOps и CI/CD, тонкая настройка моделей и многое другое.

Постоянный URL: http://servernews.ru/1117246
24.01.2025 [15:23], Руслан Авдеев

Microsoft и OpenAI останутся партнёрами до 2030 года

Компания Microsoft объявила о новом этапе сотрудничества с OpenAI. В числе прочего пресс-служба IT-гиганта упомянула о взаимодействии в рамках проекта Stargate. По данным Microsoft, партнёрство, развивавшееся с 2019 года, перешло в новую фазу. Не исключено, что публичное заявление компании — ответ на волну слухов, появившихся после изменения политики использования OpenAI облачных ресурсов. Многие буквально уверены, что Редмонд теряет хватку и упускает OpenAI из сферы своего влияния.

Возможно, поэтому компания сама спешит сообщить, что если раньше партнёрское соглашение об использовании облаков было эксклюзивным и OpenAI могла пользоваться только ресурсами Microsoft (в одном случае Oracle с оговорками), то теперь она сможет прибегать к помощи сторонних облачных провайдеров чаще. У Microsoft сохранится право «первого отказа» и сначала OpenAI по-прежнему должна обращаться за облачными ресурсами именно к ней, и лишь в случае их недоступности — к другим провайдерам.

При этом Microsoft подчёркивает, что OpenAI недавно вновь обязалась использовать Azure в ещё больших масштабах для поддержки своих продуктов и обучения моделей. Также компания напоминает, что ключевые элементы партнёрского соглашения не изменятся до окончания договора в 2030 году. Гиперскейлер сохранит доступ к интеллектуальной собственности OpenAI, предполагается обмен выручкой в соответствии с существующими договорённостями и сохранятся эксклюзивные права Microsoft на API ИИ-стартапа.

 Источник изображения: Microsoft

Источник изображения: Microsoft

В частности, Microsoft сохраняет право использовать интеллектуальную собственность OpenAI, включая ИИ-модели, в продуктах вроде Copilot. API OpenAI будут эксклюзивно использоваться в облаке Azure и доступны посредством Azure OpenAI Service. Соглашение означает, что клиенты будут получать доступ к самым передовым моделям на платформе Microsoft напрямую от OpenAI. А выручкой компании будут обмениваться в двухстороннем порядке, это будет на руку обеим благодаря росту использования новых и уже существующих моделей.

Наконец, Microsoft подчеркнула, что остаётся главным инвестором OpenAI, обеспечивая компанию средствами и облачными ресурсами для поддержки развития — одной из ключевых выгод самой Microsoft является поступательный рост стоимости ИИ-стартапа. Сейчас OpenAI участвует в многомиллиардном американском ИИ-проекте Stargate совместно с Oracle и SoftBank (помимо Microsoft), поэтому дополнительные ресурсы ей, безусловно, понадобятся.

Постоянный URL: http://servernews.ru/1117237
24.01.2025 [14:33], Сергей Карасёв

Бывший гендиректор Intel Пэт Гелсингер инвестировал средства в ИИ-стартап Fractile

Экс-гендиректор Intel Пэт Гелсингер, по сообщению TrendForce, стал инвестором британского стартапа Fractile.ai, который специализируется на разработках в области ИИ. Сумма, которую предоставил бывший глава Intel на развитие этой компании, не раскрывается.

Fractile.ai основана в 2022 году Уолтером Гудвином (Walter Goodwin) — специалистом, получившим докторскую степень в области искусственного интеллекта и робототехники в Оксфордском университете. Стартап разрабатывает специализированные ИИ-чипы, использующие метод вычислений в оперативной памяти. Такой подход может существенно повысить скорость инференса и выполнения других задач, связанных с интенсивными вычислениями.

Утверждается, что по сравнению с традиционными ИИ-ускорителями на базе GPU решения Fractile.ai обеспечат ряд значительных преимуществ. В частности, говорится, что новые чипы позволят поднять производительность больших языковых моделей (LLM) в 100 раз при одновременном 10-кратном снижении затрат по сравнению с решениями NVIDIA. При этом чипы Fractile.ai обеспечат в 20 раз более высокую производительность в расчёте на 1 Вт затрачиваемой энергии по сравнению с любым другим оборудованием ИИ, представленным в настоящее время на рынке.

 Источник изображения: Intel

Источник изображения: Intel

Однако пока Fractile.ai не изготовила тестовые образцы изделий, а оценка их характеристик и возможностей проводится путём компьютерного моделирования. Тем не менее, Гелсингер говорит, что ни один подход в отношении ИИ-вычислений не воодушевляет его больше, чем тот, который предлагает Fractile.ai. По его словам, для дальнейшего масштабирования ИИ большое значение имеет снижение как энергопотребления, так и стоимости вычислений.

Отмечается также, что стартап Fractile.ai ранее привлек в общей сложности $17,5 млн финансирования. В число инвесторов входят Kindred Capital, NATO Innovation Fund, Oxford Science Enterprises и несколько бизнес-ангелов.

Постоянный URL: http://servernews.ru/1117235
24.01.2025 [13:27], Руслан Авдеев

Oracle в разы увеличит инвестиции в Абу-Даби

Oracle намерена кратно увеличить инвестиции в Абу-Даби для масштабирования своих облачных предложений и ИИ-решений в ОАЭ. По словам представителя компании, для удовлетворения высокого спроса в стране инвестиции вырастут впятеро, сообщает Datacenter Dynamics.

По сведениям издания The National, точную сумму инвестиций компания пока не раскрывает, но отмечает, что взаимодействие на рынке — от сотрудничества до конкуренции — усиливается, и пять лет назад всё было совсем по-другому. Теперь речь идёт об огромном рынке, на котором есть огромный спрос, а значит, будут и огромные инвестиции. Поэтому компания часто работает совместно с конкурентами. В начале 2024 года Oracle уже объединила усилия с телеком-бизнесом Du для разработки суверенной облачной платформы в ОАЭ. В июне того же года компании расширили сотрудничество, включив в пакет услуг ИИ для органов власти страны.

У Oracle есть два облачных региона в ОАЭ — UAE East в Дубае, запущенный в сентябре 2020 года, а также UAE Central в Абу-Даби, заработавший в ноябре 2021-го. Компания управляет и облаками в соседней Саудовской Аравии, второй регион там был запущен в конце лета 2024 года, а ещё в феврале 2023 года было объявлено о планах запустить и третий. Компания намерена запустить суверенное облако и в Бахрейне (совместно с Beyon Solutions).

 Источник изображения: Kamil Rogalinski/unsplash.com

Источник изображения: Kamil Rogalinski/unsplash.com

Ранее правительство Абу-Даби призвало разработать в стране универсальную многооблачную платформу, задачей которой станет обслуживание 40 государственных учреждений. В Абу-Даби уже базируются дата-центры компаний Gulf Data Hub, Core42, Etisalat, Equinix, Du и Khazna Data Centers. В стране есть и облачные площадки прямых конкурентов Oracle, включая Microsoft и AWS.

Постоянный URL: http://servernews.ru/1117233
24.01.2025 [12:10], Сергей Карасёв

OpenAI наняла руководителя цепочки поставок Meta✴ для помощи в реализации проекта Stargate

Компания OpenAI, по сообщению ресурса Datacenter Dynamics, наняла на работу Кита Хейде (Keith Heyde), который ранее занимал руководящую должность в Meta. На новой позиции он будет участвовать в масштабном проекте Stargate по развитию ИИ-инфраструктуры в США.

В Meta Хейде курировал работу цепочки поставок вычислительного оборудования и СХД для систем ИИ. Речь идёт, в частности, о первом ИИ-кластере Meta, оснащённом примерно 100 тыс. ускорителей. Он также руководил тремя командами, отвечавшими за взаимодействие с поставщиками стоечных решений и серверов.

Хейде проработал в Meta без малого четыре года. До этого он трудился в компании Wing — подразделении Alphabet, которое специализируется на разработке средств доставки товаров при помощи беспилотных летательных аппаратов. В OpenAI Хейде перешёл ещё в ноябре 2024 года, однако известно об этом стало только сейчас.

 Источник изображения: unsplash.com /  Yuriy Vertikov

Источник изображения: unsplash.com / Yuriy Vertikov

Какие именно функции Хейде будет выполнять в рамках инициативы Stargate, не уточняется. Напомним, в марте прошлого года сообщалось, что по проекту Stargate корпорация Microsoft и OpenAI намерены построить кампус ЦОД стоимостью $100 млрд для решения самых сложных и ресурсоёмких задач в области ИИ. А несколько дней назад стало известно, что название Stargate получит новое совместное предприятие OpenAI, Softbank и Oracle, которое займётся развитием «физической и виртуальной инфраструктуры для поддержки следующего поколения ИИ».

В проекте примут участие Microsoft, Arm и Nvidia, а также фонд MGX с Ближнего Востока. На первом этапе SoftBank Group и OpenAI намерены вложить в Stargate по $19 млрд, а общие инвестиции в предприятие в течение четырёх лет, как ожидается, достигнут $500 млрд. По всей видимости, Хейде на новой должности в OpenAI займётся вопросами поставок оборудования. Развёртывание масштабной ИИ-инфраструктуры уже началось в Техасе.

Постоянный URL: http://servernews.ru/1117217
23.01.2025 [22:44], Руслан Авдеев

SoftBank и OpenAI намерены выделить по $19 млрд на ИИ-проект Stargate, но Маск уверен что на это нет денег

Илон Маск (Elon Musk) усомнился в наличии денег на реализацию эпохального ИИ-проекта Stargate с участием OpenAI, Oracle и SoftBank, поддерживаемого новым президентом США Дональдом Трампом (Donald Trump). Сами компании выражают уверенность в успехе предприятия, передаёт Bloomberg. SoftBank Group и OpenAI намерены вложить в Stargate по $19 млрд. По сведениям The Information, компании хотят получить по 40 % в новом предприятии. В течение четырёх лет общие инвестиции в проект могут вырасти до $500 млрд.

Глава SoftBank Масаёси Сон (Masayoshi Son), руководитель OpenAI Сэм Альтман (Sam Altman) и основатель Oracle Ларри Эллисон (Larry Ellison) на встрече в Белом доме объявили, что в рамках проекта Stargate выделят $100 млрд на строительство дата-центров и другой инфраструктуры, после чего акции участников заметно поднялись в цене. Альтман пояснил, что Stargate похож на «венчурный фонд», в котором OpenAI и SoftBank являются главными партнёрами. Oracle и фонд MGX (создан Mubadala и G42) из ОАЭ внесут по $7 млрд. Остальные деньги привлекут от других партнёров и за счёт заёмного финансирования.

Глава SoftBank в прошлом месяце объявил о намерении компании потратить $100 млрд в течение предстоящего президентского срока Трампа. Средства на Stargate, видимо, входят в эту сумму. Ранее сообщалось, что схема финансирования SoftBank предусматривает привлечение гиперскейлеров — тогда десятки миллиардов инвестиций могут перерасти в сотни. По словам Эллисона, некоторые дата-центры для Stargate уже строятся.

 Истчоник изображения: Mariia Shalabaieva/unsplash.com

Истчоник изображения: Mariia Shalabaieva/unsplash.com

Впрочем, Илон Маск, не перестающий сводить счёты с OpenAI, утверждает, что у инвесторов нет денег на Stargate. Бизнесмен, возглавивший «техническое подразделение» Белого дома United States DOGE Service, призванное обеспечить эффективность цифровых сервисов, сообщил со ссылкой на «надёжные источники», что у SoftBank в распоряжении не более $10 млрд. По данным Bloomberg, у компании есть ¥3,8 трлн ($25 млрд) непосредственно в валюте и её эквивалентах. Альтман же предложил посетить первую площадку, где работы уже ведутся, и выразил надежду, что Маск сможет сделать верный выбор в новой роли государственного служащего, определив, что важнее — благо его собственных компаний или благо страны.

Новый президент США дал понять, что лидерство страны в области ИИ является безусловным приоритетом и что он готов пойти на резкие шаги. Так, уже произошёл фактический отказ от некоторых экологических обязательств в пользу обеспечения энергией ИИ ЦОД и промышленности в целом. Ещё при прежнем президенте США Джо Байдене (Joe Biden) было решено выделить под ИИ-инфраструктуру федеральные земли.

Постоянный URL: http://servernews.ru/1117171
23.01.2025 [19:54], Андрей Крупин

Сертифицированная ФСТЭК России ОС «Альт СП» получила крупное обновление и поддержку процессоров «Эльбрус»

Компания «Базальт СПО» сообщила о релизе сертифицированного ФСТЭК обновления операционной системы «Альт СП» 10.2. Платформа построена на базе ядра Linux, представлена в редакциях для рабочих станций и серверов и может применяться в организациях, предъявляющих высокие требования к обеспечению защиты обрабатываемых данных и информационной безопасности корпоративной IT-инфраструктуры.

Дистрибутив платформы «Альт СП» 10.2 поставляется с сертифицированными ФСТЭК России средствами виртуализации и контейнеризации, а также СУБД PostgreSQL версии 16.6, отвечающей требованиям ведомства по 4 классу защиты. Согласно новым нормам регулятора в состав ОС включены программные интерпретаторы (php, perl, lua, python, nodejs) и веб-сервер (nginx), прошедшие испытания по выявлению уязвимостей и недекларированных возможностей в ПО в соответствии с методикой ФСТЭК России.

 Источник изображения: «Базальт СПО» / basealt.ru

Источник изображения: «Базальт СПО» / basealt.ru

В числе прочих изменений и доработок ОС «Альт СП» 10.2 фигурируют обновлённые средства управления контейнерами и виртуальными машинами, новые инструменты мониторинга событий безопасности и ограничения доступа к USB-устройствам. Также сообщается об улучшениях пользовательского интерфейса платформы, обновлении среды Java, добавлении корневых сертификатов для сайтов от российского центра сертификации ООО «ТЦИ», реализации поддержки «Сигнатуры-L» — разработанной Банком России системы криптографической авторизации электронных документов и интеграции с платформой идентификации и управления доступом Keycloak.

В числе прочих изменений разработчик отмечает появление сборок дистрибутива «Альт СП» 10.2 для рабочих станций с российскими процессорами Эльбрус 8СВ и Эльбрус 2С3, включение в инсталляционный пакет ОС для серверов программного комплекса для централизованного управления рабочими станциями и учётными записями пользователей «Альт Домен» (аналог Microsoft AD) и добавление модуля Linstor, предназначенного для управления блочными устройствами хранения данных. ОС зарегистрирована в реестре российского ПО и может применяться государственными и коммерческими организациями при реализации программ по импортозамещению зарубежных софтверных продуктов.

Постоянный URL: http://servernews.ru/1117188
23.01.2025 [19:45], Руслан Авдеев

ByteDance намерена потратить $12 млрд на ИИ-ускорители в 2025 году

Китайская ByteDance намерена потратить в 2025 году более $12 млрд на ИИ-инфраструктуру. Она делает ставку на использование передовых технологий для роста, хотя и находится под давлением американских властей, намеренных заставить её продать часть популярной социальной сети TikTok, сообщает The Financial Times. Правда, огромный бюджет на новые закупки планировали до последних изменений американской политики.

В частности, по данным источников, компания намерена выделить ¥40 млрд ($5,5 млрд) на покупку ИИ-чипов в 2025 году. Это вдвое больше, чем было потрачено на эти же цели в 2024-м. Около 60 % заказов компании на чипы в Китае придётся на местных производителей вроде Huawei и Cambricon (в основном для инференса), остальное достанется NVIDIA. По некоторым данным, Пекин неофициально рекомендовал китайским бизнесам закупать не менее 30 % чипов у производителей из Поднебесной.

За первые три квартала выручка NVIDIA в Китае, включая Гонконг, составила $11,6 млрд, или 13 % от общих денежных поступлений. ByteDance является крупнейшим покупателем в Китае, но может приобретать для китайских ЦОД только модели H20, соответствующие американским экспортным ограничениям. По данным Omdia, в 2024 году компания заказала около 230 тыс. чипов NVIDIA, в основном именно H20. Ещё столько же купила Tencent. Для сравнения — в тот же период Microsoft приобрела 485 тыс. чипов семейства Hopper, а Meta — 224 тыс.

 Источник изображения: Danie LIU/unsplash.com

Источник изображения: Danie LIU/unsplash.com

Также ByteDance планирует инвестировать около $6,8 млрд за пределами Китая, чтобы нарастить возможности обучения ИИ-моделей с использованием передовых чипов NVIDIA. Но с этим могут возникнуть проблемы из-за недавнего ужесточения США экспортного контроля, призванного сдержать технологическое развитие Китая. В любом случае компания является одним из лидеров ИИ-гонки в Китае и активно наращивает соответствующую инфраструктуру. Она уже развернула вычислительные мощности в Юго-Восточной Азии (в частности, Малайзии).

Хотя китайским компаниям сильно ограничен доступ к ИИ-чипам NVIDIA, они сохранили доступ к ним, арендуя мощности в «нейтральных» странах. Эту лазейку закрыла предыдущая администрация США. Хотя Трамп может пересмотреть эти правила, если их всё же будут строго придерживаться, это серьёзно ограничит доступ ByteDance к вычислениям. По данным источников, в этом году ByteDance заключила много соглашений об аренде вычислительных мощностей. Их должно хватить для обеспечения большинства потребностей компании в 2025 году, но что может случиться после, пока неизвестно.

Судьба TikTok в США пока остаётся под вопросом. У соцсети есть 75 дней, чтобы определиться со стратегией работы или уйти из страны. Власти США хотят, чтобы американское подразделение TikTok продало долю в 50 %, пригрозив новыми санкциями в случае отказа. Ситуация может помешать планам ByteDance по выходу на биржу (IPO). Не так давно компания предварительно оценила себя приблизительно в $300 млрд.

UPD: По данным Reuters, капитальные затраты компании в 2025 году составят ¥150 млрд ($20,64 млрд). Срос на ресурсы привёл к тому, что компания стала одним из крупнейших клиентов Microsoft в Азии в сфере облачных вычислений.

Ведущим приложением компании является чат-бот Duobao с 75 млн пользователей, имеется бот для преобразования текстов в видео Jimeng, а также инструмент Kouzi для разработчиков ботов и сервис Maoxing, обеспечивающий эмоциональную поддержку людям. Некоторые приложения компании доступны за рубежом — Duobao известен на международном рынке как Cici, а Jimeng — как Dreamina.

Постоянный URL: http://servernews.ru/1117146
23.01.2025 [13:29], Руслан Авдеев

В Nebius AI Studio появились открытые ИИ-модели для преобразования текста в изображение

ИИ-компания Nebius B.V. (бывшая Yandex N.V.) анонсировала обновление платформы «инференс как услуга» для разработчиков. В частности, добавлены новые open source модели, предназначенные для преобразования текста в изображение, сообщает Silicon Angle. В скором времени в сервисе появятся модели для преобразования текста в видео.

Nebius AI Studio представляет собой гибкую, удобную для пользователей среду для разработчиков, решивших заняться созданием ИИ-приложений, говорит компания. Помимо обеспечения доступа к обширному набору больших языковых моделей (LLM), решение является одним из самых доступных с точки зрения стоимости. Поскольку компания управляет своей собственной облачной инфраструктурой, она может обеспечить одну из самых низких цен за токен на рынке, подчёркивает Nebius. Кроме того, предлагается гибкая ценовая модель — чем больше ресурсов потребляется, тем они дешевле.

 Источник изображения: Nebius

Источник изображения: Nebius

Ранее компания называлась Yandex N.V. — это была родительская структура российского «Яндекса». Позже она продала поисковый и некоторые другие бизнесы, но сохранила ЦОД за пределами России (и даже намерена строить новые) и, наконец, превратилась в облачный инфраструктурный ИИ-сервис. На этой инфраструктуре и работает Nebius AI Studio.

Обновление добавило модели Flux Schnell и Flux Dev, разработанные ИИ-стартапом Black Forest Labs Inc. — позиционирующим себя как одного из конкурентов OpenAI. Разработчики, создающие ИИ-приложения в Nebius AI Studio, смогут напрямую интегрировать в них новые модели. В компании утверждают, что она обеспечивает одну из самых высоких скоростей рендеринга — изображения создаются за секунды. Приложения, создаваемые с использованием Nebius AI Studio, могут поддерживать обработку до 100 млн токенов в минуту, сообщает пресс-служба компании.

Постоянный URL: http://servernews.ru/1117151
23.01.2025 [13:00], Сергей Карасёв

Gartner: затраты на ЦОД в мире в 2024 году подскочили на 40 % и достигли $330 млрд

Компания Gartner обнародовала результаты исследования мирового IT-рынка в 2024 году: затраты в годовом исчислении поднялись на 7,7 %, достигнув $5,1 трлн. В 2025 году, как полагают аналитики, рост отрасли ускорится на фоне стремительного внедрения технологий ИИ.

В обзоре учитываются расходы на дата-центры, электронные устройства, ПО корпоративного класса, IT-сервисы и телекоммуникационные сервисы. Говорится, что сегмент ЦОД в 2024 году показал максимальный рост — плюс 39,4 % по сравнению с 2023-м: затраты достигли $329,1 млрд.

ПО корпоративного класса принесло почти $1,1 трлн, что на 12,0 % больше по сравнению с 2023 годом. Затраты на электронные устройства увеличились в годовом исчислении на 6,0 %, достигнув $734,2 млрд. IT-сервисы обеспечили выручку в размере $1,6 трлн с ростом на 5,6 % год к году. Телекоммуникационные сервисы принесли $1,4 трлн, что на 2,3 % больше по сравнению с 2023-м.

 Источник изображения: unsplash.com /  Tyler

Источник изображения: unsplash.com / Tyler

Аналитики говорят о высоком спросе на серверы, предназначенные для задач ИИ. Согласно прогнозам, к 2028 году гиперскейлеры будут эксплуатировать такие машины на общую сумму в $1 трлн.

Gartner полагает, что в 2025 году объём глобального IT-рынка увеличится на 9,8 % по сравнению с 2024-м и достигнет $5,6 трлн. Наибольший рост ожидается в сегменте дата-центров: здесь затраты, по мнению экспертов, поднимутся на 23,2 % — до $405,5 млрд. ПО корпоративного класса обеспечит выручку на уровне $1,2 трлн при росте на 14,2 % в годовом исчислении. Электронные устройства принесут $810,2 млрд — плюс 10,4 % по отношению к 2024 году. На IT-сервисы и телекоммуникационные сервисы придётся соответственно $1,7 трлн и более $1,4 трлн с ростом на 9,0 % и 3,8 % год к году.

Постоянный URL: http://servernews.ru/1117144

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus