Материалы по тегу: software

04.04.2025 [10:26], Владимир Мироненко

Бенчмарк MLPerf Inference 5.0 показал, что ускорители AMD Instinct MI325X не уступают NVIDIA H200

Консорциум MLCommons опубликовал результаты тестирования различных аппаратных решений в бенчмарке MLPerf Inference 5.0, о чём сообщил ресурс IEEE Spectrum. Он отметил, что ускорители NVIDIA с архитектурой Blackwell превзошли все остальные чипы, но последняя версия ускорителей Instinct от AMD — Instinct MI325X — оказалась на уровне конкурирующего решения NVIDIA H200. Сопоставимые результаты были получены в основном в тестах одной из маломасштабных больших языковых моделей (LLM) — Llama2 70B. Чтобы лучше отражать особенности развития ИИ, консорциум добавил три новых теста MLPerf — всего доступно 11 бенчмарков.

Добавлены два теста для LLM. Популярная и относительно компактная Llama2 70B уже является устоявшимся эталоном MLPerf, но консорциум решил включить тест, имитирующий скорость реагирования, ожидаемую пользователями от чат-ботов. Поэтому был добавлен новый эталон Llama2-70B Interactive, который ужесточает требования к оборудованию: системы должны выдавать не менее 25 токенов в секунду при задержке на ответ не более 450 мс.

С учётом роста популярности «агентного ИИ» в MLPerf решили добавить тестирование LLM с характеристиками, необходимыми для таких задач. В итоге была выбрана Llama3.1 405B. Эта модель имеет широкое контекстное окно — 128 тыс. токенов, что в 30 раз больше, чем у Llama2 70B. Третий новый бенчмарк — RGAT — представляет собой графовую сеть. Он классифицирует информацию в сети. Например, набор данных для тестирования RGAT состоит из научных статей, связанных между собой авторами, учреждениями и областями исследований, что составляет 2 Тбайт данных. RGAT должен классифицировать статьи по почти 3000 темам.

 Источник изображения: IEEE Spectrum

Источник изображения: IEEE Spectrum

В этом раунде тестов поступили заявки от NVIDIA и 15 компаний-партнёров, включая Dell, Google и Supermicro. Оба ускорителя NVIDIA с архитектурой Hopper первого и второго поколения — H100 и H200 — показали хорошие результаты. «Мы смогли добавить ещё 60 % производительности за последний год, — у Hopper, которая была запущена в производство в 2022 году, сообщил Дэйв Сальватор (Dave Salvator), один из директоров NVIDIA. — У неё всё ещё есть некоторый запас производительности». Лидером же оказался B200 с архитектурой Blackwell. B200 содержит на 36 % больше памяти HBM, чем у H200, но, что ещё важнее, он может выполнять ключевые математические операции, используя FP4 вместо FP8 у Hopper.

В тесте Llama3.1 405B система от Supermicro с восемью B200 выдала почти в четыре раза больше токенов в секунду, чем система с восемью H200 от Cisco. И та же система Supermicro была в три раза быстрее самого быстрого сервера на H200 в интерактивной версии Llama2 70B.

NVIDIA использовала суперчип GB200 — сочетание ускорителей Blackwell и процессоров Grace — чтобы продемонстрировать эффективность интерконнекта NVLink, который позволяет работать множеству узлов как один ускоритель. В непроверенном результате, которым компания поделилась с журналистами, стойка GB200 NVL72 выдавала 869 200 токенов в секунду в Llama2 70B. Самая быстрая система текущего раунда MLPerf Inference — сервер NVIDIA B200 — показала 98 443 токена в секунду.

Ускоритель Instinct MI325X позиционируется AMD как конкурент H200. Он имеет ту же архитектуру, что и предшественник MI300, но оснащён увеличенным объёмом памяти HBM с более высокой пропускной способностью — 256 Гбайт и 6 Тбайт/с (рост на 33 % и 13 % соответственно). AMD оптимизировала ПО, что позволило увеличить скорость инференса DeepSeek-R1 в 8 раз. В тесте Llama2 70B компьютеры с восемью MI325X отставали от аналогичных систем на базе H200 всего на 3–7 %. В задачах генерации изображений система MI325X показала отличия в пределах 10 % от системы на H200. Также сообщается, что партнёр AMD, компания Mangoboost, продемонстрировала почти четырёхкратное увеличение производительности в тесте Llama2 70B, запустив вычисления на четырёх узлах.

 Источник изображения: ML Commons

Источник изображения: ML Commons

Intel традиционно использует в тестах только процессорные системы, чтобы показать, что для некоторых рабочих нагрузок GPU не требуются. В этот раз были представлены первые данные по чипам Intel Xeon 6900P и 6700P (Granite Rapids), выпускаемым по техпроцессу Intel 3. Компьютер с двумя Xeon 6 показал результат в 40 285 семплов в секунду в тесте распознавания изображений, что составляет около одной трети производительности системы Cisco с двумя NVIDIA H100. По сравнению с результатами Xeon 5 в октябре 2024 года новый процессор демонстрирует прирост в 80 % в данном тесте и ещё большее ускорение в задачах обнаружения объектов и медицинской визуализации. С 2021 года, когда Intel начала представлять результаты Xeon, её процессоры достигли 11-кратного прироста производительности в тесте ResNet. Intel отказалась от участия в категории ускорителей: её конкурент для H100 — Gaudi 3 — не появился ни в текущих результатах MLPerf, ни в версии 4.1, выпущенной в октябре 2024 года.

Чип Google TPU v6e также продемонстрировал свои возможности, хотя результаты были ограничены задачей генерации изображений. При 5,48 запроса в секунду система с четырьмя TPU показала прирост в 2,5 раза по сравнению с аналогичным компьютером, использующим TPU v5e, в результатах за октябрь 2024 года. Тем не менее 5,48 запроса в секунду — это примерно те же показатели, что и у аналогичного по размеру компьютера Lenovo с NVIDIA H100.

Постоянный URL: http://servernews.ru/1120777
03.04.2025 [19:29], Татьяна Золотова

«РТК ИТ Плюс» пополнила ИТ-экосистему «Лукоморье» тремя новыми продуктами

В экосистему отечественных ИТ-решений «Лукоморье» разработчика программного обеспечения «РТК ИТ Плюс» (входит в ГК «Ростелеком») вошли no-code платформа «Акола», ESM-система «Диво» и система управления пространством «Стрелка». Теперь экосистема состоит из 15 продуктов. В компании надеются, что по итогам 2025 года обновленное «Лукоморье» принесет около 1,5 млрд руб. выручки.

«Акола» запущена в августе 2024 года и позволяет создавать корпоративные веб-приложения и сайты без программирования. В семейство no-code платформы входят ESMP SE — коробочная версия сервис-деска ESMP для малого и среднего бизнеса, а также «Теремок» — корпоративный портал. Разработчик утверждает, что у решения нет «прямых аналогов на отечественном рынке», а также что платформа позволяет запускать новые продукты в четыре раза быстрее и в пять раз дешевле по сравнению с традиционным подходом.

«Диво» (первое название ESMP) состоит из пяти модулей, автоматизирует работу внутренних ИТ-служб. Встроенный ИИ-модуль классифицирует запросы и предлагает решения. В семейство ESM-системы входят портал самообслуживания с интеллектуальным поиском «Диво Портал», сервис-деск «Диво Сервис», система отчетности и визуализации данных «Диво Метрика», лингвистический модуль «Диво Лингво» и платформа для создания чат-ботов «Диво Бот». По словам генерального директора «РТК ИТ Плюс», внедрение «Диво» позволило «Ростелекому» сэкономить 169 млн руб. в рамках импортозамещения.

«Стрелка» (ранее «Интерактивная карта») отвечает за управление рабочим пространством в условиях гибридного формата работы. Система адаптируется к большим офисам и рабочим площадям, а также соответствует требованиям защиты данных госкомпаний. По словам разработчиков, «Стрелка» помогла «Ростелекому», «Теле2» и «ВТБ Капитал» повысить производительность ряда подразделений, процесс размещения персонала стал прозрачнее и занимает меньше времени, сократились конфликты при бронировании переговорных или рабочих мест.

 Источник изображения: «РТК ИТ Плюс»

Источник изображения: «РТК ИТ Плюс»

Сначала экосистема «Лукоморье» развивалась как набор отдельных решений. В семейство продуктов «Яга» (отечественный вариант Jira, Confluence и др.) входят система управления проектами задачами «Яга Задачи», система для совместной работы с информацией «Яга Статьи», система построения отчетности по пространствам «Яга Аналитика», а также планировщик задач для малых команд «Ёжка», маркетплейс плагинов и приложений «Ярмарка» и ИИ-модуль «Сирин». Кроме того, «Лукоморье» включает Professional services, ориентированные на оказание полного цикла консалтинговых услуг.

Выручка «РТК ИТ Плюс» по итогам 2024 года выросла более чем в два раза — до 433,8 млн руб., а штат увеличился на 81 % — до 350 сотрудников. По итогам 2025 года разработчик планирует утроить выручку. Семь разработок компании включены в реестр отечественного программного обеспечения Минцифры.

Постоянный URL: http://servernews.ru/1120754
03.04.2025 [13:43], Сергей Карасёв

Годовая выручка «Группы Астра» взлетела на 80 %, а прибыль — на 66 %

«Группа Астра» отчиталась о работе в 2024 году: выручка поднялась на 80 %, достигнув 17,2 млрд руб. против 9,5 млрд руб. по итогам 2023-го. Столь существенный рост, как отмечается, обусловлен трёхкратным повышением продаж продуктов экосистемы на фоне продолжающегося импортозамещения ПО на российском рынке.

Операционная система Astra Linux в 2024 году принесла «Группе Астра» примерно 8,5 млрд руб., что на 35 % больше по сравнению с 6,3 млрд руб., полученными годом ранее. Продукты экосистемы обеспечили 5,5 млрд руб. против 1,7 млрд руб. в 2023 году, что соответствует росту на 213 % в годовом исчислении. По направлению сопровождения ПО отмечен рост на 102 % — с 1,4 млрд руб. до 2,8 млрд руб.

Чистая прибыль компании увеличилась на 66 % — с 3,6 млрд руб. до 6,0 млрд руб. Показатель EBITDA (прибыль до вычета процентов, налогов и амортизационных отчислений) достиг 6,6 млрд руб., поднявшись на 59 % по сравнению с 2023 годом (4,2 млрд руб.). Капитальные затраты на разработку новых продуктов и развитие существующих решений год к году выросли на 108 % — с 1,4 млрд до 2,9 млрд руб.

 Источник изображения: «Группа Астра»

Источник изображения: «Группа Астра»

В отчёте отмечается, что «Группы Астра» продолжает расширять штат: в 2024 году он увеличился на 23 % — до 2803 человек, из которых более 70 % составляют IT-специалисты. В июле 2024 года компания запустила первую двухлетнюю мотивационную программу для топ-менеджмента и ключевых сотрудников: её задача заключается в том, чтобы усилить вовлечённость команды в достижение стратегических целей и обеспечить удержание специалистов.

Одновременно расширяется взаимодействие с участниками рынка. Количество технологических партнёров увеличилось за год на 26 % — до 1235 компаний. Ассортимент совместимых решений вырос на 28 %, достигнув 3229. В 2024 году «Группа Астра» выпустила обновления для всех своих существующих продуктов, а также представила ряд новых решений, доведя их количество в экосистеме до более чем 35. При этом для повышения управляемости и эффективности разработки, оптимизации продаж, формирования сценариев интеграции и продуктовой стратегии все продукты распределены на восемь блоков: клиентский (Astra Linux), серверный (Astra Linux сервер, Ald Pro), коммуникационный (Rupost, Workspad, Desktop X), данные (Tantor, Tantor DLH), виртуализация (AIC, Termidesk, VMmanager), резервирование, защита данных (RuBackup) и др.

Постоянный URL: http://servernews.ru/1120726
02.04.2025 [11:04], Владимир Мироненко

MTS AI выпустила ИИ-модель Cotype Pro 2, которая станет основой ИИ-агентов для бизнеса

Компания MTS AI, дочерняя структура МТС, сообщила о выходе большой языковой модели (LLM) Cotype Pro 2 второго поколения, предназначенной для корпоративного сегмента. Новая модель значительно превосходит по целому ряду показателей предыдущую версию, адаптирована под выполнение более чем 100 сценариев использования компаниями в России и может быть запущена на собственной инфраструктуре предприятия без подключения к внешним серверам, чем обеспечивается защита от утечки данных.

На основе Cotype Pro 2 компания подготовит в 2025–2026 гг. новую линейку ИИ-решений для семи отраслей: госсектора, банков, промышленности, ретейла, телекома, медицины и IT. Сначала будут созданы ИИ-помощники, затем — ИИ-агенты с большей автономностью, способные решать, как общие задачи (HR, клиентская поддержка, документооборот и другие), так и специфичные для каждой из этих отраслей.

 Источник изображения: MTS AI

Источник изображения: MTS AI

Cotype Pro 2 вошла в пятерку лучших русскоязычных LLM в бенчмарке MERA от Альянса в сфере ИИ. Она на 40 % быстрее предыдущей версии и на 50 % точнее обрабатывает длинные тексты — до 128 тыс. токенов, что соответствует примерно 900 тыс. символов с пробелами, сообщила компания.

По сравнению с предшественником её эффективность в области генерации идей возросла с 44 до 57 %, точность в задаче извлечения информации выросла с 81 до 86 %, в части общения на общие темы зафиксировано улучшение с 55 до 64 %, благодаря чему обеспечивается более плавное и осмысленное взаимодействие. Также осталась на высоком уровне эффективность в классификации — 87 %, отмечены улучшения в суммаризации (с 79 до 85 %) и креативном письме (с 61 до 65 %). Для оценки эффективности сравнивалось количество ответов, схожих или превосходящих по качеству ответы модели GPT-4o.

Как отметил директор по LLM-продуктам MTS AI, для ИИ-агентов важно не только работать с большим объёмом информации, но и давать ответы в структурированном виде, понятном другим системам. Чтобы оценить качество таких ответов компания разработала специальный бенчмарк, который включает задания с разным объёмом контекста и разной сложностью. В этом тесте Cotype Pro 2 справилась с 94 % задач, а GPT-4o — с 93 %. Также по данным бенчмарка длинного контекста LIBRA, качество работы Cotype Pro 2 в два раза выше, чем у Cotype Pro на задачах длиной 64 и 128 тыс. токенов (до 500 тыс. символов). В дополнение к выполнению базовых задач Cotype Pro 2 поддерживает «ролевой отыгрыш» — способность вести диалог от лица специалиста, адаптируя стиль общения под особенности профессии, что повышает качество взаимодействия в клиентской поддержке, обучении сотрудников и т.д.

Перед анонсом Cotype Pro 2 прошла тестирование в реальных условиях. В течение трёх месяцев она автоматически сортировала обращения в поддержку банка, а для МТС Live создавала описания мероприятий. Также тестирование подтвердило возможность интеграции с инструментами RAG (Retrieval-Augmented Generation) для извлечения информации из баз знаний с генерацией текста, что будет востребовано, например, в чат-ботах, где нужно регулярно обновлять данные и в течение нескольких секунд предоставлять ответы на запросы.

Как сообщили в MTS AI ресурсу Forbes, семейство корпоративных отраслевых ИИ-агентов, над которыми сейчас ведётся работа, будет, в частности, включать следующие решения:

  • чат-бот для внутренней поддержки сотрудников, способный не только быстро отвечать на вопросы, но и самостоятельно выполнять такие задачи, как поиск информации в корпоративных системах, обновление данных или запуск процессов. Помощник будет интегрирован с базами данных, чтобы предоставлять точные и полезные ответы, а также предлагать решения;
  • ИИ-агент для HR-направления, который будет заниматься подбором сотрудников, оценкой их навыков, анализом резюме и формированием вакансий, а также сможет прогнозировать увольнения и создавать персонализированные программы обучения и адаптации новых сотрудников;
  • ИИ-помощник для обработки обращений граждан сможет подготавливать ответы, классифицировать обращения, направлять их в нужные отделы, отслеживать выполнение, а также анализировать статистику обращений, чтобы улучшить качество обслуживания;
  • ИИ-помощник в юридических вопросах будет осуществлять проверку документов на соответствие шаблонам, отслеживать изменения в законах, поступление уведомлений о них и предложение правок.

Сообщается, что МТС также начала предоставлять консалтинговые услуги по внедрению ИИ-продуктов в эти сферы. Как ожидает компания, к 2027 году коммерциализация ИИ-агентов будет приносить её ИИ-направлению более половины выручки.

Постоянный URL: http://servernews.ru/1120649
01.04.2025 [10:45], Руслан Авдеев

OpenAI привлекла рекордные $40 млрд — капитализация достигла $300 млрд

OpenAI завершила один из крупнейших за всю историю раундов финансирования для частного бизнеса. Компания привлекла $40 млрд, а её капитализация достигла $300 млрд, сообщает Silicon Angle. Раунд финансирования возглавила SoftBank Group, а участие в нём приняли компании, уже поддерживающие OpenAI, включая Microsoft, Coatue Management, Thrive Capital и Altimeter Capital.

Капитализация в $300 млрд обеспечила OpenAI позицию второй по стоимости частной технологической компании наряду с китайской ByteDance. По данным CB Insights, обе компании уступают только SpaceX Илона Маска (Elon Musk), которая оценивается в $350 млрд.

В своём блоге OpenAI объявила, что новые средства помогут ей продолжить создание ИИ-систем, способствующих научным открытиям, обеспечивающих персонализированное обучение, расширяющих творческие возможности людей и прокладывающих путь к созданию «общего искусственного интеллекта» (AGI) на благо всего человечества. Предполагается, что AGI-системы будут превосходить человека в интеллектуальном плане, а их разработка является главной целью всех ведущих игроков индустрии искусственного интеллекта.

Компания намерена направить полученные средства на создание необходимой вычислительной инфраструктуры для поддержки ИИ-систем. По некоторым данным, $18 млрд будут выделены на инициативу Stargate — совместный проект OpenAI, SoftBank, Oracle и MGX Fund Management. В целом планируется инвестировать в этот проект до $500 млрд в ближайшие годы.

 Источник изображения: Marga Santoso/unsplash.com

Источник изображения: Marga Santoso/unsplash.com

Этот раунд финансирования стал беспрецедентным даже по меркам технологического сектора. В 2018 году Ant Group, аффилированная с китайской Alibaba Group Holding, привлекла рекордные $14 млрд. В том же году компания Juul Labs получила $12,8 млрд, а китайская каршеринговая компания DiDi Global привлекла $10,8 млрд в 2019 году. Среди других «рекордсменов» последних лет — Databricks ($10 млрд в декабре 2024 года). В 2023 году сама OpenAI тоже привлекла $10 млрд.

По данным CNBC, сначала OpenAI получит только $10 млрд, а оставшиеся средства будут перечислены после переформатирования компании в коммерческое предприятие к концу текущего года. Если этот процесс не удастся, финансирование могут сократить на $10 млрд — до $30 млрд.

Другими словами, для OpenAI крайне важно сменить свой статус. Компания начинала деятельность как некоммерческая исследовательская лаборатория, а в прошлом году взяла курс на преобразование в коммерческую структуру. Для этого, как минимум, потребуется одобрение генерального прокурора Калифорнии. Кроме того, Илон Маск, один из основателей OpenAI, подал в суд, пытаясь остановить смену статуса компании.

 Источник изображения: Giorgio Trovato/unsplash.com

Источник изображения: Giorgio Trovato/unsplash.com

Сегодня OpenAI представляет собой гибридную структуру, в которой исходная некоммерческая организация владеет и управляет дочерней компанией с ограниченной прибылью (capped-profit LLC). Планируется, что эта коммерческая часть будет выделена в независимую компанию. Инвесторы OpenAI, ранее получавшие конвертируемые облигации (convertible notes), смогут обменять их на доли в новой коммерческой структуре.

Инвесторы рассчитывают, что OpenAI сумеет сохранить лидирующие позиции в индустрии ИИ, которая, по прогнозам Bloomberg Intelligence, к 2032 году вырастет до более чем $1,3 трлн. Однако компания сталкивается с жёсткой конкуренцией со стороны Google, Microsoft, AWS, Anthropic и Perplexity AI, а также китайских разработчиков. Если OpenAI потребуется дополнительное финансирование в будущем, вероятно, компания выйдет на IPO, хотя сроки пока остаются неизвестными.

Недавно CoreWeave стала первой специализированной ИИ-компанией, вышедшей на IPO, однако её деятельность сосредоточена в первую очередь на аппаратной инфраструктуре. Впрочем, её акции демонстрируют нестабильные результаты — в минувший понедельник их стоимость упала более чем на 7 %.

Постоянный URL: http://servernews.ru/1120589
31.03.2025 [20:38], Владимир Мироненко

«Софтлайн» опубликовал аудированные итоги 2024 года, подтвердив увеличение прогноза на 2025 год

ПАО «Софтлайн» (ГК Softline), поставщик решений и сервисов в области цифровой трансформации и информационной безопасности, опубликовал аудированные консолидированные финансовые результаты по МСФО за 2024 год. Как сообщает компания, в результате аудиторской проверки были подтверждены основные неаудированные финансовые результаты за 2024 год, которые были опубликованы в прошлом месяце.

В 2024 году оборот компании увеличился по сравнению с предыдущим годом на 32 %, достигнув 120,6 млрд руб., что стало возможным благодаря расширению линейки высокорентабельных продуктов собственного производства и переориентации на продажу отечественной продукции. В частности, компания получила 34,6 млрд руб. оборота от реализации собственных решений, что больше год к году на 59 %. При этом больше всего вырос оборот в сегменте «Услуги и облачные решения» (на 62 %) — наиболее существенном по объёму реализации среди собственных решений.

 Источник изображения: softline.ru

Источник изображения: softline.ru

Оборот компании от продажи оборудования собственного производства вырос на 37 %, до 4,7 млрд руб., а оборот от реализации собственного ПО и других продуктов снизился, что связано с высокой базой 2023 года из-за разовой крупной сделки по продаже собственного ПО. Также вырос оборот от продажи сторонних решений — на 23 %, до 86 млрд руб.

Валовая прибыль увеличилась на 57 %, до 36,9 млрд руб., валовая рентабельность выросла до 31 % (+4,8 п.п. г/г). Высокую рентабельность показал сегмент «Высокотехнологичных продуктов» (82 %), самыми высокими темпами этот показатель рос в сегменте собственных услуг и облачных решений — +83 % год к году.

Скорректированная EBITDA выросла на 58 % в годичном исчислении, до 7,1 млрд руб., при прогнозе в 6 млрд руб. Рентабельность по скорректированному показателю EBITDA составила 19,2 %. Чистая прибыль достигла 2,6 млрд руб.

Компания подтвердила свой прогноз на 2025 год, в том числе увеличение оборота до не менее 150 млрд руб.; увеличение валовой прибыли до 43–50 млрд руб. за счёт увеличения рентабельности и роста доли собственных продуктов и решений; увеличение скорректированного показателя EBITDA до 9–10,5 млрд руб. Уровень долга на конец года не должен превысить 2 EBITDA, что является комфортным уровнем для компании.

Постоянный URL: http://servernews.ru/1120574
31.03.2025 [14:20], Сергей Карасёв

«Яндекс» выпустил открытую ИИ-модель YandexGPT 5 Lite: её можно запускать на обычной рабочей станции

Компания «Яндекс» сообщила о появлении в открытом доступе Instruct-версии ИИ-модели YandexGPT 5 Lite: применять её можно в некоммерческих и в коммерческих целях. Благодаря сравнительно низким требованиям к оборудованию опробовать модель можно на обычном компьютере без специального оборудования.

Модель подверглась стандартному обучению на больших объёмах данных, а также прошла дополнительный этап настройки — так называемое выравнивание (alignment). Это позволяет ей решать конкретные задачи по запросам или инструкциям. Для сравнения: другую открытую версию YandexGPT 5 Lite — Pretrain — пользователям нужно дообучать под свои потребности.

Instruct-модификация YandexGPT 5 Lite насчитывает 8 млрд параметров и поддерживает контекст до 32 тыс. токенов. Говорится о совместимости с библиотекой llama.cpp и поддержке GGUF-формата (GPT-Generated Unified Format). По результатам международных тестов и их адаптаций для русского языка (MMLU, IFEval, RuFacts и других) модель соперничает с китайской Qwen2.5-7B-Instruct, превосходя её в таких сценариях, как задачи классификации и разметки текстов, знание русской культуры и фактов, умение отвечать в заданном формате. Более того, YandexGPT 5 Lite Instruct сравнима по качеству ответов с GPT-4o Mini в решении стандартных задач сервисов «Яндекса».

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

Благодаря обновлённой лицензии YandexGPT 5 Lite применять модель можно в коммерческих проектах, если объём выходных токенов не превышает 10 млн в месяц. Утверждается, что этого достаточно для создания и поддержки чат-ботов на небольших и средних сайтах, для генерации описаний товаров в интернет-магазинах с ограниченным ассортиментом, для автоматизации ответов клиентам в сервисных центрах или для анализа отзывов пользователей на площадках с умеренным трафиком.

Модель YandexGPT 5 Lite Instruct доступна бесплатно исследователям и разработчикам на Hugging Face. Бизнес-пользователям доступ предоставляется через API в Yandex Cloud: при этом можно дообучить модель для конкретных задач. Причём API стал совместим с OpenAI API: теперь модели «Яндекса» можно использовать с библиотеками OpenAI на Python, JavaScript и других языках программирования. Упрощена интеграция с популярными решениями для работы с технологиями машинного обучения: например, с платформой для запуска ИИ-ассистентов AutoGPT и с инструментом для создания приложений на базе нейросетей LangChain. Пользователи могут протестировать модель в чате с «Алисой».

Постоянный URL: http://servernews.ru/1120553
30.03.2025 [17:24], Владимир Мироненко

Рост цен и штрафы: изменения в лицензионной политике Broadcom VMware побуждают мелких и средних клиентов искать альтернативное решение

Французское подразделение глобального дистрибьютора Arrow отправило партнёрам VMware, использующим её решения, электронное уведомление об изменениях в лицензионной политике компании, влекущих за собой существенное повышение затрат клиентов на её продукты. Компания не только резко увеличила минимальные требования к лицензии, но и ввела штрафы за несвоевременное обновление лицензий.

«Мы хотели бы сообщить вам о существенных изменениях, внесённых Broadcom, которые повлияют на наш совместный бизнес, — пишет Arrow в меморандуме для партнеров, с которым ознакомился The Register. — Начиная с 10 апреля минимальное количество ядер, требуемых для лицензий VMware, существенно увеличится, с 16 до 72 ядер». Таким образом, если у клиента сервер с одним восьмиядерным процессором, он всё равно будет должен заплатить за лицензию VMware на 72 ядра, т.е. фактически переплачивать за 64 ядра, которые он не может использовать.

 Источник изображения: VMware

Источник изображения: VMware

Также Broadcom «ввела штрафы для конечных клиентов, которые вовремя не продлили свои уже действующие подписные лицензии». «Эти штрафы составляют 20 % от цены первого года подписки и будут применяться задним числом», — говорится в меморандуме.

Цель этих изменений вполне очевидна. Как пишет The Register, организации, использующие серверы с восемью ядрами, скорее всего, пользуются продуктами vSphere Foundation и vSphere Enterprise Plus, которые предлагают базовые инструменты виртуализации. При этом ведущее решение VMware — пакет Cloud Foundation (VCF) для вычислений, хранения и сетевых инструментов виртуализации. Пользователям потребуется четыре сервера только для управления VCF, не говоря уже о запуске любых виртуальных машин. Поэтому у пользователей VCF, вероятно, будет потребность в лицензии на гораздо больше ядер, чем 72. Так что эти изменения говорят о желании Broadcom иметь дело с крупными клиентами, которые приносят больше прибыли при меньших затратах.

Изменения ударят не только по мелким и средним компаниям, но и по крупным организациям с филиальной сетью, поскольку те не захотят оплачивать для небольшого офиса лицензию на 72 ядра. Крупные клиенты VMware уже столкнулись с ростом расходов, поскольку Broadcom предлагает продукты виртуализации в рамках пакетов по подписке, которая включает услуги поддержки. Хотя номинальная цена продуктов в этих пакетах снизилась, требование покупать пакеты и обслуживание означает, что у большинства клиентов наблюдается рост расходов.

«VMware наказывает клиентов малого и среднего бизнеса, которые продолжают использовать платформу, — сообщил ресурсу CRN топ-менеджер партнёра VMware. — Очевидно, что VMware не ценит сообщество малого и среднего бизнеса, которое построило свой бизнес с использованием её платформы». Применение Broadcom 20-% штрафа топ-менеджер расценил как оскорбление для клиентов. «Я не понимаю, почему они пытаются оттолкнуть клиентов», — сказал он. Ещё один собеседник CRN заявил, что изменения лицензионной политики VMware побудят клиентов искать альтернативные решения.

Генеральный директор компании из рейтинга CRN Solution Provider 500, пожелавший сохранить анонимность и назвавший штраф в размере 20 % плохой деловой практикой, заявил, что стратегия Broadcom VMware заключается в том, чтобы сосредоточиться на 20 % крупнейших клиентов и отказаться от рынка среднего и малого бизнеса. «Это её проверенная стратегия, — сказал он. — Она снижает эксплуатационные расходы и заключает многолетние сделки с клиентами с завышенными ценами, поэтому её расходы снижаются, доходы растут, и она получает больше прибыли».

Постоянный URL: http://servernews.ru/1120527
30.03.2025 [01:58], Владимир Мироненко

IBM сокращает персонал в США, но активно нанимает малоопытных сотрудников в Индии

После того, как ресурс The Register сообщил на прошлой неделе о планах IBM сократить около 9 тыс. рабочих мест в США в 2025 году, с ним связались нынешние и уволенные сотрудники, которые подтвердили, что сокращения персонала в США даже более значительные, чем сообщалось, и компания постепенно перемещает рабочие места в Индию.

Это подтверждают и размещаемые IBM на своём сайте вакансии. Если 7 января 2024 года на нём было всего 173 открытых вакансии в Индии, то 23 ноября 2024 года для работы в этой стране было размещено 2946 вакансий, а на момент публикации статьи — 3866 вакансий.

Сотрудник IBM, которого уже известили о сокращении его рабочего места (Resource Action, RA), рассказал, что об этом ему сообщили после того, как ему поручили обучить навыкам работы недавно нанятых работников в Индии. После получения уведомления о RA сотрудники имеют право в течение установленного периода подать заявку на отрытые вакансии в других подразделениях IBM. Но то, что у IBM в США есть открытые вакансии, вовсе не означает, что компания собирается нанимать здесь сотрудников. «Все, к кому я обращался внутри компании с просьбой о переводе, говорили одно и то же: “Я могу нанимать только в Индии”», — сообщил источник The Register. С подобной ситуацией сталкивались и другие собеседники ресурса.

 Источник изображения: Yogi Atmo / Unsplash

Источник изображения: Yogi Atmo / Unsplash

Один из бывших сотрудников IBM рассказал, что в IV квартале 2024 года было много увольнений, по слухам, исчисляемых тысячами, однако в Индии, наоборот, было размещено более тысячи вакансий. «Фаворитизм был вопиющим», — отметил он. По его словам, у многих из уволенных был большой опыт работы с облаком, но их заменили людьми без особого опыта или даже новичками. Также IBM передала на полный аутсорсинг в Индию вопросы обеспечения качества (QA).

«Они пытались заменить высококвалифицированных QA-инженеров — некоторые из которых имели более десяти лет опыта — новыми сотрудниками, обученными всего за полгода. Последствия были предсказуемы: резкое снижение качества и эффективности», — рассказал источник. «На этом этапе IBM может также перенести свою штаб-квартиру в Индию, поскольку она больше не отдает приоритет США», — то ли в шутку, то ли всерьёз предположил один из источников.

Собеседник The Register, рассказавший о сокращениях в подразделении Cloud Classic, сообщил, что увольнения проводятся и в других подразделениях IBM. Его слова подтверждаются появившимися недавно сообщениями об сокращениях рабочих мест в филиале компании в Северной Каролине, а также в Канаде.

В феврале 2024 года представитель IBM сообщил The Register, что компания ожидает завершить 2024 год примерно с тем же уровнем занятости, что и в начале года. Вместе с тем, IBM сократила 11,9 тыс. рабочих мест или 4,2 % общей численности в 2024 году, в то время в Индии было добавлено около 3 тыс. открытых вакансий. Поэтому, как полагает The Register, данные о планируемом IBM сокращении рабочих мест в 2025 году в пределах 9 тыс. являются заниженными, поскольку сокращение, как ожидается, будет более масштабным.

Постоянный URL: http://servernews.ru/1120517
28.03.2025 [23:26], Владимир Мироненко

«Яндекс» впервые отчиталась о результатах работы Yandex B2B Tech

Компания «Яндекс» впервые сообщила финансовые результаты своего нового подразделения Yandex B2B Tech, сформированного осенью прошлого года на базе платформы Yandex Cloud, включая ИИ-технологии для бизнеса, и виртуального офиса «Яндекс 360». Выручка входящих в Yandex B2B Tech направлений за 2024 год составила 32,2 млрд руб., что на 48,4 % больше по сравнению с 2023 годом.

По оценке «Яндекса», доля Yandex B2B Tech на рынке составляла в прошлом году 13 %. Как ожидает компания, объём рынка вырастет до 510 млрд руб. в 2028 году с 240 млрд руб. в 2024-м, показав среднегодовой темп прироста (CAGR) около 21 %. При этом «Яндекс» ожидает, что Yandex B2B Tech опередит рынок по темпам роста.

Выручка Yandex Cloud увеличилась год к году в 1,5 раза до 19,8 млрд руб. Более половины этой суммы (51 %) принесли контракты с крупными компаниями. Количество клиентов Yandex Cloud увеличилось год к году в 1,5 раза до 44 тыс., количество партнёров-интеграторов выросло в 1,3 раза — до 674.

К концу года у Yandex Cloud насчитывалось 73 сервиса. Самые высокие темпы роста выручки показали сервисы информационной безопасности — в 2,1 раза. За ними следуют BI-инструмент Yandex DataLens (рост в 2 раза) и ИИ-сервисы (рост в 1,6 раза), чья доля в общей выручке платформы увеличилась до 5 %. Число пользователей модели YandexGPT превысило 17 тыс., а нейросетью YandexART пользуется более 6,5 тыс. клиентов. В 2025 году, как ожидается, доля ИИ-сервисов в выручке Yandex Cloud вырастет до 8 %.

 Источник изображения: Яндекс

Источник изображения: Яндекс

В числе достижений компания назвала внедрение новой модели поставок on-premises, позволяющей предприятиям использовать некоторые решения не только в облаке, но и у себя на серверах, включая YandexGPT, DataLens, СУБД YDB и Yandex SpeechKit. Были представлены платформа для создания приложений на базе ИИ Yandex Cloud AI Studio и инструмент AI Assistant API для разработки персонализированных помощников, а также ряд продуктов для разработчиков, в том числе платформа SourceCraft. Также начал работу сервис Yandex Security Deck, позволяющий выявлять киберугрозы и снижать риски утечек в цифровых продуктах в облаке, и сервис аренды выделенных физических серверов Yandex BareMetal.

В свою очередь, виртуальный офис «Яндекс 360» принёс в 2024 году почти в 1,5 раза больше выручки год к году — 12,4 млрд руб. Более половины суммы было получено в B2B-сегменте, выручка которого выросла более чем вдвое. Наиболее востребованными у B2B-клиентов сервисами в прошлом году были «Почта», «Календарь», «Диск» и «Телемост». Количество клиентов платных сервисов «Яндекс 360» составило на конец 2024 года 151,5 тыс., из них более 25 тыс. — новые клиенты.

В минувшем году клиентам «Яндекс 360» также стала доступна возможность использовать сервисы по модели on-premises. Первым из них стал «Яндекс Доски», а в текущем году по этой модели можно будет использовать такие сервисы, как «Документы» и «Диск». Также в «Яндекс 360» появилась ролевая модель распределения прав доступа, поддержка авторизации через корпоративный SSO, общий диск и возможность создавать федерации с организациями, с которыми важно постоянно находиться на связи.

Постоянный URL: http://servernews.ru/1120484