Материалы по тегу: импортозамещение
14.08.2025 [15:48], Владимир Мироненко
Вместе, а не вместо: российские компании не спешат отказываться от зарубежных систем управления проектами, сочетая их с отечественнымиПочти треть (28 %) крупных российских компаний продолжает использовать иностранные решения для управления проектами, например, продукты Microsoft, Oracle или Atlassian, пишут «Ведомости» со ссылкой на исследование компании Naumen, опросившей представителей 60 компаний крупного бизнеса, средняя выручка которых составила 360 млрд руб. Четверть (около 25 %) респондентов вообще не использует никаких решений такого класса, а 12 % пользуется самописными разработками. В 2021 году весь рынок подобных решений составлял 5,8 млрд руб., из этой суммы 4,3 млрд руб. приходилось на иностранных разработки (около 74 %). В 2022 году объём рынка сократился до 4,9 млрд руб., а в 2023 году вырос до 5,4 млрд руб., затем составив в 2024 году 6,0 млрд руб. На фоне этой динамики выручка от российских решений последовательно росла с 2,1 млрд руб. в 2022 год, до 3,3 млрд в 2023 году и 4,4 млрд — в 2024 году. Совокупный среднегодовой темп роста (CAGR) российских решений в 2020–2024 гг. составил 46 %, а доля рынка российских решений увеличилась до 73 %. Согласно прогнозу Naumen, в 2025 году объём рынка может составить 6,6 млрд руб., из которых 5,4 млрд придётся на российские решения., т.е. их выручка вырастет сразу на 1 млрд руб. Тем не менее, бизнес предпочитает совмещать зарубежные и отечественные продукты. 10–15 % крупных компаний после импортозамещения продолжают использовать иностранное ПО, так как оно в этом классе систем остается признанным стандартом, а полного доверия отечественным решениям всё ещё нет. В Naumen отметили, что на российском рынке решений для управления проектами распространены монопродуктовые компании, такие как Yougile, Kaiten и Advanta, для которых продукт является основным или единственным — они заняли почти половину рынка в 2024 году (около 2 млрд руб.). На мультипродуктовые компании пришлось 1,8 млрд руб., а третье место заняли бигтех-компании (600 млн руб.). Сегмент крупного бизнеса и госсектора резко снизил долю в 2022 году из-за ухода иностранных компаний, и она до сих пор до конца не восстановилась. Освоение отечественных решений крупным бизнесом и госсектором началось только в 2024 году. Опрошенные «Ведомостями» эксперты отмечают, что перенос процессов с зарубежных решений является сложной и дорогой задачей, на которую могут уйти годы. Поэтому даже во время тестирования российского ПО компании продолжают использовать иностранные продукты, стараясь до конца использовать действующие лицензии или выбирая бесплатные версии. Кроме того, российские решения могут внедряться в новых проектах, тогда как старые по-прежнему полагаются на уже имеющееся ПО. В любом случае доля отечественных решений продолжает расти.
12.08.2025 [23:54], Андрей Крупин
ИБ-платформа Security Vision 5 получила множество доработокКомпания «Интеллектуальная безопасность» объявила о выпуске нового релиза актуальной на сегодняшний день версии платформы Security Vision 5. Security Vision позволяет автоматизировать большинство прикладных задач оператора информационной безопасности. Представленные в составе программного комплекса продукты охватывают такие рабочие процессы, как управление активами, уязвимостями и рисками кибербезопасности, выявление атак на ранних стадиях, консолидация оперативной информации и её анализ в реальном времени для расследования инцидентов ИБ, обеспечение соответствия IT-инфраструктуры требованиям ФЗ-187, а также двустороннее взаимодействие с ЦБ и НКЦКИ. Платформа предусматривает множество произвольных вариантов установки компонентов на отдельные серверные мощности, в том числе с размещением разных компонентов в разных сегментах сети организации. За счёт микросервисной архитектуры отдельные элементы Security Vision могут быть размещены на отдельных серверах и виртуальных машинах. ![]() Источник изображения: securityvision.ru Новый релиз платформы Security Vision 5 включает значительное количество функциональных доработок, улучшений интерфейса и оптимизаций, направленных на упрощение работы специалистов и повышение эффективности рабочих процессов. В частности, сообщается о доработках инструмента фильтрации данных, расширении возможностей работы с графами и карточками объектов, реализации функции динамического автозаполнения таблиц, упрощении механизмов аутентификации с использованием FreeIPA, а также отладки и контроля выполнения сценариев. С полным списком изменений можно ознакомиться по приведённой выше ссылке. Платформа Security Vision зарегистрирована в реестре отечественного ПО и сертифицирована ФСТЭК России по 4 уровню доверия. Решение может использоваться в значимых объектах критической информационной инфраструктуры 1 категории, в государственных информационных системах 1 класса защищённости, в информационных системах общего пользования II класса, в информационных системах персональных данных при необходимости обеспечения 1 уровня защищённости, в автоматизированных системах управления производственными и технологическими процессами 1 класса защищённости.
08.08.2025 [13:40], Руслан Авдеев
Крупному бизнесу в России могут запретить использование иностранных облаков
software
закон
импортозамещение
информационная безопасность
минцифры россии
облако
россия
сделано в россии
Минцифры России предлагает запретить использование облачных сервисов и приложений в системах хранения и обработки персональных данных корпоративных пользователей. Как следует из письма главы министерства Максута Шадаева главе Минпромторга Антону Алиханову, новые меры планируется ввести с 1 сентября 2027 года, сообщают «Ведомости». Запрет не коснётся малого и среднего бизнеса, ИП и физических лиц. Полная блокировка доступа к иностранному ПО тоже не предусмотрена, поскольку это «не представляется обоснованным». В Минпромторге предварительно согласны с новой концепцией. Минцифры предлагает поэтапно запрещать использовать такие решения и сервисы с учётом «зрелости и конкурентоспособности» российских аналогов. Законопроекты планируется разработать до мая 2026 года. Пока в России запрещено использование зарубежных облаков только для государственных структур — соответствующие поправки в закон «О связи» вступили в силу 1 сентября 2024 года. По данным «Ведомостей», Шадаев обеспокоен массовым использованием крупными российскими компаниями иностранных облаков, наиболее популярны AWS, Microsoft Azure и Google Cloud. Министр объясняет инициативу рисками потери доступа и компрометации данных, поскольку действующее российское законодательство не предусматривает обязанности использовать российское ПО в системах хранения и обработки персональных данных. ![]() Источник изображения: Serge Kutuzov/unsplash.com В соответствии с национальным проектом «Экономика данных», курируемым Минцифры, на отечественное ПО к 2030 году должны перейти не менее 80 % российских организаций в ключевых отраслях. С 1 января 2025 года уже вступил в силу закон о запрете использования иностранного ПО на объектах КИИ. Новое ограничение, как следует из письма, позволит стимулировать спрос на отечественные ПО и облака. По мнению экспертов, если запрет установят, российские облачные сервисы ждёт рост спроса, поскольку многие бизнесы до сих пор пользуются иностранными облаками «по инерции», хотя их в любой момент могут отключить извне. Многие крупные компании всё ещё используют и иностранные сервисы вроде Microsoft Teams, ставя под угрозу корпоративные и персональные данные, хотя российские альтернативы уже закуплены. Миграция на отечественные облачные решения значительно ускорилась в 2022 году. В 2023–2024 гг. уже решались в основном точечные задачи и этап, по мнению экспертов, можно считать завершённым для компаний, планировавших переход на российские решения. Другими словами, «импортозамещение» иностранных сервисов к сентябрю 2027 года «кажется реалистичным». Стоит отметить, что в июле Минцифры РФ совместно с ФСБ и ФСТЭК предписано проработать изменения законов, устанавливающие обязанность операторов персональных данных граждан применять для обработки и хранения такой информации только ПО российской разработки. Варианты поправок должны быть готовы до 1 декабря 2025 года, а переходный период для внедрения изменений ограничат 1 сентября 2027 года.
05.08.2025 [11:16], Сергей Карасёв
Европейские чипы Cinco Ranch на базе RISC-V близки к началу массового производстваУчастники проекта Barcelona Zettascale Laboratory (BZL), координируемого Барселонским суперкомпьютерным центром (BSC) в Испании, по сообщению ресурса EETimes, достигли фазы Tape-out в рамках разработки европейских процессоров Cinco Ranch на открытой архитектуре RISC-V. Tape-out — это финальная стадия проектирования интегральных схем или печатных плат перед их отправкой в производство. Данный процесс предполагает перенос цифрового макета чипа на фотошаблон для последующего изготовления. Производством изделий займётся предприятие Intel Foundry с применением техпроцесса Intel 3. Cinco Ranch представляет собой пятое поколение чипов серии Lagarto. По сути, это «система на кристалле» (SoC) промышленного класса с высокой энергетической эффективностью. Конструкция чипа включает три отдельных специализированных ядра, каждое из которых оптимизировано под определённые вычислительные задачи. В частности, присутствует ядро Sargantana (RV64G) с однопоточным выполнением инструкций по порядку. Кроме того, имеется двухпоточное ядро Lagarto Ka с внеочередным исполнением машинных инструкций. Довершает картину высокопроизводительное 6-поточное ядро Lagarto Ox (RV64GC) с внеочередным исполнением инструкций. Нужное ядро выбирается в момент загрузки системы. ![]() Источник изображения: BSC Решение Cinco Ranch содержит 16-канальный векторный блок Vitruvius++ VPU и трёхуровневую систему кеша. Реализована поддержка памяти DDR5 и интерфейса PCIe 3.0. Площадь чипа составляет 16 мм2. Главной целью проекта BZL является разработка суверенных суперкомпьютерных технологий в Европе. Предполагается, что создаваемые чипы найдут применение в различных областях, включая НРС-платформы, автономные транспортные средства, системы ИИ и пр. После всестороннего тестирования чипов Cinco Ranch будет освоено их массовое производство.
03.08.2025 [10:17], Сергей Карасёв
Rebellions и Marvell займутся разработкой решений для суверенного ИИЮжнокорейская компания Rebellions, занимающаяся созданием специализированных ИИ-чипов, объявила о сотрудничестве с американским разработчиком процессоров, микроконтроллеров и телекоммуникационных изделий Marvell Technology. Цель партнёрства — выпуск высокопроизводительных и энергоэффективных ИИ-решений для суверенных платформ в Азиатско-Тихоокеанском регионе и на Ближнем Востоке. Стартап Rebellions основан в 2020 году. Компания проектирует чипы для инференса, способные обеспечить энергоэффективность и высокую производительность при небольших задержках. В январе 2024 года Rebellions провела раунд финансирования Series B, в ходе которого на развитие было привлечено $124 млн. Позднее стартап получил $15 млн от Wa’ed Ventures — венчурного подразделения саудовского нефтегазового и химического гиганта Aramco. Кроме того, фирма Rebellions объявила о слиянии с разработчиком ИИ-чипов Sapeon Korea, который был выделен из SK Telecom в 2016 году. В заявлении Rebellions говорится, что инфраструктура ИИ становится всё более важной в плане обеспечения национальной конкурентоспособности. На этом фоне наблюдается переход от стандартизированных архитектур на базе GPU к специализированным системам, построенным с применением ASIC. Такой трансформации способствуют суверенные инициативы и проекты региональных поставщиков облачных услуг, которым требуется инфраструктура, обеспечивающая масштабируемость, эффективность и контроль. Предполагается, что новое партнёрство позволит Rebellions разрабатывать кастомизированные ИИ-ускорители с использованием специализированных платформ Marvell. При этом будут использоваться передовые технологии упаковки чипов, высокоскоростные SerDes-блоки и межкомпонентные соединения. Новые чипы, как ожидается, обеспечат возможность высокопроизводительного и энергоэффективного инференса. В целом, сотрудничество позволит объединить достижения Rebellions в области разработки ИИ-решений с передовыми технологиями интеграции кремниевых компонентов Marvell для создания специализированной инфраструктуры ИИ, отвечающей потребностям государственных организаций.
29.07.2025 [11:57], Андрей Крупин
Состоялся релиз новой версии SafeTech CA — отечественной альтернативы Microsoft Certificate Authority
software
защита предприятия
импортозамещение
информационная безопасность
криптография
сделано в россии
Работающая в сфере кибербезопасности российская компания SafeTech Lab выпустила новую версию своего флагманского продукта — корпоративного центра сертификации SafeTech CA 3.0. Комплекс SafeTech CA в полной мере отвечает задачам импортозамещения ПО в отечественных организациях и способен полностью заменить Microsoft Certificate Authority для Windows-инфраструктур. Решение также позволяет управлять процессами выпуска и администрирования технологических сертификатов для Linux-систем, мобильных устройств на базе Android/iOS, сетевого оборудования и других компонентов IT-ландшафта. ![]() Архитектура SafeTech CA (источник изображения: safe-tech.ru) Обновлённый SafeTech CA 3.0 получил полностью переработанный пользовательский интерфейс и дополнительные функциональные возможности для управления технологическими сертификатами в корпоративной инфраструктуре любой сложности. В продукте существенно обновлён компонент UI-Gateway, отвечающий за предоставление доступа в личные кабинеты пользователей и администраторов, расширены функции аудита событий безопасности, обеспечена возможность публикации сертификатов в LDAP-каталоги, доработан модуль MS Enrollment в части поддержки возможности запрета экспорта закрытых ключей, реализовано добавление выпущенного сертификата пользователя в атрибут Active Directory, а также добавлен модуль SSH, позволяющий выпускать и работать с SSH-сертификатами и шаблонами для контроля доступа привилегированных пользователей. Релиз SafeTech CA 3.0 полностью адаптирован для работы как в классической среде виртуализации (VMware, KVM, Hyper-V и др.), так и в контейнерной (Docker, OpenShift/Kubernetes). Микросервисная инфраструктура позволяет масштабировать центр сертификации, создавать любые отказоустойчивые конфигурации и решать задачи кластеризации в крупных территориально распределённых IT-инфраструктурах.
28.07.2025 [15:04], Руслан Авдеев
Доля европейских облачных провайдеров на местном рынке снизилась до 15 % и остаётся на этом уровне годамиКак свидетельствуют новые данные Synergy Research Group, европейские операторы облачных сервисов с 2017 по 2024 годы увеличили свои местные доходы более чем втрое. Правда, за тот же период облачный рынок вырос более чем в шесть раз, составив в 2024 году €61 млрд ($70 млрд), сообщает пресс-служба компании. При этом доля европейских облачных провайдеров на местном рынке снизилась с 29 % в 2017 году до 15 % в 2022 году, и с тех пор сохраняется на одном уровне. Основными бенефициарами стали Amazon (AWS), Microsoft и Google — на эту тройку приходится 70 % рынка региона. Среди европейских провайдеров лидируют SAP и Deutsche Telekom, но на каждого из них приходится лишь по 2 % европейского рынка. Определённую роль играют и OVHCloud, Telecom Italia, Orange, а также многочисленные игроки национального и регионального масштабов. Оставшаяся часть европейского рынка приходится на мелких облачных провайдеров из США и Азии. Как утверждают в Synergy, выручка от облачной инфраструктуры (включая IaaS, PaaS и хостинг частных облаков) в I полугодии текущего года составила €36 млрд, а за весь год она вырастет год к году на 24 %. Большая часть рынка приходится на IaaS- и PaaS-сервисы, и они растут быстрее, чем сегмент частных облаков. Драйвером рынка становится искусственный интеллект (ИИ) — рост генеративных сервисов на основе ИИ, вроде GPUaaS и GenAI PaaS, составляет 140–160 %. ![]() Источник изображения: Synergy Research Group По статистике Synergy, крупнейшими облачными рынками в регионе являются Великобритания и Германия, но только сейчас крупнейшими рынками с самыми высокими темпами роста названы Ирландия, Испания и Италия. По словам представителя Synergy Research, на рынке облачных услуг начинающим игрокам приходится делать огромные финансовые ставки, иметь долгосрочное видение инвестиционной политики и грядущих прибылей, а также всё время совершенствовать бизнес. При этом ни одна европейская компания не соответствует этим критериям, и на рынке предсказуемо доминируют американские компании. Они ежеквартально вкладывают в европейские программы капиталовложения порядка €10 млрд — конкурировать с ними местному бизнесу буквально невозможно. В результате европейские облачные поставщики в основном обслуживают локальные группы клиентов с специфическими для региона потребностями, иногда взаимодействуя с крупными американскими провайдерами. Хотя многие европейские поставщики облачных услуг, вероятно, продолжат расти, вряд ли они смогут существенно изменить положение дел на облачном рынке. В конце мая эксперты заявили, что европейским пользователям отказаться от американских облаков сегодня уже практически невозможно. Более того, в июне SAP заявила, что не видит смысла в строительстве Европой собственной облачной инфраструктуры. Между тем, тотальное доминирование американского бизнеса в Европе грозит местным облачным провайдерам серьёзными проблемами. Так, в мае 2025 года сообщалось, что Microsoft всё ещё не создала продукта, удовлетворяющего требованиям соглашения с ассоциацией европейских облачных провайдеров CISPE. В рамках действующей под эгидой CISPE инициативы было решено, что относительно действий компании всё ещё «существуют опасения, хотя предложены меры для исправления». Кроме того, в июле Microsoft признала, что не может гарантировать суверенитет данных в Европе. Наконец, CISPE подала иск в Европейский суд общей юрисдикции, утверждая, что Еврокомиссия не выдвинула никаких условий, мешающих Broadcom злоупотреблять доминирующим положением на рынке. CISPE заявляет, что доминирование ПО VMware на рынке виртуализации означает, что обновление условий лицензирования затронут практически всех европейских облачных операторов и их пользователей. Год назад CISPE прямо заявила, что новая лицензионная политика Broadcom грозит банкротством небольшим облачным провайдерам.
25.07.2025 [23:35], Андрей Крупин
ВТБ провёл крупнейшее в России импортозамещение системы управления знаниямиВТБ, второй по величине банк в РФ по размеру активов, сообщил о реализации масштабного проекта в области импортозамещения программного обеспечения. Речь идёт о замене зарубежной системы управления знаниями на российский продукт «Плюс7 Маяк», разработанный компанией DIS Group и зарегистрированный в реестре отечественного ПО. Система управления знаниями «Плюс7 Маяк» предназначена для повышения эффективности внешних коммуникаций и внутрикорпоративных взаимодействий. В основу платформы положена постоянно обновляемая база информации и интерфейсы интеграции с внешними системами, включая CRM, телефонию, корпоративный веб-сайт, чат-боты и другие компоненты. Решение может использоваться для оптимизации работы контакт-центра, создания бизнес-википедии для повышения внутренней эффективности или создания справочника для работников продаж. В инфраструктуре ВТБ программный комплекс «Плюс7 Маяк» обеспечивает работу 53 тысяч сотрудников банка, обслуживающих более 26 млн клиентов. ![]() Источник изображения: Nathan Dumlao / unsplash.com «Переход на отечественное решение повысил производительность и ускорил обслуживание клиентов за счёт более оперативного предоставления информации и ответов сотрудниками банка. Обновление системы прошло без простоев и сбоев и не отразилось на качестве обслуживания пользователей услуг», — отметил руководитель департамента технологического развития общебанковских систем ВТБ Никита Рыбченко. «Для нашей команды было важно, чтобы новая система не просто работала, а действительно повышала эффективность сотрудников в ежедневном взаимодействии с клиентами. Сейчас для специалистов реализована единая точка входа для поиска накопленных знаний банка, всей информации о продуктах, услугах, акциях, внутренних и клиентских процессах, часто задаваемых вопросах и ответах. Это особенно важно для тех, кто работает с клиентами ежедневно», — подчеркнула руководитель департамента анализа, координации и продуктового развития ВТБ Юлия Копытова. ВТБ активно занимается реализаций программ в сфере импортозамещения. В 2021–2024 гг. общие расходы банка в данном направлении составили 90 млрд рублей, в первую очередь речь идёт о расходах на программное обеспечение. Одним из важных и масштабных шагов на пути отказа от зарубежного ПО стал переход финансовой организации на российскую ОС Astra Linux, а также миграция с офисных продуктов Microsoft на российский «МойОфис». В инфраструктуре ВТБ задействованы многие другие решения отечественных разработчиков, среди которых — система резервного копирования RuBackup, VDI-инструменты компании «Базис», СУБД Postgres Pro Enterprise и прочий софт.
25.07.2025 [22:24], Андрей Крупин
Вышел релиз обновлённого «Кибер Хранилища» с массой оптимизаций для работы с кластерами S3Российская компания «Киберпротект», занимающаяся разработкой систем резервного копирования, защиты от утечек данных (DLP) и инфраструктурного программного обеспечения, сообщила о выпуске новой версии программно-определяемого хранилища данных «Кибер Хранилище» 6.7. «Кибер Хранилище» представляет собой готовое решение для создания многоцелевой инфраструктуры хранения данных на основе стандартного серверного оборудования x86 с любыми типами накопителей (HDD, SSD, NVMe). Продукт позволяет развернуть несколько пулов хранения с разными показателями производительности и стоимости хранения, объединённых централизованными инструментами управления и мониторинга. Безопасность хранимых данных обеспечивается ролевой моделью, защищённым доступом к инструментам администрирования и средствами шифрования файлов. «Кибер Хранилище» создано в РФ, включено в реестр российского ПО и совместимо со всеми серверными платформами отечественного производства, что позволяет создавать программно-аппаратные комплексы, удовлетворяющие требованиям регуляторов по безопасности и импортозамещению. ![]() Средства мониторинга программного комплекса «Кибер Хранилище» (источник изображения: cyberprotect.ru) В релизе «Кибер Хранилища» 6.7 реализована функциональность, обеспечивающая возможность доступа под одним доменным именем (FQDN) к системе кластеров, работающих в режиме георепликации. Это позволяет сделать любое приложение, использующее S3-хранилище, катастрофоустойчивым без использования специализированных балансировщиков. В дополнение к этому был упрощён процесс развёртывания крупных кластеров S3. Теперь «Кибер Хранилище» обеспечивает возможность задавать целевое число экземпляров сервисов и автоматически распределяет их по узлам кластера. Такой подход упрощает поэтапное развёртывание в крупных инсталляциях, помогая избегать некорректного размещения избыточного числа экземпляров сервисов на отдельных узлах. Среди прочих улучшений — возможность автоматизированного обновления системы для закрытых контуров, средства сбора диагностической информации о состоянии сервисов объектного хранилища S3 и инструменты автоматического восстановления работы хранилища при массовом выходе из строя оборудования хранения кластера S3, увеличенная производительность операций чтения/записи данных индекса за счёт избыточного кодирование данных и репликации индекса. Также проведены работы по поддержке высокопроизводительного аппаратного обеспечения и современных технологий его использования, в частности сетевых карт Chelsio и технологии Intel VROC.
25.07.2025 [09:23], Владимир Мироненко
Импортозамещение по-южнокорейски: LG AI Research выбрала ускорители FuriosaAI RNGD для своих ИИ-серверовКомпания LG AI Research (ИИ-подразделение LG Group) из Южной Кореи заключила соглашение с южнокорейским стартапом FuriosaAI о выпуске серверов с ИИ-ускорителями RNGD для работы с собственным семейством LLM Exaone, сообщил The Register. Как сообщил генеральный директор FuriosaAI Джун Пайк (June Paik) изданию EE Times, серверы LG с чипами RNGD будут ориентированы на предприятия, использующие модели ExaOne в сфере электроники, финансов, телекоммуникаций и биотехнологий. Серверы поступят в продажу в конце этого года. «После тщательного тестирования широкого спектра опций мы пришли к выводу, что RNGD — высокоэффективное решение для развёртывания моделей Exaone», — заявил Киджонг Чон (Kijeong Jeon), руководитель подразделения продуктов LG AI Research. «RNGD обеспечивает убедительное сочетание преимуществ: превосходную производительность в реальных условиях, значительное снижение совокупной стоимости владения и удивительно простую интеграцию», — добавил он. Подобно системам на базе NVIDIA RTX Pro Blackwell, серверы LG RNGD будут включить до восьми ускорителей с интерфейсом PCIe 5.0. Эти системы будут работать на базе того, что FuriosaAI описывает как высокоразвитый программный стек, включающий библиотеку vLLM. LG также предложит собственную платформу агентского ИИ ChatExaone, которая адаптирована для корпоративных сценариев использования. Она объединяет ряд фреймворков для анализа документов, глубоких исследований, анализа данных и RAG. LG AI Research протестировала работу модели ExaOne-32B на восьмичиповом 4U-сервере c воздушным охлаждением, который был разработан совместно с Supermicro. В 15-кВт стойке можно разместить пять таких серверов. По словам Пайка, LG AI Research протестировала оборудование от нескольких поставщиков оборудования из Южной Кореи и других стран, взяв за основу ускорители NVIDIA A100. «LG AI Research также тестировала облачные решения, но, по их словам, наше решение на данный момент оказалось единственным, отвечающим их требованиям», — сказал Пайк. Как полагает The Register, выбор для сравнения ускорителя NVIDIA A100, дебютировавшего в 2020 году, а не более свежих моделей, вызван тем, что LG AI Research больше интересует энергоэффективность оборудования, чем производительность. И, как отметил Джун Пайк, хотя за пять лет с момента появления A100 ускорители NVIDIA, безусловно, стали мощнее, но произошло это за счёт увеличения энергопотребления и площади кристалла. Сообщается, что LG AI фактически использовала четыре PCIe-ускорителя RNGD, задействовав тензорный параллелизм для запуска модели Exaone 32B с 16-бит точностью. По словам Пайка, у LG были очень чёткие целевые показатели производительности, которые она стремилась достичь при валидации чипа. В частности, ограничения включали время до отдачи первого токена (TTFT) — примерно 0,3 с для небольших запросов на 3 тыс. токенов или 4,5 с для более крупных запросов на 30 тыс. токенов. Результат в 60 токенов/с достигается для контекстного окна размером 4 тыс. токенов или 50 токенов/с для контекстного окна размером 32 тыс. токенов. По словам Пайка, тесты проводились в режиме BF16, поскольку сравниваемые A100 не имеет встроенной поддержки FP8, так что использование RNGD в FP8-режиме позволит удвоить эффективность инференса и снизить TTFT. Кроме того, сервер продемонстрировал в 2,25 раза более высокую производительность инференса LLM на Ватт по сравнению с A100, а полная стойка сможет генерировать в 3,75 раза больше токенов, чем стойка с A100 при том же энергопотреблении. Чип FuriosaAI RNGD обеспечивает производительность 512 Тфлопс (FP8) при TDP 180 Вт. В отличие от ускорителей NVIDIA, оснащённых высокоскоростным интерконнектом NVLink (600 Гбайт/с), FuriosaAI использует интерфейс PCIe 5.0 (128 Гбайт/с). По словам FuriosaAI, чтобы избежать узких мест и накладных расходов, связанных с интерконнектом, компилятор компании помогает оптимизировать процесс обмена данными и собственно вычисления. |
|