Лента новостей
08.09.2023 [14:18], Руслан Авдеев
IBM представила серию «экономичных» языковых моделей Granite, для запуска которых достаточно одного NVIDIA V100Компания IBM представила серию больших языковых моделей (LLM) Granite в рамках ИИ-платформы watsonx. Как сообщает IBM, это не единственное пополнение watsonx — добавятся инструменты, упрощающие создание датасетов для обучения LLM, а также ПО, упрощающее адаптацию нейросетей к новым типам задач. Представленный в мае watsonx представляет собой набор инструментов, помогающий корпоративным клиентам строить генеративные ИИ-модели, а также выполнять смежные задачи вроде адаптации нейросетей под требования безопасности. Новые модели будут доступны при посредничестве компонента watsonx.ai, который уже имеет готовые шаблоны. ![]() Источник изображения: IBM Серия Granite включает LLM Granite.13b.instruct и Granite.13b.chat, построенные с помощью 2,4-терабайтного набора данных, подобранного специалистами компании. Модели способны составлять краткие резюме документов, «извлекать информацию» и генерировать тексты. Обе модели имеют по 13 млрд параметров. Благодаря относительной компактности, для запуска любой из них достаточно единственного ускорителя NVIDIA V100, который значительно дешевле A100 и H100. Другими словами, получить собственную нейросеть смогут даже очень небольшие компании. В IBM сообщают, что готовятся и другие модели, а watsonx.ai, помимо наработок IBM, получит Llama-2 (разработана Meta✴) и нейросеть StarCoder, предназначенную для программистов — её представили в мае ServiceNow и Hugging Face. Также watsonx.ai получил механизм генерации синтетических данных, применяемых для обучения кастомных LLM, и инструмент для адаптации параметров нейросети для того, чтобы учить её выполнять новые задачи без «перетренировки». Дополнительно стало известно, что IBM расширила возможности компонента watsonx.data для управления датасетами, предназначенными для тренировки ИИ. Сообщается, что инструмент получит новые возможности благодаря добавлению «разговорного» интерфейса. Добавятся и другие функции, например, работа с векторными базами данных.
08.09.2023 [11:30], Сергей Карасёв
Arduino получила на развитие ещё $22 млн, в том числе от ArmКомпания Arduino, разрабатывающая открытое аппаратное обеспечение, объявила о расширении раунда финансирования Series B: на развитие привлечено ещё $22 млн. С учётом ранее полученных $32 млн общая денежная поддержка по программе Series B достигла $54 млн. Финансирование проведено при участии CDP Venture Capital (через Large Ventures), крупнейшей венчурной фирмы Италии, и Anzu Partners. Кроме того, к программе присоединилась компания Arm. Значительная часть полученных денег будет направлена на дальнейшее укрепление команды исследований и разработок, базирующейся в Турине: здесь работают около 130 сотрудников. Это поможет расширить набор библиотек корпоративных приложений и продолжить развитие платформы Arduino Cloud for Business, улучшив интеграцию и набор ИИ-функций. У Arduino также есть европейское подразделение из более чем 30 человек в Мальмё (Швеция). ![]() Источник изображения: Arduino Деньги пойдут и на усиление присутствия в США, где Arduino недавно открыла представительство в Остине (штат Техас). Кроме того, у компании есть команда в Чикаго (штат Иллинойс). Arduino также будет использовать дополнительные средства для ускорения вывода продуктов на рынок и улучшения поддержки клиентов. «Эти инвестиции позволят нам и дальше стимулировать инициативу по развитию платформы для профессиональных клиентов, снижая барьеры для входа в Интернет вещей и сферу ИИ», — говорит Фабио Виоланте (Fabio Violante), генеральный директор Arduino.
08.09.2023 [11:23], Сергей Карасёв
Производитель MRAM-продуктов Everspin девятый квартал подряд получает прибыль, но очень скромнуюКомпания Everspin Technologies, разработчик магниторезистивной памяти с произвольным доступом (MRAM), обнародовала показатели деятельности во II четверти 2023 года, которая была закрыта 30 июня. Общая выручка составила $15,7 млн, что на 7 % большее прошлогоднего результата, равного $14,7 млн. Продажи MRAM-продуктов, включая Toggle MRAM и STT-MRAM, за трёхмесячный период оказались на уровне $13,4 млн. Это незначительно больше результата годичной давности, когда соответствующие изделия принесли $13,2 млн. ![]() Источник изображения: Everspin Денежные поступления от лицензирования, выплаты роялти и других направлений деятельности составили около $2,3 млн, тогда как во II квартале 2022 года этот показатель был зафиксирован на отметке около $1,5 млн. Чистая квартальная прибыль, рассчитанная в соответствии с общепризнанными принципами бухгалтерского учёта (GAAP), достигла $3,9 млн, или приблизительно $0,19 в пересчёте на одну ценную бумагу. Для сравнения: годом ранее эти показатели равнялись соответственно $1,7 млн и $0,08. Таким образом, Everspin увеличила чистую прибыль более чем в два раза. В целом, компания сохраняет прибыльность девять кварталов подряд, что говорит об устойчивости бизнеса. В текущем квартале Everspin рассчитывает показать выручку от $15,4 млн до $16,4 млн. Чистая прибыль, как ожидается, будет лежать в диапазоне от $0,01 до $0,06 на одну ценную бумагу.
08.09.2023 [11:21], Сергей Карасёв
В Португалии запущен Arm-суперкомпьютер Deucalion с быстродействием более 10 ПфлопсВ рамках проекта European High Performance Computing Joint Undertaking (EuroHPC JU), реализуемого властями Евросоюза, странами-участницами и частными компаниями с целью создания инфраструктуры высокопроизводительных вычислений, запущен суперкомпьютер Deucalion. Комплекс разработан специалистами Fujitsu Technology Solutions. Это первая система EuroHPC, основанная на процессорах с архитектурой Arm. Применены чипы Fujitsu A64FX, а также платформа Bull Sequana от Eviden (Atos). Суперкомпьютер располагается в Португалии: он размещён в Центре передовых вычислений Университета Минью в Гимарайнше. Общий бюджет проекта Deucalion составил €20 млн — средства выделены участниками инициативы EuroHPC и Португальским фондом науки и технологий (FCT). Deucalion — самый мощный суперкомпьютер в Португалии и восьмой вычислительный комплекс, созданный по программе EuroHPC JU. Комплекс обеспечивает производительность более 10 Пфлопс. Использовать систему в числе прочего планируется для исследований и разработок в области метеорологии и моделирования климата, гидродинамики, аэродинамики, а также астрофизики и космологии. Кроме того, суперкомпьютер будет стимулировать инновации в таких областях, как ИИ, персонализированная медицина, фармацевтика и новые материалы, пожаротушение, территориальное планирование, интеллектуальная мобильность и автономные транспортные средства.
07.09.2023 [23:02], Сергей Карасёв
Разработчик ускорителей для генеративного ИИ D-Matrix привлёк на развитие $110 млнСтартап D-Matrix, по сообщению ресурса SiliconAngle, провёл крупный раунд финансирования Series B, в ходе которого на развитие привлечено $110 млн. Данную программу возглавила инвестиционная фирма Temasek, базирующаяся в Сингапуре. Компания D-Matrix создаёт чипы и платформы, предназначенные для развертывания систем генеративного ИИ. Стартап проектирует микросхемы со специализированной чиплетной архитектурой, использующей концепцию «цифровых вычислений в памяти» (DIMC). Это позволяет перенести полностью программируемую память непосредственно на чип, что даёт возможность уменьшить задержки и повысить эффективность. ![]() Источник изображения: D-Matrix Отмечается, что большие языковые модели, такие как Llama 2 от Meta✴ Platform и ChatGPT от OpenAI, обучаются на огромных массивах данных. Именно для оптимизации этого процесса и предназначены решения D-Matrix. В частности, изделие под названием Jayhawk II, как утверждает стартап, позволяет повысить эффективность обучения в 10–20 раз по сравнению с GPU и уменьшить затраты в 10–20 раз. В нынешнем раунде финансирования D-Matrix приняли участие существующие инвесторы в лице Playground Global, венчурного фонда M12 корпорации Microsoft, Nautilus Venture Partners и Entrada Ventures. К ним присоединились Industry Ventures, Ericsson Ventures, Marlan Holdings, Mirae Asset и Samsung Ventures. Стартап D-Matrix в апреле 2022 года получил $44 млн в рамках предыдущего раунда финансирования, возглавляемого M12 и компанией SK hynix Inc. Таким образом, общая сумма привлечённых средств достигла $154 млн.
07.09.2023 [21:25], Алексей Степин
Cerebras готова к построению масштабных ИИ-кластеров CS-2 с 163 млн ядерНа прошедшей недавно конференции Hot Chips 2023 компания Cerebras, создатель самого большого в мире ИИ-процессора WSE-2, рассказала о своём видении будущего ИИ-систем. По мнению Cerebras, сфокусировать внимание стоит не столько на наращивании сложности отдельных чипов, сколько на решениях проблем, связанных с масштабированием кластеров. Свою презентацию Cerebras начала с любопытных фактов: за прошедшие пять лет сложность ИИ-моделей возросла в 40 тыс. раз. И этот темп явно опережает темпы развития чипов-ускорителей. Хотя налицо прогресс и в техпроцессах (5x), и в архитектуре (14x), и во внедрении более эффективных для ИИ форматов данных, но наибольший прирост производительности обеспечивает именно возможность эффективного масштабирования. Однако и этого недостаточно — 600-кратный прирост от кластеризации явно теряется на фоне 40-тыс. усложнения самих нейросетей. А дальнейший рост масштабов ИИ-комплексов в их классическом виде, состоящих из множества «малых» ускорителей, неизбежно приводит к проблемам с организацией памяти, интерконнекта и вычислительных мощностей. В итоге решение любой задачи в таких системах часто упирается в необходимость тончайшей, но при этом далеко не всегда эффективной оптимизации разделения ресурсов. При этом разные методы масштабирования имеют свои проблемы — узким местом могут оказаться и память, и интерконнект, и конкретный подход к организации кластера. Cerebras же предлагает совершенно иной подход. Выход компания видит в создании огромных чипов-кластеров, таких, как 7-нм Cerebras WSE-2. Этот чип на сегодня можно назвать самым большим в индустрии: его площадь составляет более 45 тыс. мм2, при этом он содержит 2,6 трлн транзисторов и имеет 850 тыс. ядер, дополненных 40 Гбайт сверхбыстрой памяти. Что интереснее, кластер на базе CS-2 представляется с точки зрения исполняемой модели, как единая система. Сама по себе сложность WSE-2 и платформы CS-2 на его основе такова, что позволяет запускать модели практически любых размеров, благо весовые коэффициенты чип в себе не хранит, а подгружает извне с помощью подсистемы MemoryX. При этом сама по себе платформа CS-2 допускает и дальнейшее масштабирование: с помощью интерконнекта SwarmX в единый кластер можно объединить до 192 таких машин, что в теории позволит поднять производительность до 8+ Эфлопс. Подсистема MemoryX включает в себя 12 узлов, за оптимизацию модели в ней отвечают 32-ядерные процессоры, а веса хранятся как в DRAM, так и во флеш-памяти — объёмы этих подсистем составляют 12 Тбайт и 6 Пбайт соответственно. Каждый узел имеет по 2 порта 100GbE — один для закачки данных в CS-2, второй для общения с другими MemoryX в кластере. Оптимизация данных производится на процессорах MemoryX, «мегачипы» CS-2 для этого не используются. Подсистема интерконнекта SwarmX базируется на 100GbE с поддержкой RoCE DRMA, но имеет ряд особенностей: на каждые четыре системы CS-2 приходтся 12 узлов SwarmX c производительностью интерконнекта 7,2 Тбит/с. Трансляция и редуцирование данных осуществляются с коэффициентом 1:4, причём и здесь используются силы собственных 32-ядерных процессоров, а не ресурсы CS-2. Топологически SwarmX имеет двухслойную конфигурацию spine-leaf и обеспечивает соединение типа all-to-all, при этом каждая CS-2 имеет свой канал с пропускной способностью 1,2 Тбит/с. Сочетание MemoryX и SwarmX позволяет делать кластеры на базе CS-2 крайне гибкими: размер модели ограничивается лишь ёмкостью узлов MemoryX, а степень параллелизма — их количеством. При этом интерконнект обладает достаточной степенью избыточности, чтобы говорить об отсутствии единых точек отказа. Таким образом, Cerebras имеет на руках всё необходимое для запуска самых сложных моделей искусственного интеллекта. Уже сравнительно немолодой кластер Andromeda, включающий всего 16 платформ CS-2, способен «натаскивать» за считанные недели нейросети размерностью до 13 млрд параметров. При этом масштабирование по размеру модели не требует серьёзного вмешательства в программный код, в отличие от классического подхода для ускорителей NVIDIA. Фактически для сетей и с 1, и со 100 млрд параметров используется один и тот же код. Более мощный 64-узловой комплекс Condor Galaxy 1 (CG-1), располагающий 54 млн ИИ-ядер и развивающий до 4 Эфлопс уже доказал, что подход к масштабированию, продвигаемый Cerebras, оправдывает себя. Он успешно обучил первую публичную модель с 3 млрд параметров, причём по возможностям она приближается к моделям с 7 млрд параметров. И это не предел: напомним, в текущем воплощении сочетание подсистем MemoryX и интерконнекта SwarmX допускает объединение в единый кластер до 192 узлов CS-2. Компания считает, что она полностью готова к наплыву ещё более сложных нейросетей, а предлагаемая ей архитектура в явном виде лишена многих узких мест, свойственных традиционным GPU-архитектурам. Насколько успешным окажется такой подход в более отдалённой перспективе, покажет время.
07.09.2023 [19:51], Руслан Авдеев
Федеральная комиссия по связи США предлагает запретить IoT-модули китайских Quectel и FibocomФедеральная комиссия по связи США (FCC) предложила объявить китайские компании Quectel and Fibocom Wireless бизнесами, представляющими неприемлемый риск для государственной безопасности страны. По данным Reuters, обе компании выпускают решения для Интернета вещей, поставляемые на американский и другие рынки. При этом на долю китайских Quectel, Fibocom и Sunsea по итогам 2022 года приходилось порядка 50 % мировых продаж IoT-модулей. В августе американские парламентарии обратились к FCC с просьбой добавить эти компании в список вендоров, продукция которых запрещена для сертификации FCC и которые не могут претендовать на американское федеральное финансирование. По словам законотворцев, китайские модули сотовой связи уже используются в американском медицинском оборудовании, транспорте и сельхозоборудовании — современные модели можно контролировать и отключать дистанционно, потенциально даже напрямую из Китая. ![]() Источник изображения: TheDigitalArtist/pixabay.com Fibocom ещё не прокомментировала новость. Quectel же заявила, что не имеет никакого доступа к данным пользователей после того, как модули связи поставлены, а удалённое управление устройствами возможно только с помощью платформ OEM-производителей, в которых эти модули используются. Дополнительно в компании сообщили, что проведёт аудит безопасности своих модулей у независимой компании Finite State. FCC направила письма ФБР, Министерству юстиции, АНБ и иным ведомствам с призывом к сотрудничеству. Допускается возможность включения оборудования Quectel и Fibocom в т.н. перечень Covered List, куда уже попали десять китайских и одна российская компания, включая Huawei, ZTE, Hytera, Hikvision и Dahua. В отдельном письме законотворцам FCC сообщила, что вопрос нуждается в дальнейшем изучении, подчеркнув, что может отозвать авторизацию только по указанию агентств, отвечающих за безопасность США. FCC уже приняла ряд мер для ограничения использования китайского оборудования в американских телекоммуникационных сетях. В частности, в прошлом году комиссия проголосовала за запрет деятельности в США китайского подразделения China Unicom в лице Pacific Networks и компании ComNet. В FCC подчёркивают, что обеспечивают все компании, принимающие решения о покупке на телеком-рынке, «чёткими сигналами» о безопасности тех или иных продуктов.
07.09.2023 [17:27], Руслан Авдеев
«Усилиями» Oracle обанкротился целый город в ВеликобританииБирмингемский городской совет, крупнейший в Европе местный орган власти, объявил о серьёзных финансовых проблемах. Как сообщает The Register, это случилось после того, как стоимость реализуемого здесь ERP-проекта Oracle выросла с £20 млн до £100 млн ($125,5 млн). При реализации проекта возникли задержки, отмечены перерасход средств и недостаточный контроль. Совет опубликовал уведомление в соответствии со Статьёй 114 — данный правовой инструмент применяется в Англии и Уэльсе для заявления о том, что организация не имеет достаточно средств для того, чтобы сбалансировать бюджет. В заявлении совета указывается, что помимо рабочих проблем, напрямую не связанных с IT, нынешнее критическое положение связано с большой нагрузкой, вызванной проблемами внедрения ERP-системы Oracle. Фактически речь идёт о банкротстве крупного города. Совет сделал запрос в Ассоциацию местного самоуправления для «дополнительной стратегической поддержки». ![]() Источник изображения: jgyuity1289/pixabay.com Ещё в мае совет заявил, что внедрение облачной системы ERP (Enterprise Resource Planning) Oracle, предназначенной для автоматизации рабочих и бизнес-процессов, будет вчетверо дороже, чем изначально ожидалось. В 2018 году в рамках проекта «Персонал и финансы» (Financial and People) было решено внедрить систему Oracle Fusion вместо продуктов SAP для управления финансами и HR. На тот момент уже возникли сложности с отслеживанием финансовых транзакций и кадровых ресурсов. План миграции неоднократно пересматривали, причём к 2022 году её стоимость почти удвоилась до £38,7 млн (около $48,5 млн). Ирония в том, что в 2021 году основатель и технический директор Oracle Ларри Эллисон (Larry Ellison) заявил, что Бирмингемский городской совет стал одним из успешных примеров миграции с SAP на Oracle Fusion. Ранее источник в совете сообщал, что облачная ERP-система Oracle Fusion плохо подходит для городского самоуправления, поскольку она ориентирована на использование производственными компаниями и торговыми организациями. Платформу SAP пришлось серьёзно дорабатывать для использования советом, и те же функции приходится воссоздавать и в решении Oracle.
07.09.2023 [17:05], Андрей Крупин
Beeline cloud расширит портфель облачных сервисов Kubernetes-платформой DeckhouseПоставщик IT-услуг и облачных сервисов Beeline cloud подписал соглашение о партнёрстве с компанией «Флант», разработчиком платформы для контейнеризации Deckhouse, основанной на Kubernetes и других Open Source-решениях. Результатом сотрудничества компаний станет включение Kubernetes-платформы Deckhouse в состав облачных решений и служб Beeline cloud. Отечественная разработка дополнит существующую услугу Cloud Managed Kubernetes. Deckhouse включает в себя платформу Kubernetes и дополнительные модули для автоматического масштабирования, мониторинга, балансировки трафика, безопасного доступа и других функций. Продукт зарегистрирован в едином реестре российского ПО в классе «Системы контейнеризации и контейнеры». Также в активе Deckhouse имеется международная сертификация на совместимость с оригинальными релизами Kubernetes от Cloud Native Computing Foundation (CNCF). ![]() Источник изображения: flant.ru/products/deckhouse Kubernetes-платформа Deckhouse соответствует большинству рекомендаций PCI Security Standards Council и всем рекомендациям Center for Internet Security (CIS). В настоящий момент продукт находится в стадии прохождения процедуры сертификации по требованиям ФСТЭК России.
07.09.2023 [15:46], Сергей Карасёв
«F+ tech-Марвел» объединила свои компании в IT-холдинг FplusГруппа «F+ tech-Марвел» сообщила об объединении всех своих структур в IT-холдинг под единым брендом Fplus. Ребрендинг, как утверждается, призван «обозначить масштабы и амбиции бизнеса». В состав холдинга вошли производитель программно-аппаратных решений для корпоративного сектора и государственного сегмента Fplus (ранее F+ tech и F+ imaging), логистический оператор «Fplus Логистика», производители потребительской электроники под собственными торговыми марками Fplus (ранее F+ и Accesstyle), дистрибутор IT-оборудования и ПО «Марвел-Дистрибуция», розничная сеть магазинов «Всёсмарт» и ряд других структур. ![]() Источник изображения: Fplus Говорится, что написание бренда Fplus латинскими буквами является, с одной стороны, отражением отраслевого стандарта, а с другой, не ограничивает возможность сотрудничать с партнёрами в других странах из-за языкового барьера. Кроме того, возможна русификация — «Фплюс». Логотип марки состоит из названия и четырехлучевого символа, в котором соединены образы Полярной звезды и компаса. Выбран также новый слоган — «Вместе мы в плюсе». Структуры холдинга развиваются самостоятельно, но в синергии друг с другом, сообщается в пресс-релизе. Fplus планирует расширять ассортимент продукции и развивать существующий бизнес. Отмечается, в частности, что сеть «Всёсмарт» до конца года вырастет до примерно 90 точек. Также будет значительно расширен ассортимент продуктов Fplus, включённых в российский реестр: до конца 2023 года в него войдут коммутаторы для ЦОД и новые корпоративные ноутбуки, а в начале следующего года — печатное оборудование. |
|