Материалы по тегу: облако
24.06.2024 [16:41], Владимир Мироненко
Fujitsu представила новые инструменты для работы с моделями генеративного ИИ корпоративного классаFujitsu представила свою стратегию в области ИИ, в рамках которой она планирует уделять основное внимание не разработке генеративного ИИ (GenAI), а совершенствованию платформы, которая упростит предприятиям настройку своих собственных ИИ-решений, пишет DigiTimes. По словам японской компании, анонсированная в начале июня платформа Fujitsu GenAI Framework for enterprises предназначена для решения проблем, с которыми сталкиваются предприятия при применении генеративного ИИ, таких как сложность получения и обработки больших объёмов обучающих данных, неспособность удовлетворить разнообразные требования к стоимости и скорости обработки, а также потенциальный риск невыполнения требований законодательства или внутренних правил компаний. Эта платформа будет доступна клиентам по всему миру начиная с июля 2024 года в облаке Fujitsu Kozuchi. Как сообщается, Fujitsu включила в GenAI Framework for enterprises несколько ключевых технологий: Knowledge Graph Extended Retrieval-Augmented Generation (RAG), GenAI Amalgamation и GenAI Auditing. RAG — это широко используемый метод донастройки моделей GenAI для корпоративных приложений. Его недостатком является фрагментированное и несвязное обучение знаниям на больших объёмах данных. Например, модель может ссылаться на разные и несовместимые руководства по ремонту автомобилей или неправильно цитировать законодательные положения, путая смысл запрещённых и нерекомендуемых действий. Устранить этот недостаток поручено Fujitsu Knowledge Graph Extended RAG путём формирования графа знаний для контекстуализации обучающих данных. Как утверждает Fujitsu, Fujitsu Knowledge Graph Extended RAG позволяет сократить объём необходимых для обучения данных на четверть. Помимо повышения эффективность обучения, технология также обеспечивает мониторинг в реальном времени результатов работы. Она предлагает поддержку логических рассуждений, позволяя легко определить, применимы ли результаты. Модель может обрабатывать более 10 млн токенов, что позволяет ей учиться на больших объёмах сложных данных и генерировать высокоточные ответы. GenAI Amalgamation позволяет выбрать модель с наивысшей производительностью из нескольких специализированных моделей на основе входной задачи или автоматически объединяет несколько имеющихся моделей для выполнения запроса. Это позволяет пользователям легко адаптировать подходящие ИИ-модели GenAI, сокращая время, необходимое для настройки модели, и повышая эффективность работы. Наконец, технология аудита ИИ (GenAI Auditing) — первая в мире, по словам Fujitsu — позволяет объяснить, почему модель дала тот или иной ответ, что упростит её проверку на соответствие законодательству и правилам компании, а заодно позволит избавиться от галлюцинаций.
23.06.2024 [22:50], Владимир Мироненко
Облачный союз: Apple использует ИИ-инфраструктуру Google Cloud для Apple IntelligenceИИ-инфраструктура Apple Private Cloud Compute использует не только базовую ИИ-модель собственной разработки и серверы Apple для инференса, работающие на собственных чипах Apple, но и облако Google Cloud Compute, обратил внимание ресурс HPCWire. Сведения об ML-платформе Apple AXLearn указывают на гибридный подход к работе с ИИ, при котором Apple объединяет свои собственные серверы с возможностями Google Cloud, сообщил HPCwire, отметив, что новая инфраструктура является для Apple большим шагом вперёд. Например, Google и Microsoft, активно работают над развёртыванием ИИ ещё с конца 2022 года. Выпуск собственных систем знаменует возвращение Apple в сектор серверного оборудования после того, как в 2011 году она прекратила выпуск Xserve. Apple сообщила в своём блоге, что AXLearn использует фреймворк Google JAX и компилятор XLA и позволяет обучать модели с высокой эффективностью и масштабируемостью на различном оборудовании и облачных платформах, включая фирменные ИИ-ускорители Google TPU, а также облачные и локальные ускорители на базе GPU (конкретные модели не уточняются). У Apple есть две новые собственные ИИ-модели, одна из которых имеет 3 млрд параметров и используется для ИИ приложений на устройствах, а также более крупная LLM для запуска на серверах. Модели, разработанные с помощью фреймворка TensorFlow, созданного Google, были обучены на TPU Google. При этом AXLearn включает оркестратор, который пока работает только с Google Cloud. Впрочем, Apple оговаривается, что «теоретически его можно расширить для работы на платформах других облачных провайдеров». Инференс же выполняется исключительно на собственных серверах компании, причём для обработки запроса пользователя каждый раз создаётся новый временный инстанс, который безвозвратно удаляется вместе с данными после завершения задачи, а для передачи информации используется сквозное шифрование. Apple в рамках объявленного на WWDC 2024 сотрудничества c OpenAI интегрирует чат-бот ChatGPT в голосового помощника Siri, а также в другие инструменты iOS и остальных платформ. Поскольку существуют риски утечки данных на сторонней платформе, устройства Apple будут направлять запрос на разрешение пользователя отправлять данные в ChatGPT.
22.06.2024 [00:21], Владимир Мироненко
Oracle построит в Испании третий облачный регион и инвестирует $1 млрд в течение 10 летOracle объявила о планах инвестировать более $1 млрд в течение десяти лет в облачную и ИИ-инфраструктуру в Испании. Эти инвестиции позволят Oracle запустить в стране третий облачный регион, который будет размещён в Мадриде, пишет ресурс Data Center Dynamics. Впрочем, на фоне инвестиций других гиперскейлеров вложения Oracle довольно скромны. Новый регион позволит перенести нагрузки в облако Oracle Cloud Infrastructure (OCI) с соблюдением требований местного законодательства, включая Закон о цифровой операционной устойчивости ЕС (Digital Operational Resilience Act, DORA), и требований европейских надзорных органов, таких как Европейская служба банковского надзора (European Banking Authority, EBA), Европейское управление страхования и пенсионного обеспечения (European Insurance and Occupational Pensions Authority, EIOPA). Хостинг-партнёром запланированного облачного региона будет Telefónica España. Директор по эксплуатации, сети и ИТ Telefónica España заявил, что компания продолжает миграцию части своей критически важной инфраструктуры в облако Oracle, «чтобы быть более гибкими в предоставлении инновационных продуктов и услуг клиентам по всему миру». Первый облачный регион Oracle в Испании был открыт в 2022 году. Будущий облачный регион Oracle в Мадриде поможет организациям государственного и частного сектора страны перенести все типы рабочих нагрузок в облако, модернизировать свои приложения и внедрять инновации с использованием данных, аналитики и ИИ, говорит компания. Как отметил ресурс CIO News Southeast Asia, Oracle — единственный гиперскейлер, способный предоставлять технологии ИИ и полный набор из более чем 100 облачных сервисов в выделенных, публичных и гибридных облачных средах в любой точке мира. Ранее в этом месяце Microsoft открыла в Испании свой первый облачный регион Spain Central, который тоже размещён в Мадриде, и партнёром компании тоже стала Telefónica España. Регион был запущен в рамках проекта компании по цифровой трансформации государственного и коммерческого сегментов Испании стоимостью $2,1 млрд. После этого Microsoft объявила о намерении инвестировать €6,69 млрд ($7,16 млрд) в строительство новых ЦОД в Арагоне. Amazon намерена вложить в расширение своего облачного подразделения в Испании €15,7 млрд ($16,9 млрд). У Google также имеет облачный регион в этой стране, размещённый в Мадриде, который был открыт в мае 2022 года. В ноябре этого же года компания договорилась с немецким разработчиком энергетической инфраструктуры ib vogt о поставках энергии из возобновляемых источников для питания дата-центров и офисов на территории Испании.
21.06.2024 [09:31], Владимир Мироненко
HPE представила собственное решение для виртуализации и уверяет, что вовсе не собирается конкурировать с VMwareHPE представила собственное решение для виртуализации, которое, по словам главного операционного директора HPE по гибридному облаку Ханга Тана (Hang Tan), не несёт прямой угрозы решениям VMware. Он пояснил ресурсу The Register, что это было сделано вовсе не из-за конъюнктурных соображений, а в ответ на запросы клиентов. Решение HPE использует KVM на базе Ubuntu вместе с ПО для оркестрации в рамках платформы HPE Private Cloud. Как и другое ПО HPE Private Cloud, новое решение может работать в гибридной среде или автономно. После поглощения VMware в конце прошлого года Broadcom внесла изменения в порядок лицензирования, после чего многие клиенты стали жаловаться на рост затрат на использование её продуктов. И хотя Broadcom настаивает на том, что изменения также включали снижение цен на некоторые продукты и в целом несут выгоду клиентам, конкуренты VMware спешат воспользоваться создавшейся ситуацией и переманить недовольных новой политикой чипмейкера. Тан сообщил The Register, что появление виртуализации в HPE Private Cloud было естественным развитием гибридной стратегии, которую гендиректор Антонио Нери (Antonio Neri) продвигает на протяжении многих лет. Он отметил, что в рамках реализации стратегии HPE занялась контейнеризацией, управлением облачными данными и AIOps, в основном закрывая направления путём поглощения специализированных компаний. В конце концов HPE задалась вопросом, чего ещё не хватает для комплексного обслуживания клиентов. И ответом стала виртуализация. Так что объявление HPE о собственном продукте виртуализации в сложное для Broadcom время является исключительно совпадением. HPE по-прежнему предлагает продукты VMware, которые, по словам Тана, она рассматривает как дополнение к собственным предложениям HPE по виртуализации. Какими будут расценки на новое предложение HPE, пока не сообщается. По всей видимости, они станут известны во II половине 2024 года, когда новый продукт станет доступен в составе HPE Private Cloud Business Edition. Затем решение будет добавлено и в другие версии HPE Private Cloud.
20.06.2024 [20:53], Руслан Авдеев
Nubes заканчивает возведение в Москве своего второго ЦОД — StratoОсенью 2024 года облачный оператор Nubes (НУБЕС) намерен ввести в эксплуатацию новый дата-центр Nubes Strato. По данным пресс-службы компании, вычислительные ресурсы нового ЦОД предполагается использовать для развития облака NGcloud и собственных облачных сервисов. Часть стоек будет доступна клиентам, желающим применять гибридные решения. Защищённое, уже функционирующее облако NGcloud построено на базе первого дата-центра Nubes Alto уровня Tier III. На базе того же ЦОД базируются сервисы оператора, связанные с обеспечением информационной безопасности, решения для удалённой работы и хранения информации. Nubes Alto активно используется и клиентами, желающими разметить на его площадке собственное серверное оборудование и телекоммуникационные модули по колокейшн-схеме. Новый дата-центр на 198 стоек строится в Москве в районе м. Царицыно и поблизости от Nubes Alto, запущенного в 2022 году. Запуск Strato намечен на сентябрь 2024 года, пока же в помещениях объекта ведётся установка инженерной инфраструктуры. Ожидается, что скоро там же смонтируют источники бесперебойного и гарантированного электроснабжения. Пока ведётся строительство и монтаж, провайдер ЦОД занят закупками вычислительной техники и сетевого оборудования. В компании добавляют, что ЦОД строится и для масштабирования возможностей по предоставлению гибридных решений клиентам. Кроме того, появление Nubes Strato будет способствовать расширению облака NGcloud. Гибридная природа проекта позволит клиентам не только размещать на площадке собственное оборудование, но и интегрировать его с облаком компании.
20.06.2024 [17:32], Руслан Авдеев
Дата-центры, склады, роботы и ИИ: Amazon потратит ещё €10 млрд на развитие бизнеса в ГерманииAmazon потратит €10 млрд ($10,7 млрд) на обновление дата-центров и модернизацию логистической сети в Германии, передаёт Silicon Angle. Всего несколько недель назад облако Amazon Web Services (AWS) объявила о намерении потратить €7,8 млрд ($8,36 млрд) в той же Германии на суверенную облачную платформу AWS European Sovereign Cloud. Часть из €10 млрд Amazon потратит на найм ещё 4 тыс. сотрудников в центры обработки заказов в нескольких немецких городах, в результате чего общий штат сотрудников в Германии вырастет до более 40 тыс. человек. Amazon также управляет в Германии сетью из четырёх инжиниринговых центров — компания объявила о намерении расширить свой берлинский кампус. Целью является поддержка работ, связанных с робототехникой и ИИ. Другая часть инвестиций будет использована для «постройки, поддержки и обслуживания» кластера облачных дата-центров в районе Франкфурта. Сейчас франкфуртский облачный регион AWS включает три зоны доступности, изолированные друг от друга на физическом уровне, и две т.н. «локальные зоны», расположенные ближе к потребителям. Для AWS European Sovereign Cloud будет построен дата-центр в земле Бранденбург, он заработает к концу следующего года. Предполагается, что эти облачные мощности будут обслуживаться только персоналом из Евросоюза. Ранее компания уже сообщала о том, что метаданные пользователей из ЕС будут храниться на территории блока. Год назад схожий проект реализовала в регионе компания Oracle.
20.06.2024 [14:54], Владимир Мироненко
HPE и NVIDIA представили совместные решения для ускорения внедрения ИИHewlett Packard Enterprise (HPE) и NVIDIA представили платформу NVIDIA AI Computing by HPE — портфель совместно разработанных решений для ускорения внедрения генеративного ИИ. Ключевым в портфеле является предложение HPE Private Cloud AI. Как указано в пресс-релизе, это первое в своём роде комплексное решение, которое обеспечивает самую глубокую на сегодняшний день интеграцию вычислительных технологий, сетей и ПО NVIDIA с хранилищем, вычислительными ресурсами и облачной платформой HPE GreenLake. Решение предоставляет предприятиям любого размера возможность быстрой и эффективной разработки и развёртывания приложений генеративного ИИ. Решение HPE Private Cloud AI с новой функцией OpsRamp AI Copilot, которая позволяет повысить эффективность ИТ-операций и обработки рабочих нагрузок, включает в себя облачную среду самообслуживания с полным управлением жизненным циклом. Оно доступно в четырёх конфигурациях (Small, Medium, Large и Extra Large) для поддержки рабочих нагрузок ИИ различной сложности. HPE Private Cloud AI также поддерживает инференс, точную настройку моделей и их дообучение посредством RAG с использованием собственных данных. Решение сочетает в себе средства контроля конфиденциальности, безопасности, прозрачности и управления данными, в том числе средства ITOps и AIOps. AIOps использует машинное обучение и анализ данных для автоматизации и улучшения ИТ-операций. ITOps включает в себя ряд инструментов, обеспечивающих бесперебойное функционирование ИТ-инфраструктуры организации. Конфигурация HPE Private Cloud AI Small, предназначенная для инференса, включает от четырёх до восьми ускорителей NVIDIA L40S, до 248 Тбайт дискового пространства и 100GbE-подключение в стойке мощностью 8 кВт. Конфигурация Medium, предназначенная для инференса и RAG, включает до 16 ускорителей NVIDIA L40S, до 390 Тбайт дискового пространства и 200GbE-подключение в стойке мощностью 17,7 кВт. Конфигурации Large и Extra Large предлагают дополнительные возможности по обработке нагрузок ИИ и ML, а также тонкой настройке ИИ-модели. Конфигурация Large включает до 32 ускорителей NVIDIA H100 NVL, до 1,1 Пбайта дискового пространства и 400GbE-интерконнект в двух стойках мощностью 25 кВт каждая. В свою очередь, конфигурация Extra Large включает до 24 ускорителей NVIDIA GH200 NVL2, до 1,1 Пбайта дискового пространства и 800GbE-интeрконнект в двух стойках мощностью 25 кВт каждая. Стойки могут управляться клиентом самостоятельно или обслуживаться HPE. Каждая конфигурация может работать как автономное локальное решение ИИ или в составе гибридного облака. Используется программная платформа NVIDIA AI Enterprise, включающая микросервисы инференса NIM. Её дополняет ПО HPE AI Essentials. Кроме того, поддержку новых ускорителей NVIDIA получили три аппаратные платформы:
HPE также объявила, что её облачная платформа HPE GreenLake for File Storage прошла сертификацию Nvidia DGX BasePOD и валидацию хранилища NVIDIA OVX, HPE Private Cloud AI, а также анонсированное оборудование будут доступны этой осенью за исключением платформы Cray XD670 на базе NVIDIA H200 NVL, который поступит в продажу этим летом. А после станут доступны и решения на базе Blackwell.
19.06.2024 [11:16], Руслан Авдеев
ВМС США успешно подключили к облаку авианосец «Авраам Линкольн»Военно-морские силы США успешно реализовали пилотный проект, предусматривающий подключение военных кораблей к облачным сервисам. По данным Datacenter Dynamics, работоспособность концепции, предусматривающей передачу в облако терабайт данных ежедневно, изучили на примере авианосца «Авраам Линкольн». Облачный проект Flank Speed Edge с тысячами пользователей — это одно из расширений проекта Flank Speed, предусматривающего совместную работу в облаке многих представителей военного и государственного аппарата. Возможность масштабной передачи данных обеспечена спутниковыми сервисами Proliferated Low Earth Orbit (P-LEO). Находящиеся на низкой околоземной орбите спутники могут общаться в том числе и друг с другом. В ходе пилотного проекта ВМС организовали спутниковое соединение гигабитного класса — возможна передача 3–5 Тбайт данных ежедневно. Например, можно использовать IP-телефонию, передавать данные в целях обучения, для медицинских сервисов, снабжения. При этом отмечается, что в случае необходимости все эти сервисы могут быть отключены без потери функциональности корабля. Вся спутниковая инфраструктура вместе с набортной сетью Wi-Fi может управляться всего тремя моряками. Проект также позволяет обновлять бортовое ПО без необходимости захода в порт. Отмечается, что иногда высокоскоростные соединения необходимо отключать, поскольку P-LEO обеспечивает безопасную передачу только не особенно секретных данных. При этом инфраструктура разработана таким образом, что способна использовать многочисленные механизмы подключения, включая военную группировку SATCOM и Starlink. Дополнительно ВМС внедряют систему Flank Speed Edge на береговых объектах, испытывающих трудности с традиционными вариантами подключения, включая, например, штаб-квартиру Пятого флота США в Бахрейне. В ходе недавнего отчёта о доходах председатель Oracle Ларри Эллисон (Larry Ellison) поднял вопрос о возможности использования микро-ЦОД на кораблях и даже подводных лодках. По его словам, скоро компания сможет обеспечить работу полноценного облака Oracle Cloud всего на шести стойках половинной высоты, которые можно разместить где угодно — в том числе на подводных и надводных кораблях. По мнению Эллисона, такое не может предложить никакая другая компания. При этом все облака Oracle идентичны и поддерживают все сервисы Oracle, отличаясь только масштабом.
18.06.2024 [18:42], Руслан Авдеев
Microsoft инвестирует ещё €6,69 млрд в свои испанские дата-центрыОблачный гигант Microsoft намерен инвестировать €6,69 млрд ($7,16 млрд) в постройку в северо-восточном испанском регионе Арагон новых дата-центров. Reuters сообщает, что эта область Испании становится одним из ключевых вычислительных хабов на территории Европы. По данным региональных властей, американский инвестор подал заявку на получение разрешения на строительство дата-центров вблизи испанской Сарагосы — ранее о вероятном возведении новых ЦОД недалеко от города уже сообщали местные СМИ. Как сообщают представители местного самоуправления, реализация проекта растянется на 10 лет. Ранее Microsoft анонсировала инвестиции в ЦОД на $2,1 млрд., а на днях был запущен первый облачный регион Azure в Мадриде. Вероятно, Microsoft намерена угнаться за главным конкурентом — AWS, также имеющей планы на Арагон. Только в прошлом месяце облачное подразделение Amazon объявило о намерении вложить в строительство ЦОД в регионе €15,7 млрд в течение 10 лет. В AWS утверждают, что ЦОД компании будут полностью питаться за счёт возобновляемой энергии, благо в провинции постоянно дуют сильные ветры. Сарагоса считается пятым по величине городом Испании и давно стала крупным логистическим и транспортным хабом, удачно расположенным между Мадридом и Барселоной, крупнейшими городскими агломерациями страны. Кроме того, город находится в самом центре коридора, связывающего Пиренейский полуостров с Францией и другими странами Европы. По прогнозам IDC, новая облачная и ИИ-инфраструктура в Испании пополнит ВВП страны на €10,7 млрд и будет способствовать появлению 77 тыс. новых рабочих мест в 2024–2030 гг.
17.06.2024 [22:49], Илья Коваль
Три квантовых компьютера, NVIDIA DGX Quantum, немножко HPC и облако: в Израиле открыт уникальный центр квантовых вычислений IQCC
aws
gh200
grace
hardware
hpc
nvidia
quantum machines
израиль
квантовые вычисления
квантовый компьютер
облако
разработка
Стартап Quantum Machines, разработчик систем управления квантовыми компьютерами, открыл Израильский центр квантовых вычислений (Israeli Quantum Computing Center, IQCC). Площадка, создание которой было частично профинансировано правительством страны, располагается в Тель-Авивском университете. По словам основателей, это первый в мире центр, располагающий квантовыми компьютерами разных типов, которые интегрированы с системой NVIDIA DGX Quantum, HPC-инфраструктурой и облаком. Приоритетный доступ со скидкой получат исследовательские организации Израиля, но в целом центр будет открыт для компаний со всего света. Как говорят создатели, IQCC — это лучший в мире полигон для создания новых технологий в области квантовых вычислений, а открытая архитектура площадки позволяет регулярно проводить обновления и упрощает дальнейшее масштабирование возможностей и вычислительных мощностей. Сейчас в IQCC установлены 21-кубитный компьютер Galilee от Quantware на сверхпроводящих кубитах (ещё один такой же используется в качестве тестовой платформы) и фотонный компьютер Negev от ORCA (8 кумод). Системы управляются контроллерами OPX1000 от самой Quantum Machines. HPC-инфраструктура представлена DGX A100, четырьмя GH200 и 128 vCPU на базе AMD EPYC 9334 (Genoa). Дополнительные ресурсы можно арендовать в облаке AWS. Для Galilee и Negev доступна интеграция с DGX Quantum, платформой для гибридных квантово-классических вычислений, которая была создана NVIDIA и Quantum Machines и впервые в мире развёрнута именно в IQCC. Управлять компьютерами и разрабатывать ПО можно с использованием Qiskit, QUA, OpenQASM3, QBridge, а также Classiq. К системе организован облачный доступ. В ближайшие месяцы в IQCC будут развёрнуты ещё несколько квантовых компьютеров и QPU. |
|