NVMe-oF: изменятся ли SSD под влиянием сетевых фабрик?

 
На правах рекламы

NVMe — Что мы имеем сейчас?

Расширение использования NVMe в инфраструктуре публичных и частных облаков способствовало постепенному переходу от архитектуры ЦОД с вертикальным масштабированием к так называемой коммодизации, то есть к использованию серийных, неспециализированных системам с горизонтальным масштабированием, что позволило реализовать новые парадигмы распределенных вычислений.

Дальнейшее развитие спецификаций и функций СХД с поддержкой NVMe™ подсветило проблемы, связанные с эффективностью, масштабируемостью и уровнем утилизации систем. Поиск решений для обозначенных выше проблем создал предпосылки для появления более новой технологии — NVMe-over-Fabrics или сокращённо NVMe-oF™. Давайте посмотрим на возможные последствия его появления для системных архитектур.

Текущие проблемы системной архитектуры

Наблюдая за миром вокруг нас, мы неизменно отмечаем увеличение объёмов создаваемых и потребляемых данных. Рост объёма данных и сопутствующее ему усложнение приложений ощутимо повышают значимость того, где, когда и как хранится и обрабатывается информация.

blog.westerndigital.com

blog.westerndigital.com

Традиционные IT-инфраструктуры в большинстве своем статичны. Они были разработаны для того, чтобы справляться с возникающими время от времени экстремальными рабочими нагрузками (необязательно возникающими на ежедневной основе). Инфраструктура таких систем всегда должна иметь определённый запас прочности и включать парк оборудования «на вырост». Однако такой подход обычно сводится к наращиванию всей инфраструктуры целиком: увеличение вычислительных мощностей приводит и к увеличению объёма хранилища и памяти, пропускной способности сети и т.д. в независимости от того, действительно ли это необходимо.

При таком подходе системы, разработанные в господствующей ранее парадигме вертикального масштабирования (scale up), часто остаются недозагруженными. Установленное оборудование не используется в полной мере, а некоторые системы и вовсе простаивают большую часть времени.

Эволюция архитектур

Современные системы с горизонтальным масштабированием (scale out) позволяют одновременно наращивать вычислительные мощности, объём памяти и хранилища. Виртуализированные системы позволили реализовать гибкое выделение и разделение ресурсов. Гиперконвергентные системы (HCI) сделали следующий шаг, позволив хранилищам стать общими и разделяемыми в рамках инфраструктуры (см. рис. 1). Впрочем, несмотря на повышение гибкости и адаптивности, этот подход не позволяет независимо масштабировать все ресурсы самой инфраструктуры.

Рис. 1 — Среды: традиционная, гиперконвергентная, на базе сетевой фабрики

Рис. 1 — Среды: традиционная, гиперконвергентная, на базе сетевой фабрики

Поэтому в процессе создания более эффективных архитектур, способных справиться с увеличением и объёма, и сложности данных, возникла потребность в более гибкой и масштабируемой инфраструктуре для данных. Как и ЦОД гиперскейлеров, облачные и корпоративные дата-центры завтрашнего дня должны обеспечивать независимое масштабирование каждого из трёх важных компонентов инфраструктуры: вычислительных мощностей, памяти и хранилища.

В чем важность сетевой фабрики?

Чтобы компоненты можно было масштабировать независимо друг от друга, вычислительные мощности, память и хранилище должны быть изолированы друг от друга и объединены посредством некоторой сети. Однако для обеспечения оптимальной производительности такая сеть, а точнее сетевая фабрика, должна быть как можно более незаметной, то есть не иметь больших накладных расходов, связанных, например, с транзитом данных или задержками на уровне протокола.

Для мира СХД понятие фабрики не является чем-то радикально новым. Давным-давно реализована поддержка работы SCSI поверх Ethernet и Fibre Channel, и такие сети хранения данных завоевали популярность благодаря высокой скорости работы и надёжности передачи данных.

Рис. 2 — Система с горизонтальным масштабированием в сравнении с компонуемой дезагрегированной инфраструктурой

Рис. 2 — Система с горизонтальным масштабированием в сравнении с компонуемой дезагрегированной инфраструктурой

Однако с помощью NVMe-oF новые дезагрегированные инфраструктуры позволяют отделить друг от друга и вычислительные ресурсы, и ресурсы хранения. Причём сохраняется как уровень производительности — скорость работы с хранилищем такая же, как и прямом подключении NVMe-накопителей, — так и совместный доступ к данным с высоким уровнем параллелизма.

Более того, использование сетевых фабрик в дезагрегированных инфраструктурах позволяет расширить возможности компонуемых систем, то есть таких, где можно легко задействовать любые необходимые аппаратные ресурсы посредством программной оркестрации, что упрощает (пере-)конфигурацию систем под конкретные задачи.

NVMe + сетевая фабрика — следующий шаг в эволюции NVMe-oF

Существует целый ряд конфигураций аппаратного оборудования и сетевых ресурсов, позволяющих создать систему на базе адаптируемой и гибкой дезагрегированной архитектуры с поддержкой независимого масштабирования, которая одновременно с этим обеспечивала бы высокую производительность.

Стандарт передачи данных NVMe — это протокол для общения не только между флеш-накопителем и контроллером хранения данных, но и, в сетевых фабриках, между хостом и контроллером хранения данных. Вопрос лишь в том, как это всё реализовать.

Один из способов — добавить возможность сетевого подключения непосредственно в устройства хранения (рис. 3). При прямом подсоединении к сетевой фабрике посредством PCIe, Ethernet или Infiniband NVMe-накопители могут поддерживать протоколы с низким уровнем задержки, что открывает дверь в мир новых, дезагрегированных систем. Впрочем, такой подход порождает несколько интересных технологических вопросов:

  1. Какие сетевые фабрики и протоколы выбрать?
  2. Как в этом случае будет выглядеть внешняя интеграция сетевых структур и SSD?
  3. Приведет ли это к расцвету контроллеров SSD со встроенной поддержкой подключения к сетевым фабрикам?
Рис. 3 — Подключение устройств хранения к сетевой структуре

Рис. 3 — Подключение устройств хранения к сетевой структуре

Рассматривая разные варианты контроллеров, мы должны оценить роль SSD в системе, учесть его возможности и особенности флеш-памяти. Следует ли, например, вывести на рынок SSD со встроенной поддержкой сетевого подключения? Если да, то каким образом будут распределяться обязанности по обработке сетевого трафика между SSD и сетевой фабрикой? Как это повлияет на программное обеспечения хоста, на защиту данных и на управление хранилищем?

Изучая эти вопросы, мы также должны уделить внимание повышению эффективности в рамках новой архитектуры, в частности, перебросу части задач с CPU на другие доступные вычислительные ядра. Наш подход к интеграции различных характеристик сетевых фабрик и ядер с устройствами хранения данных может стать отправной точкой для новой парадигмы вычислений с помощью NVMe-oF.

Примером реализации NVMe-oF является платформа хранения Western Digital OpenFlex Data24, которая позволяет полностью использовать пропускную способность NVMe SSD Ultrastar сразу несколькими вычислительными узлами, объединёнными в Ethernet-фабрику (NVMe-oF 1.0a) с низкими задержками.

Система в форм-факторе 2U включает до 24 NVMe SSD-накопителей Ultrastar DC SN840 ёмкостью до 368 Тбайт. Согласно проведенным Western Digital лабораторным тестам, производительность OpenFlex Data24 при установке шести сетевых адаптеров составляет около 13,2 млн IOPS, пропускная способность — 70,7 Гбайт/с, а задержка записи — всего 42 мкс.

OpenFlex Data24 совместима с Open Composable API и может быть реализована как часть компонуемой дезагрегированной инфраструктуры. Внедрение OpenFlex Data24 не влечёт за собой дополнительные расходы. Наоборот, Western Digital оценивает сокращение расходов на 17 % по сравнению с дисковыми полками с SAS-интерфейсом.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER. | Можете написать лучше? Мы всегда рады новым авторам.
Постоянный URL: https://servernews.ru/1042283
Система Orphus