Microsoft: использование открытой ОС SONiC снижает число отказов коммутаторов дата-центров

 

Сетевые коммутаторы реже выходят из строя при работе под управлением операционной системы SONiC с открытым исходным кодом в отличие от использования проприетарного программного обеспечения, утверждается в исследовании Microsoft.

Согласно исследованию, в рамках которого в течение трёх месяцев отслеживалась работа 180 тыс. коммутаторов в дата-центрах Microsoft Azure, лишь 2 % сетевых коммутаторов выходит из строя за это время, но их число сократится вдвое, если операционное программное обеспечение вендора заменить на ОС SONiC, разрабатываемую в рамках Open Compute Project.

В ходе исследования выяснилось, что больше сбоев связано с неполадками оборудования (32 % всех сбоев), а не с софтом (17 %). Незапланированное отключение электроэнергии вызвало 28 % всех сбоев. Сбои были обнаружены путём проверки каждого коммутатора в сети каждые шесть часов и запроса о его последней перезагрузке. Как оказалось, определить причину сбоя не так просто — то ли это связано с оборудованием, то ли с ПО. Поэтому если вендор устранял сбой с помощью исправления ПО, исследователи указывали в качестве причины проблемы с софтом.

Около трёх четвертей коммутаторов работают под управлением SONiC, и исследование показало, что у них больше шансов сохранить работоспособность в течение трёх месяцев, что почти вдвое снижает число отказов. «Со временем разрыв в надёжности увеличивается, и по прошествии трёх месяцев вероятность сохранения работоспособности коммутаторов на SONiC на 1 % выше, чем у коммутаторов на другом софте», — отмечено в исследовании.

Преимущество SONiC заключается в использовании гибкой модели программного обеспечения с открытым исходным кодом. «Мы приписываем устойчивость SONiC быстрому циклу разработки-тестирования-развёртывания, который стал возможен благодаря собственной разработке программного обеспечения, — говорится в отчёте. — Действительно, обновления и исправления программного обеспечения поставщиков выпускаются в течение более длительного периода времени (например, несколько месяцев). Это приводит к повторному возникновению известных проблем на устройствах, которые ещё не были устранены с помощью исправлений, предоставленных поставщиком. Напротив, отказы SONiC являются первопричиной и устраняются в короткие сроки благодаря внутреннему опыту и разработчикам».

Исследователи также указали, что из используемых Microsoft Azure коммутаторов трёх основных поставщиков, вероятность выхода из строя устройств одного из них значительно выше, чем у двух других вендоров. Вместе с тем, у всех коммутаторов показатели отказа были достаточно низкими, и Microsoft анонимизировала данные, поэтому неизвестно, у какого поставщика менее надёжное оборудование.

Ведущими производителями коммутаторов являются Cisco, Arista, Huawei, HPE и Juniper. Гиперскейлеры, такие как Microsoft, используют коммутаторы «white label», но Mellanox и Arista Networks в прошлом указывали Microsoft в качестве своего клиента. Операционная система SONiC работает на нескольких аппаратных платформах, включая Arista, Cisco, NVIDIA/Mellanox, Dell, Juniper и Nokia. У Microsoft давнее партнерство с Arista, которое включало разработку некоторых компонентов SONiC, поэтому Arista вполне может быть одним из вендоров, чьё оборудование попало в поле зрения исследователей.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER. | Можете написать лучше? Мы всегда рады новым авторам.

Источник:

Постоянный URL: https://servernews.ru/1039752

Комментарии

Система Orphus