Материалы по тегу: сбой
|
14.07.2025 [16:29], Руслан Авдеев
Горячая пора: изменение климата угрожает стабильности работы дата-центровСотня ведущих мировых хабов ЦОД может пострадать от глобального потепления, поскольку растущие требования к охлаждению увеличивают стоимость эксплуатации и потребление воды. Более того, отключения оборудования из-за перегрева будут происходить всё чаще, сообщает The Register со ссылкой на данные Verisk Maplecroft. Компания, занимающаяся анализом рисков, способных повлиять на мировые бизнесы и инвесторов, выпустила доклад, посвящённый проблеме возможного перегрева ЦОД в будущем. Дело в том, что значительные части Европы страдают от рекордной жары. Впрочем, выводы касаются в первую очередь конца десятилетия и более позднего периода. Компания отмечает, что ЦОД обычно комплектуются резервными источниками питания вроде генераторов для обеспечения энергией в случае отключения магистральных линий электропередачи. При этом водоснабжение и энергоэффективность регулярно повышаются. Тем не менее, эксперты пришли к выводу, что надёжность многих дата-центров может оказаться под вопросом в период температурных скачков и роста спроса на ИИ-сервисы, хранилища данных и облачные вычисления.
Источник изображения: Maplecroft В Maplecroft утверждают, что для 56 из 100 ведущих хабов ЦОД характерен «высокий» или «очень высокий» риск по индексу Cooling Degree Days (CDD), который отражает частоту и интенсивность превышения температурных порогов, требующих активного охлаждения строений. При наихудшем сценарии SSP585 от CMIP6, предполагающем высокие выбросы парниковых газов, проблемы коснутся 68 хабов к 2040 году, и до 80 — к 2080 году. В любом случае, ¾ мировых ЦОД будут требовать всё большего охлаждения на более длительные сроки каждый год, в результате это приведёт к повышению затрат воды и электроэнергии. 100 ключевых хабов ЦОД в 2030–2080 гг. столкнутся с увеличением на 83 % количества дней, когда будет требоваться активное охлаждение. Maplecroft также отмечает, что спрос на электроэнергию со стороны дата-центров уже становится проблемой в некоторых странах и регионах мира вроде США, Ирландии и Сингапура. Кроме того, средний дата-центр, по данным исследования, использует около 1,4 тыс. м3 воды в день, и расход будет только расти по мере роста температур. Прогнозируется, что 52 % крупнейших хаба ЦОД к 2030 году будут в зонах с ограниченным доступом к питьевой воде, поэтому её нехватка может стать серьёзной косвенной угрозой для компаний, пользующихся такими дата-центрами.
Источник изображения: Maplecroft На ЦОД, по данным Международного энергетического агентства (IEA), уже приходится около 1,5 % мирового спроса на электричество, но к 2030 году этот показатель, вероятно, вырастет вдвое, до 3 %. 40 % этой энергии, по словам Maplecroft сегодня, тратится системами охлаждения, но и этот показатель должен вырасти по мере развития глобального потепления. В целом, в будущем меняющийся климат будет всё больше влиять на стареющие сети энергоснабжения и дата-центры, даже находящиеся на рынках с «низким» уровнем риска. Прогнозирование того, где именно такие риски будут максимальными — стратегическая проблема для всех мировых организаций, выступающих операторами или пользователями ЦОД. Как заявляют в Maplecroft, дата-центры теперь формируют «цифровой костяк» бизнеса, поэтому необходимо понимать и предвидеть все риски, способные повлиять на надёжность работы оборудования. Это особенно важно в свете инициатив, продвигаемых на высшем государственном уровне. Так, в июне сообщалось, что Евросоюз ограничит использование воды дата-центрами в рамках плана по повышению устойчивости всего блока к засухам и улучшению качества воды.
10.07.2025 [08:42], Руслан Авдеев
Суд: почта Великобритании и Fujitsu «должны были знать» о дефектах IT-системы Horizon, сломавших сотни жизнейПредварительные результаты расследования сбоев системы Horizon почтовой службы Великобритании (Royal Mail), показали, что и руководство почты, и Fujitsu с ICL, которые и разработали Horizon, знали или должны были знать о дефектах и ошибках в ПО, сообщает The Register. Из-за сбоев в бухгалтерской отчётности Horizon пострадали сотни сотрудников почтовых отделений. Многие получили штрафы, некоторые отправились в тюрьму, а ещё 13 человек, по-видимому, совершили суицид из-за неправомерных обвинений. Королевская почта Великобритании начала внедрять IT-систему Horizon в 1990-е годы. Разработанное компанией ICL (позже поглощённой Fujitsu) программное обеспечение допускало ошибки, из-за которых в 1999–2015 гг. 736 сотрудников почтовых отделений были несправедливо обвинены в мошенничестве и осуждены. Причём с выпуском обновлений ПО ситуация лучше не становилась. В 2021 году было начато официальное расследование, а теперь опубликован первый отчёт, посвящённый пострадавшим и компенсациям. По словам судьи сэра Вина Уильямса (Wyn Williams), который возглавляет расследование, ряд высокопоставленных сотрудников почты и их коллеги более низкого ранга знали или, по крайней мере, должны были знать, что версия ПО Legacy Horizon допускает ошибки. Тем не менее, почта продолжала делать вид, что её данные всегда точны. Обновление Horizon Online тоже иногда страдало от ошибок и сбоев, приводивших к отображению «иллюзорных» данных. По словам Уильямса, он убеждён, что многие сотрудники почтовой службы и Fujitsu знали об этом. Обе стороны неоднократно пытались переложить вину друг на друга. Так, Fujitsu заявила, что неоднократно предупреждала Почту Великобритании о проблемах с Horizon. Предполагалось, что новое поколение системы Horizon HNG-A будет более надёжным, чем предыдущие версии. Однако с учётом показаний пользователей этой системы и сотрудников самой Fujitsu говорить об этом уже нельзя. По словам Уильямса, в 2000–2013 гг. неоднократно возбуждались уголовные дела в отношении начальников и других сотрудников почтовых отделений, основанные на бухгалтерских отчётах из системы Horizon. Практически в каждом деле почтовая служба и/или органы правопорядка прямо или косвенно утверждали, что полученные из Horizon данные полностью достоверны. В результате сотни людей понесли уголовную ответственность за несуществующие убытки и недостачи. Несмотря на многолетние разбирательства, многие требования о компенсациях всё ещё не удовлетворены. В феврале 2025 года сообщалось, что Великобритания не может определить объём компенсаций за сбои в ПО Horizon. Уильямс подверг критике работу почты и правительства, а также «вопиющие задержки». Пока опубликован лишь первый том расследования. Второй том, посвящённый причинам трагедии, должен появиться в 2026 году.
02.07.2025 [19:41], Руслан Авдеев
Великобритания обновит закон 1885 года для обеспечения защиты подводных кабелейВеликобритания опубликовала доклад Strategic Defence Review, в котором предлагается новый законопроект, призванный обеспечить защиту от кибепреступлений и атак на подводные кабели государственного масштаба. В правительстве отмечают наличие пробелов в законодательстве — закон о подводном телеграфе 1885 года (Submarine Telegraph Act 1885), предполагающий штрафы до £1 тыс., похоже «не соответствует современным рискам», сообщает The Register. Власти считают, что законотворчество должно соблюдать баланс между «гражданским» и «военным» подходами, но пока непонятно, как следует реагировать на акты подводного саботажа на кабелях. Существующее законодательство хорошо работает в условиях мира и в условиях открытого конфликта, но бесполезно в «серой зоне», т.е. при враждебных действиях, не подпадающих под определение вооружённого конфликта. Поэтому возможную реакцию Великобритании планируют доработать. По словам представителей британского правительства, закон 1885 года в 1982 году уже скорректировали, увеличив штраф с £100 до £1 тыс. Можно было бы увеличить его размер и до £5 тыс. с помощью подзаконных актов, но это вряд ли отвечает требованиям момента. Департамент науки, инноваций и технологий и Министерство обороны Великобритании, вероятно, будут совместно работать над законопроектом. И это может занять больше времени, чем просто «возня со штрафами».
Источник изображения: Jonny Gios/unsplash.com В январе 2025 года шведские власти арестовали грузовое судно, заподозренное в совершении диверсии после повреждения телеком-кабеля. Также в начале года была повреждена финско-эстонский подводный электрокабель Estlink 2 и кабели C-Lion1 и BCS East-West Interlink. В итоге Швеция выделила три корабля и самолёт для защиты подводных кабелей на Балтике. Великобритания же пока не готова противостоять подобным угрозам, хотя и приобрела в 2023 году специальное судно для защиты подводных кабелей, из-за чего даже пришлось отложить строительство королевской яхты. В июне британский институт изучения рисков, связанных с Китаем (China Strategic Risks Institute (CSRI), рассмотрел 12 инцидентов с января 2021 по апрель 2025 года, в которых власти усмотрели возможные диверсии. В десяти случаях суда были идентифицированы, восемь из них якобы имели связь с недружественными государстами — либо через регистрацию под флагами этих стран, либо через принадлежность компаниям с их капиталом. Утверждается, что это якобы может указывать на причастность государств в организации данных инцидентов.
18.06.2025 [18:18], Руслан Авдеев
Дата-центры несут угрозу электросетям США из-за своей непредсказуемостиАмериканский регулятор North American Electric Reliability Corp. (NERC), отвечающий за надзор за электросетями и сопутствующей инфраструктурой в США, заявил, что подключение к сетям ЦОД в настоящее время весьма рискованно. Речь идёт об одной из самых серьёзных угроз надёжности сетей в краткосрочной перспективе, сообщает Bloomberg. Растущие кампусы ЦОД, занимающиеся майнингом криптовалют и ИИ-вычислениями, развиваются значительно быстрее, чем электростанции и линии электропередач, необходимые для обеспечения таких объектов электроэнергией. В результате, как заявляется в отчёте NERC, такая ситуация может привести к нарушению стабильности энергосистемы в целом. В первую очередь это связано с тем, что дата-центрам необходимо огромное количество энергии в непредсказуемые интервалы времени. Кроме того, они очень чувствительны к перепадам напряжения, что делает их главным, плохо прогнозируемым фактором влияния на энергосистемы. Они попросту не готовы к такому режиму использования. Как заявляют в NERC, в мировой «столице» ЦОД, регионе Северная Вирджиния, в июле 2024 года разом отключились дата-центры общей мощностью около 1,5 ГВт. В феврале текущего года из-за проблем с напряжением ситуация снова повторилась, затронув уже 1,8 ГВт мощностей. Считается, что отключения подобных масштабов могут иметь «волновой» эффект, распространяющийся на всю энергосеть страны. В отчёте NERC утверждается, что отключения нагрузки подобного масштаба сопоставимы с неожиданным включением в сеть крупной атомной электростанции. В результате из-за излишков энергии создаётся гигантский дисбаланс.
Источник изображения: Matt Richmond/unsplash.com Расследование NERC показало, что в случае серии коротких сбоев в течение небольшого периода времени дата-центры не переключаются обратно на основную энергосеть — это приходится делать вручную, причём ЦОД в этом время часами питаются от резервных источников. Пока что такие резкие перепады не привели к катастрофам, но операторам энергосетей пришлось принимать меры для сокращения подачи электричества в сеть. Более того, в будущем подобные проблемы, вероятно, станут более распространёнными, поскольку спрос на электричество для ЦОД в Вирджинии только растёт. Регулятор утверждает, что необходимо срочно найти способ максимально безболезненно интегрировать дата-центры в электросети. США всё ещё находятся на ранней стадии бума ИИ, который в Вашингтоне считают необходимым для обеспечения национальной безопасности. В NERC заявили о необходимости разработки моделей, позволяющих лучше понять, как именно ЦОД используют электричество. Регулятор пришёл к выводу, что полезнее всего для обеспечения стабильности сетей будет применение аккумуляторных хранилищ. В конце прошлого года сообщалось, что в 2028 году на дата-центры США может прийтись уже 12 % энергопотребления всей страны. По данным Международного энергетического агентства (IEA), в мировом масштабе энергопотребление ЦОД к 2030 году вырастет более чем вдвое, а из-за ИИ придётся сжигать больше угля и газа.
14.06.2025 [18:41], Руслан Авдеев
Тайвань отправил в тюрьму капитана китайского судна, обвинив его в умышленном повреждении подводного кабеляГражданина материкового Китая, капитана зарегистрированного в Того судна Hong Tai 58, приговорили к трём годам заключения по обвинению в намеренном повреждении подводного кабеля, связывающего главный тайваньский остров с островом Пэнху (Penghu) в Тайваньском проливе, сообщает BBC. Вынесенный в минувший четверг приговор тайваньского суда стал первым, связанным с повреждениями тайваньских кабелей в последние годы. Тайвань обвинил материковый Китай в диверсиях в отношении своих кабелей. В КНР отрицают причастность, называя случаи повреждения «обычными морскими авариями», а Тайвань обвиняют в преувеличении значения инцидентов. Действительно, согласно международной статистике, ежегодно регистрируется порядка 150–200 обрывов или сбоев подводных кабельных систем по всему миру. На Тайване в сумме приходится 10 подводных кабелей для внутренней связи и 14 международных. Инцидент произошёл в феврале 2025 года, когда тайваньская береговая охрана обнаружила, что Hong Tai 58 уже несколько дней крутится на одном месте у южного побережья острова, и несколько раз предупредила его экипаж о необходимости покинуть территорию. Через несколько минут после ухода судна стало ясно, что кабель в акватории повреждён. Инцидент, нарушивший связь с островом Пэнху, по данным суда, серьёзно помешал деятельности «правительства и общества» острова, а «ущерб огромен». Береговая охрана сопроводила Hong Tai 58 в тайваньский порт, а экипаж из восьми граждан КНР задержали. Обвинение предъявили лишь капитану, остальных выслали на материковый Китай. Хотя капитан изначально отрицал повреждение кабеля, на суде он всё же заявил, что «мог повредить его». По словам осуждённого, неспокойное море осложняло навигацию, поэтому он приказал бросить якорь, не зная, что в этом месте пролегают подводные кабели. Сторона обвинения утверждала, что инфраструктура была повреждена намеренно, поскольку на судне оказались карты с точным местоположением повреждённого кабеля. Прокуратура заявила, что судно было «крайне подозрительным» сразу по нескольким параметрам. Корабль имел несколько названий, а капитан отказался назвать имя владельца, личность которого неизвестна до сих пор. Само судно находится в неудовлетворительном состоянии, за последний год оно выполнило лишь один официальный рейс, но тем не менее постоянно околачивалось в Тайваньском проливе. Более того, со слов береговой охраны, суда обычно кружат вокруг собственного якоря, тогда как Hong Tai 58 тянуло его по дну, двигаясь в районе пролегания кабеля зигзагом. С другой стороны, записи телефонных разговоров капитана не содержат свидетельств его связи с китайскими властями или спецслужбами.
Источник изображения: Irene Ying/unsplash.com Hong Tai 58 входит в число 52 кораблей, за которыми Тайвань внимательно следит в связи с подозрительной деятельностью. Впрочем, инциденты с китайским коммерческим флотом случаются не только рядом с островом. Как сообщают тайваньские власти, всего с 2019 по 2023 годы зафиксировано 36 случаев повреждения местных подводных кабелей внешними силами — остров всё больше опасается диверсий, особенно со стороны Китая. В январе китайское судно обвинили в повреждении кабеля у северного побережья Тайваня. Тогда капитан опроверг обвинения, а позже причиной был официально назван естественный износ. В ноябре 2024 года китайское судно обвинили в обрыве двух кабелей в Балтийском море, но расследование, проведённое шведскими властями, выявило только низкую квалификацию экипажа. Впрочем, расследование ещё не окончено. Как сообщает Datacenter Dynamics, повреждение кабелей часто называю «тактикой серой зоны». Тем не менее, многие инциденты действительно случайны. Декабрьские повреждение четырёх подводных кабелей в Балтийском море, по данным европейских и американских спецслужб, вероятно, произошло случайно, хотя изначально были подозрение в диверсии.
08.06.2025 [22:46], Руслан Авдеев
Австралийские военные по ошибке «положили» Wi-Fi и радио на побережье Новой ЗеландииАвстралийский военный корабль обвинили в отключении интернета в некоторых частях региона Таранаки (Taranaki) в Новой Зеландии. Инцидент имел место на прошлой неделе — жалобы от местных провайдеров поступили рано утром в среду (по местному времени), сообщает Datacenter Dynamics. Крупнейший корабль австралийских ВМС HMAS Canberra следовал вдоль новозеландского побережья в направлении Веллингтона (Wellington, Новая Зеландия). По официальной версии, навигационный радар вызвал сбои в работе Wi-Fi в Таранаки, а также Марлборо (Marlborough). После того, как на корабле узнали о проблеме, HMAS Canberra изменил частоты оборудования, устранив помехи.
Источник изображения: Royal Australian Navy От неожиданного «нападения» пострадали несколько интернет-провайдеров региона, включая местную компанию Primo. По словам её владельца Мэтью Харрисона (Matthew Harrison), радар вывел из строя немало 5-ГГц радиосетей в некоторых частях Новой Зеландии. Как заявил Харрисон, с двух часов ночи в сети Primo начались перебои из-за срабатывания механизма DFS (Dynamic Frequency Selection), автоматически отключающего точки доступа при обнаружении сигналов радаров во избежание помех для критически важных систем, включая систему морской радиолокации. Речь шла именно о полноразмерном военном радаре, работа которого и инициировала встроенные в оборудование протоколы безопасности, отключавшие Wi-Fi по мере продвижения корабля вдоль побережья. В Primo указывают, что ничего похожего ранее не видели. Пострадали и прочие компании в регионе, включая Inspire Net Ltd и TPNet NZ. Также была нарушена и работа радиостанции BrianFM, расположенная в городке Бленем (Blenheim) на Южном острове Новой Зеландии — ей пришлось перейти на резервную систему вещания, чтобы не прекращать трансляцию.
29.05.2025 [13:18], Руслан Авдеев
Перегрев, протечки и нестабильность затормозили массовый выпуск NVIDIA GB200 NVL72, но теперь все проблемы решеныПоставщики ИИ-серверов на базе NVIDIA GB200 NVL72, включая Dell, Foxconn, Inventec и Wistron, увеличили выпуск серверов. Для этого им пришлось решить ряд технических проблем, которые ранее привели к задержкам поставок продуктов клиентам, сообщает The Financial Times. Компании совершили «серии прорывов», что позволило им начать своевременные поставки серверов GB200 NVL72. Как сообщил один из инженеров неназванного производственного партнёра NVIDIA, внутренние тесты выявили «проблемы с подключением» в серверах, но поставщики организовали совместную работу с NVIDIA, и вопрос был решён два или три месяца назад. Впрочем, это не первая проблема с чипами семейства Blackwell. В конце 2024 года стало известно о перегреве суперускорителей NVL72. По слухам, разработчику чипов пришлось просить производителей внести немало изменений в эталонный вариант стоек, чтобы решить проблему. Также поступала информация о проблемах межчипового интерконнекта, программных багах и протечках охлаждающих жидкостей. В результате поставщикам пришлось увеличить число протоколов проверки — оборудование стали тестировать намного внимательнее перед поставками клиентам. При этом производителям уже нужно готовиться к выпуску систем на базе GB300. NVIDIA GB300 NVL72 всё так же использует полностью жидкостное охлаждение. Суперускоритель оснащён 72 чипами Blackwell Ultra и 36 процессорами Grace. В продажу решение должно поступить в III квартале 2025 года.
Источник изображения: NVIDIA Впрочем, как сообщают журналисты, чтобы ускорить внедрение GB300-серверов, NVIDIA отказалась от более совершенного дизайна платы Cordelia позволявшего заменять отдельные компоненты, в пользу текущей версии Bianca, применяемой для GB200. Это решение может усложнить ремонт, но ускорит развёртывание систем. По словам трёх источников, знакомых с вопросом, NVIDIA сообщила поставщикам, что намерена перейти дизайн Cordelia в следующем поколении ИИ-продуктов.
24.05.2025 [22:04], Руслан Авдеев
Пожар в орегонском ЦОД Digital Realty привёл к масштабному сбою X (Twitter)В минувший четверг в дата-центре Digital Realty PDX11 в технопарке Хиллсборо (Hillsboro) в Орегоне произошёл пожар, который привёл к сбоям в социальной сети X (Twitter) Илона Маска (Elon Musk), которая является одним из арендаторов ЦОД. По предварительным данным, возгорание произошло в помещении, где находились аккумуляторы резервного питания, сообщает Wired. Персонал эвакуировали. На устранение инцидента у пожарных ушло несколько часов, но, к счастью, никто не пострадал. По словам местных пожарных, пожар начался в помещении, заполненном (предположительно) литий-ионными аккумуляторами. Хотя такие аккумуляторы распространены в современных ЦОД, именно они нередко и становятся причиной возгораний. Малейшая ошибка в контрле температуры, обслуживании или установке способна привести к неконтролируемому перегреву и возгораниям. Хотя пламя не распространилось за пределы аккумуляторного зала, дым был достаточно густым, чтобы вызвать обеспокоенность. Digital Realty не стала уточнять, кто именно является арендатором её ЦОД. Представители X тоже отказались от комментариев. Впрочем, как сообщает Datacenter Dynamics, с 23 мая в течение нескольких суток в работе X наблюдаются сбои разного масштаба. В официальном аккаунте компания сообщается, что она знает о проблемах и работает над их устранением.
Источник изображения: raquel raclette/unsplash.com До покупки Маском в 2022 году социальная сеть использовала в США три ЦОД: в Сакраменто, Портленде и Атланте. В случае отказа одного дата-центра трафик можно было перенаправить на другие. В конце 2022 года Маск принял неоднозначные меры по сокращению расходов и закрыл площадку в Сакраменто. В результате всего через несколько дней случился крупный сбой, доказавший, что система стала хрупкой — компания поспешила перенести нагрузки в Портленд и Атланту. В итоге дата-центр NTT GDC в Сакраменто достался Tesla. Кроме того, Маск какое-то время отказывался оплачивать услуги облаков Google и Oracle, а поставщик серверов Wiwynn подал к X иск за неоплату счетов и несоблюдение условий контракта. Пожары в дата-центрах — явление не такое уж уникальное. В сентябре 2024 года Alibaba Cloud пострадала от пожара в ЦОД в Сингапуре, от большого пожара в своём время пострадал ЦОД OVHCloud в Страсбурге. Один из крупнейших в истории индустрии инцидентов тоже оказался связан с Li-Ion аккумуляторами, безопасность которых вызывает всё больше вопросов. Основными же причинами отключений ЦОД по-прежнему являются человеческие ошибки и сбои в электроснабжении.
12.05.2025 [16:20], Руслан Авдеев
Сотрудник ЦОД пустил китаянку в серверные Deutsche Bank, но уволили в итоге… осведомителяОдин из бывших менеджеров британской компании Computacenter, управляющей компьютерными системами Deutsche Bank в Нью-Йорке, подал иск в суд на бывшего работодателя и причастных лиц. Он утверждает, что сообщил о несанкционированном доступе к серверным Deutsche Bank, но вместо благодарности его неожиданно уволили, свидетельствует The Register. Между компаниями заключён контракт на поставку IT-услуг на сумму более $50 млн. На серверах хранятся миллионы конфиденциальных записей, в том числе о транзакциях сотен тысяч клиентов. В июле 2023 года Джеймс Папа (James Papa), выступавший сервис-менеджером Computacenter, был уволен после того, как сообщил руководству о том, что его коллега неоднократно допускал свою подругу-китаянку по имени Дженни к серверным помещениям без официального разрешения. Более того, он позволял ей пользоваться ноутбуком, подключенным к сети Deutsche Bank, и своей учётной записью. Папа подал иск, в котором фигурируют Computacenter, Deutsche Bank и один из топ-менеджеров последнего. Он обвиняет стороны в незаконном увольнении. По словам истца, записи с камер видеонаблюдения свидетельствуют о том, что служба безопасности банка впускала женщину в серверную без официального разрешения в нарушение всех протоколов. Более того, визиты повторялись с марта по июнь 2023 года и продолжались даже после того, как Папа приказал сотруднику прекратить подобное. Истец уверяет, что женщина обладала «значительными компьютерными знаниями», поэтому он доложил руководству об инциденте безопасности и посоветовал сообщить о происшествии в Комиссию по ценным бумагам и биржам США (SEC).
Источник изображения: Patrick Amoy/unsplash.com Вместо этого, как утверждает истец, его вызвали на встречу с юристами Computacenter и Deutsche Bank, а также представителями службы безопасности финансовой организации, где провели довольно агрессивный допрос, причём давление только усиливалось, когда он указывал на очевидные недостатки системы безопасности. После одной из таких встреч менеджера отстранили от работы, а вскоре уволили. Папа предполагает, что причина именно в том, что он привлёк внимание к недостаткам в системе безопасности. Также истец утверждает, что SEC так и не уведомили об инцидентах, что является обязательным в таких случаях. По словам юриста истца, его просто сделали «козлом отпущения», переложив вину за нарушения сотрудника. Уже после увольнения истец выяснил, что обе компании отслеживали деятельность женщины по камерам, в том числе то, как она касается серверов банка, но так и не установили ни её личности, ни чем она занималась. В результате инцидента уволили только его. В иске Папа утверждается, что обе компании и вице-президент Deutsche Bank нарушили законы Нью-Йорка о защите информаторов и проявили халатность. Теперь Папа требует $20 млн компенсации «эмоционального, физического и денежного ущерба».
12.05.2025 [08:48], Владимир Мироненко
Uptime Institute: человеческие ошибки и сбои в электроснабжении — причина большинства отключений ЦОДПредотвращение перебоев в работе остаётся стратегическим приоритетом для владельцев и операторов ЦОД. Хотя инфраструктурное оборудование улучшилось, сложность современных архитектур и развивающиеся внешние угрозы представляют новые риски, которыми операторы должны активно управлять, отмечено в исследовании Annual outage analysis 2025 организации Uptime Institute, в котором использовались данные опросов участников отрасли ЦОД в 2024–2025 гг. Согласно исследованию, четвёртый год подряд увеличивается время безотказной работы объектов — общая частота сбоев в работе и общий уровень заявленной серьёзности инцидентов продолжают снижаться. Однако количество кибератак растёт, что часто приводит к серьёзным и долговременным последствиям. По данным исследования Uptime Institute Global Data Center Survey 2024, около 53 % операторов ЦОД сообщили о случаях аварийного отключения за последние три года, что продолжает тенденцию снижения показателя по сравнению с предыдущими годами — 60 % сообщений о сбоях в 2022 году, 69 % в 2021 году и 78 % в 2020 году. Но в 2024 году падение замедлилось, сократившись по сравнению с 55 % в 2023 году на 2 п.п. Как сообщается, замедление темпов улучшения не означает самоуспокоенность компаний. В данном случае операторы сталкиваются с растущими внешними рисками, которые в значительной степени находятся вне их контроля, включая ограничения в работе энергосистем, экстремальные погодные условия, сбои в работе сетевых провайдеров и проблемы с ПО сторонних производителей. Также исследователи отметили признаки снижения интенсивности перебоев в работе. Только 9 % зарегистрированных инцидентов в 2024 году были классифицированы как серьёзные — самый низкий уровень с точки зрения времени безотказной работы на сегодняшний день. По мнению аналитиков, это свидетельствуют о том, что текущие инвестиции отрасли в обеспечение безопасности — за счёт резервирования, совершенствования процессов и соблюдения производственной дисциплины — дают ощутимый эффект. В 2024 году выросло количество отключений из-за проблем с ИТ и сетями, составив в общей сложности 23 % от общего числа серьёзных перебоев. Этот рост, вероятно, вызван усложнением IT-инфраструктур и сетей, что приводит к проблемам с управлением изменениями и неправильной конфигурацией. За девять лет мониторинга Uptime общедоступных сообщений о сбоях на долю сторонних поставщиков ИТ-услуг и услуг ЦОД, в том числе облачных и интернет-гигантов, телекоммуникационных компаний и колокейшн–компаний, пришлось около двух третей зарегистрированных сбоев. В 2025 году доля отключений, связанных с человеческими ошибками и вызванных несоблюдением процедур, выросла на 10 п.п. по сравнению с 2024 годом. Как полагают исследователи, это может быть следствием быстрого роста отрасли ЦОД, и вызванной этим нехваткой персонала во многих регионах. В связи с этим больше внимания уделяется обучению персонала и оперативной поддержке в режиме реального времени, что может снизить риски более эффективно, чем улучшение документации и процессов, хотя они тоже важны. Это подтверждают результаты опроса, согласно которому четыре из пяти (80 %) операторов считают, что улучшение управления и процессов позволило бы предотвратить последний инцидент с простоем в их организации. Согласно исследованию, за последние три года около 40 % организаций столкнулись с серьезными перебоями в работе, вызванными человеческими ошибками. В 58 % случаев это было вызвано несоблюдением сотрудниками процедур, а 45 % случаев были связаны с некорректными процессами или процедурами, регламентирующими работу персонала. При этом Uptime утверждает, что рассматривает человеческие ошибки как способствующий фактор, а не как первопричину отключений, хотя они напрямую или косвенно играют роль в большинстве инцидентов. Основной причиной серьёзный аварийных отключений ЦОД остаются проблемы, связанные с питанием. На них приходится более половины всех инцидентов. Более одного из четырёх респондентов сообщили, что в течение последних трёх лет серьезный сбой в работе IT был вызван неполадками в питании объекта. Наиболее часто это связано с отказом ИБП, что недавно привело к шестичасовому отключению Google Cloud. Другие элементы в цепочке питания также могут вызывать такие проблемы, как периодические сбои в подаче энергии и неправильное управление или неправильно настроенное переключение на генераторы, отметили исследователи. Также была указана как растущая проблема нестабильность сети. Растущий спрос, устаревшая инфраструктура, экстремальные погодные условия и изменчивость возобновляемых источников энергии могут увеличить частоту сбоев питания, что подчёркивает необходимость надёжных локальных систем. Как отметил The Register, ЦОД, расположенные вблизи лондонского аэропорта Хитроу, продолжили работу, несмотря на отключение электроэнергии, которое вынудило приостановить приём и отправку большого количества рейсов в марте. Дата-центры Испании и Португалии тоже успешно пережили крупнейший блэкаут в истории стран. |
|
