Описание картинки

«Яндекс» раскрыл причины многочасовой аварии

Многочасовой сбой в работе «Яндекса» был вызван ошибкой ПО на маршрутизаторе в новом дата-центре в Амстердаме.
Около 22 часов 19 августа 2011 г. сервисы «Яндекса» начали восстанавливать работу после серьезного сбоя, произошедшего пятью часами ранее. Замруководителя департамента эксплуатации «Яндекс» Владимир Иванов вечером 19 августа разместил в своем блоге постинг, в котором объяснил причины аварии и сообщил, что к моменту публикации основные последствия проблемы были устранены. Согласно его записи, она произошла из-за «проблем с маршрутизацией в сети Яндекса». Он подчеркнул, что сбой не был связан «с работой дата-центров, DDoS-атаками, пожарами, а также любыми другими внешними факторами». Никакие пользовательские данные не потеряны, подчеркнул он. Напомним, что начиная с 17 часов 19 августа 2011 г. поисковик «Яндекс» переживал серьезный сбой в работе, выразившийся в прекращении работы всех сервисов «Яндекса», включая поиск. Серверы поисковика были недоступны по команде ping. Тогда же представитель компании Очир Манджиков заявил CNews, что «специалисты компании сейчас ищут причины сбоя», и не высказал в этой связи никаких предположений. «Подробности для тех, кому интересно» привел в своем постинге Владимир Иванов. По его описанию, «проблема была вызвана ошибкой программного обеспечения на маршрутизаторе, расположенном в нашем новом дата-центре в Амстердаме. В Яндексе используются протоколы маршрутизации – внутренний протокол OSPF и внешний протокол BGP. Из-за ошибки информация обо всех внешних маршрутах оказалась во внутренних таблицах маршрутизации. Это примерно на три порядка больше маршрутов, чем обычно. Протокол OSPF не рассчитан на такое количество. В результате у всех маршрутизаторов кончилась память, и они перестали работать. Нарушилась работа сети, и через несколько минут Яндекс стал полностью недоступен».
Согласно Иванову, внутренняя сеть поисковика тоже не работала, поэтому специалистам «Яндекса» потребовалось много времени, «чтобы по цепочке добраться до источника проблемы». Когда администраторы исправили ошибку на маршрутизаторе, специалистам пришлось «разделить сеть на несколько частей», чтобы снять лишнюю нагрузку с остальных маршрутизаторов, которых в «Яндексе» больше сотни. Когда количество трафика снизилось, маршрутизаторы смогли самостоятельно восстановить связность сети, и через некоторое время сервисы Яндекса стали доступны большей части пользователей.
Комментарии / 0

More about Digit — discover and read

Никита Светлых / iPhone 8 получит стеклянный корпус и беспроводную зарядку (1)iPhone 8 получит стеклянный корпус и беспроводную зарядку
Иван Кущ / Тест-обзор дешёвого 4G-смартфона Fly Cirrus 11 (1)Тест-обзор дешёвого 4G-смартфона Fly Cirrus 11
Никита Светлых / Анонсирован бюджетный смартфон Alcatel 3X Plus на Android 11: цены и описание (1)Анонсирован бюджетный смартфон Alcatel 3X Plus на Android 11: цены и описание
Никита Светлых / Пользователи iPhone 12 столкнулись с перебоями в работе беспроводной зарядки (0)Пользователи iPhone 12 столкнулись с перебоями в работе беспроводной зарядки
Иван Кущ / Обзор смартфона Huawei Nova 2 Plus (0)Обзор смартфона Huawei Nova 2 Plus
Anonymous / Школьные годы мобильные – смартфон стал помощником в учебе (0)Школьные годы мобильные – смартфон стал помощником в учебе
Anonymous / Huawei представила ультрабюджетные смартфоны и планшет (0)Huawei представила ультрабюджетные смартфоны и планшет
Anonymous / Huawei представила безрамочные смартфоны Mate 10 и Mate 10 Pro (0)Huawei представила безрамочные смартфоны Mate 10 и Mate 10 Pro
Anonymous / Представлен рейтинг сервисов для эффективной работы бизнеса в новогодние праздники (0)Представлен рейтинг сервисов для эффективной работы бизнеса в новогодние праздники
Anonymous / Почта России упростила оформление и отслеживание при массовых отправках на сайте (0)Почта России упростила оформление и отслеживание при массовых отправках на сайте