Разбор инцидента в Yandex Cloud
Любая большая IT-инфраструктура рано или поздно даёт сбой — наткнулись на интересный разбор на Хабре про крупный инцидент в Yandex Cloud.
Там всё началось с падения одного сетевого контроллера, но из-за наложения багов, миграций и перегрузки очередей цепочка быстро разрослась до проблем сразу в нескольких зонах.
Главный вывод...
Текст новости загружается...