Привет! Мы проводим SRE Week — открытый интенсив по теме Site Reliability Engineering от Школы анализа данных и экспертов Yandex Infrastructure.

О чём интенсив
Site Reliability Engineering — область, посвящённая эксплуатации больших и нагруженных компьютерных систем. Если вы хотите делать сервисы, способные выдерживать значительные нагрузки и работать на большом количестве железа, вам придётся столкнуться и с вопросами эксплуатации.
Программа интенсива
На интенсиве будет пять лекций и один семинар, занятия пройдут с 17 по 22 июня.
На лекциях:
посмотрим на поломки больших систем, общие принципы, статистику аварий и разберём конкретный инцидент;
научимся производить диагностику одного сервера и определять ограничения по железу, так как большие системы строятся из отдельных серверов;
изучим опасности, которые могут поджидать в протоколе, связывающем отдельные серверы, и освоим средства диагностики распределённых систем;
обсудим, из чего состоит ежедневная работа в эксплуатации и как организована работа в команде.
На семинаре:
научимся настраивать ядро Linux для повышения производительности;
разберём на практике несколько реальных проблемных ситуаций, для диагностики которых воспользуемся утилитами с лекций.
Как принять участие
Для участия в интенсиве зарегистрируйтесь по ссылке. Регистрация открыта до 16 июня. Для получения доступа к итоговому практическому заданию нужно пройти отбор до 22 июня и сдать задание до 3 июля. Тем, кто успешно справится, будет выдан сертификат.