Добавить
Уведомления

Почему ваш мониторинг врет? SRE об алертах и наблюдаемости | «В SREду на кухне» | AvitoTech

В SREду на кухне — подкаст, в котором инженеры из Авито и приглашенные гости обсуждают, что такое SRE и как его готовить. Выпуск о том, что такое мониторинг и почему он снова красный. Обсуждаем метрики, алерты, alert storm, ложные сигналы и культуру мониторинга. Как SRE читают графики, что важно бизнесу и почему «всё зелёное» — не всегда хорошо. Ведущие: Михаил Савин, SRE Community Lead в Авито Андрей Волхонский, руководитель юнита System в Центре разработки инфраструктуры Авито Евгений Харченко, руководитель отдела по развитию практик в разработке и эксплуатации в Райффайзен Банк 00:00 — Почему мониторинг врёт 01:18 — Что такое мониторинг 02:24 — Мониторинг как процесс 04:18 — Мониторинг и бизнес 06:57 — Мониторинг vs траблшутинг 10:07 — Пользовательские пути и бизнес-метрики 11:45 — Observability, алерты и мониторинг 13:44 — RED, US и золотые сигналы 16:14 — Что мониторить в первую очередь 18:03 — Очереди, Saturn и аномалии 22:23 — «Всё зелёное — значит всё ок?» 23:19 — Почему нет универсальных метрик 25:04 — Ошибка фокуса на техметриках 27:42 — Надёжность глазами пользователя 31:29 — DevOps, SRE и ответственность 32:37 — Как мониторят большие компании 36:21 — Алерты, шум и выгорание 40:02 — Метрики для бизнеса 43:15 — Фолс-позитивы и фолс-негативы 46:03 — Агрегация и дедупликация 47:20 — Как делать дашборды 50:08 — Ограничения восприятия 52:59 — Итоги Больше о технологиях и инженерной культуре в Авито можно узнать здесь: Telegram канал — https://clc.to/cozDKw Хабр — https://clc.to/0yn3-g Митапы — https://clc.to/Be-_tg GitHub — https://clc.to/BzsVZA В выпуске упомянуты: https://avito.tech/content/h268kximr1-klyuchevie-metriki-stabilnostiili-kak-mi https://avito.tech/content/thrpf8paa1-9999-taki-zachem-ili-v-chyom-schaste-pol

Иконка канала AvitoTech
544 подписчика
12+
43 просмотра
10 дней назад
12+
43 просмотра
10 дней назад

В SREду на кухне — подкаст, в котором инженеры из Авито и приглашенные гости обсуждают, что такое SRE и как его готовить. Выпуск о том, что такое мониторинг и почему он снова красный. Обсуждаем метрики, алерты, alert storm, ложные сигналы и культуру мониторинга. Как SRE читают графики, что важно бизнесу и почему «всё зелёное» — не всегда хорошо. Ведущие: Михаил Савин, SRE Community Lead в Авито Андрей Волхонский, руководитель юнита System в Центре разработки инфраструктуры Авито Евгений Харченко, руководитель отдела по развитию практик в разработке и эксплуатации в Райффайзен Банк 00:00 — Почему мониторинг врёт 01:18 — Что такое мониторинг 02:24 — Мониторинг как процесс 04:18 — Мониторинг и бизнес 06:57 — Мониторинг vs траблшутинг 10:07 — Пользовательские пути и бизнес-метрики 11:45 — Observability, алерты и мониторинг 13:44 — RED, US и золотые сигналы 16:14 — Что мониторить в первую очередь 18:03 — Очереди, Saturn и аномалии 22:23 — «Всё зелёное — значит всё ок?» 23:19 — Почему нет универсальных метрик 25:04 — Ошибка фокуса на техметриках 27:42 — Надёжность глазами пользователя 31:29 — DevOps, SRE и ответственность 32:37 — Как мониторят большие компании 36:21 — Алерты, шум и выгорание 40:02 — Метрики для бизнеса 43:15 — Фолс-позитивы и фолс-негативы 46:03 — Агрегация и дедупликация 47:20 — Как делать дашборды 50:08 — Ограничения восприятия 52:59 — Итоги Больше о технологиях и инженерной культуре в Авито можно узнать здесь: Telegram канал — https://clc.to/cozDKw Хабр — https://clc.to/0yn3-g Митапы — https://clc.to/Be-_tg GitHub — https://clc.to/BzsVZA В выпуске упомянуты: https://avito.tech/content/h268kximr1-klyuchevie-metriki-stabilnostiili-kak-mi https://avito.tech/content/thrpf8paa1-9999-taki-zachem-ili-v-chyom-schaste-pol

, чтобы оставлять комментарии