Ескалації. Типові сценарії роботи сервісу моніторингу сайтів

Опубликовано: Alex Shashenko 2014-06-12 все статьи | Глосарій | ПОШИРЕНІ ЗАПИТАННЯ

Мене розбудила SMS о третій ночі.
Мій сайт впав на три хвилини, а потім сам піднявся.
Але заснути я вже не міг.

Правдива історія

Як відомо, HostTracker - це система моніторингу працездатності сайтів. Однією з її основних функцій є оперативне сповіщення користувача про будь-які проблеми. При цьому важлива оперативність сповіщень і прийнятний рівень деталізації. Якщо надсилати сповіщення при кожному “чханні”, людина не знайде в цьому потоці важливої інформації.

Ми передбачили кілька механізмів, які допоможуть потрібним людям отримувати необхідні сповіщення:

  • Розділення
  • Поділ сповіщень на кілька груп відповідно до їх критичності;
  • Відсутність сповіщень при короткочасних збоях;
  • Оперативне повідомлення про проблему менеджеру;
  • Повідомляти про тривалий збій адміністрації;
  • Використовувати спочатку безкоштовні оповіщення – email, gtalk, а потім платні – SMS або телефонний дзвінок;
  • На рівні контакту – встановіть робочий час, коли цей контакт повинен отримувати оповіщення.

Передбачено три типи сповіщень:

  • Сайт “впав”;
  • Сайт все ще “не працює”;
  • Сайт “піднявся”;

Сповіщення “впав” і “піднявся” зрозумілі. Сповіщення “сайт все ще не працює” надсилається при кожному невдалому тесті, але тільки при підтвердженому падінні. Алгоритм підтвердження падінь описано в статті “Виключення помилкових сповіщень”

Для кожної пари сайт-контакт ви можете увімкнути або вимкнути відповідний тип сповіщень. Налаштування можна знайти у властивостях контакту, а також у загальній “матриці” на сторінці “Підписка на сповіщення”

Ескалація та рівень деталізації сповіщень.

Припустимо, за сайт відповідають дві людини:

  • Адміністратор
  • Менеджер

Спробуємо реалізувати наступний сценарій:

  • У разі “падіння” ми хочемо негайно відправити повідомлення адміністратору;
  • Якщо сайт не піднімається протягом 15 хвилин, ми відправляємо SMS адміністратору;
  • Якщо сайт “лежить” більше години, то відправляємо SMS менеджеру.

Додавання контактів для користувачів. Під час додавання зверніть увагу на вікно “Затримка сповіщення”.

У нас з'явилося три контакти з такими затримками:

  • Адміністратор (email) &ndash - без затримки;
  • Адміністратор (SMS) – затримка 15 хвилин;
  • Керівник (SMS) – затримка 1 година;

Згідно з цією конфігурацією адміністратор отримуватиме всі сповіщення про збої на електронну пошту, але SMS-повідомлення будуть надсилатися лише в тому випадку, якщо сайт буде “неактивний” більше 15 хвилин. Менеджер отримуватиме лише SMS про серйозні збої, що тривають більше години. Налаштування розкладу роботи контактів

Налаштування розкладу роботи контактів

Припустимо, що один адміністратор не справляється, і ми найняли ще одного адміністратора. Перший працює протягом першої половини тижня, другий - протягом другої половини. Відповідно сповіщення повинні надсилатися черговому адміністратору. Для налаштування цього сценарію в налаштуваннях контакту використовується вікно “Встановити графік роботи контакту”.

У цьому випадку перший адміністратор буде отримувати SMS-повідомлення з понеділка по четвер включно. Крім того, ви можете розділити сповіщення для різних співробітників відповідно до часу доби, наприклад, призначити денних і нічних адміністраторів.

Висновки: за допомогою відносно простих механізмів ми можемо охопити більшість сповіщень та налаштувати сценарії користувачів.

Теги: usecase
Директор з комунікацій та технологій компанії HostTracker. Олексій є частиною команди із перших днів існування компанії. Його робота зосереджена на складанні бізнес-звітів, аналізі статистики баз даних та системному адмініструванні. Олексій також відповідає за комунікації з командою розробників та клієнтами.