Escalaties. Typische scenario's website monitoring service
Gepubliceerd: Alex Shashenko 2014-06-12 alle artikelenIk werd gewekt door een SMS om drie uur 's nachts.
Mijn site viel voor drie minuten weg, en hij kwam vanzelf weer omhoog.
Maar ik kon niet meer in slaap komen.
True-life story
Zoals velen weten, HostTracker is een systeem om de efficiëntie van sites te controleren. Een van de belangrijkste functies is om de gebruiker snel op de hoogte te brengen van eventuele problemen. De efficiëntie van de meldingen en het aanvaardbare niveau van “detalization” zijn belangrijk. Als u waarschuwingen stuurt bij elke “nies”, zal de persoon de belangrijke informatie in deze stroom niet vinden.
We hebben verschillende mechanismen voorzien die de juiste mensen helpen om de nodige meldingen te krijgen:
- Scheiding van de meldingen in verschillende groepen volgens hun kriticiteit;
- Geen meldingen bij storingen op korte termijn;
- Meld het probleem onmiddellijk aan de manager;
- Meld een langdurige storing aan de administratie;
- Gebruik eerst de gratis waarschuwingen – e-mail, gtalk, en daarna de betaalde – SMS of telefoontje;
- Op contactniveau – stel de werktijd in wanneer dit contact de waarschuwingen moet ontvangen.
Er zijn drie soorten meldingen:
- De website is “dropped”;
- De website is nog “down”;
- De website “steeg
De “dropped” en “rose” zijn duidelijk. De meldingen “site is nog steeds down” worden verzonden bij elke testfail, maar alleen bij de bevestigde drops. Het fail bevestigingsalgoritme is beschreven in het artikel “False alerts exclusion”
Voor elk site-contactpaar kunt u het juiste meldingstype in- of uitschakelen. De instelling is te vinden in de contact eigenschappen en in de algemene “matrix” op de “Notifications subscribtion” pagina.
Escalatie en de meldingen detalisatie niveau.
Voorstel, twee personen zijn verantwoordelijk voor de site:
- Beheerder
- Manager
Laten we proberen het volgende scenario uit te voeren:
- In geval van een “drop” willen we onmiddellijk een e-mail bericht sturen naar de beheerder;
- Als de site niet binnen 15 minuten stijgt, sturen we een SMS naar de beheerder;
- Als de site langer dan een uur “down” is, dan sturen we een SMS naar de beheerder;
Het toevoegen van contacten voor de gebruikers. Let tijdens het toevoegen op het “Notification Delay” venster.
We blijken drie contacten te hebben met de volgende vertragingen:
- Beheerder (e-mail) – geen vertraging;
- Bestuurder (SMS) – 15 minuten vertraging;
- Manager (SMS) – 1 uur vertraging;
Volgens deze configuratie krijgt de beheerder alle storingsmeldingen in zijn e-mail, maar SMS-berichten worden alleen verstuurd als de site langer dan 15 minuten niet bereikbaar is. De beheerder ontvangt alleen SMS-berichten over grote storingen die langer dan een uur duren. Instellen van het werkschema voor contactpersonen
Stel dat één beheerder het niet aankan, en we huren een extra beheerder in. De eerste werkt in de eerste helft van de week, de tweede in de tweede helft. Dienovereenkomstig moeten de meldingen worden verzonden naar de beheerder “die dienst heeft” Om dit scenario in te stellen wordt het venster “Stel de werktijden van de contactpersoon in” gebruikt in de contactinstellingen.
In dit geval ontvangt de eerste beheerder de SMS-berichten van maandag tot en met donderdag. Daarnaast kunt u de melding voor verschillende medewerkers verdelen op basis van het tijdstip, bijvoorbeeld door dag- en nachtbeheerders aan te stellen.
Conclusies: met behulp van relatief eenvoudige mechanismen kunnen we de meeste meldingen afstemmen op gebruikersscenario's.