Eskalationen. Typische Szenarien Website-Überwachungsdienst

Veröffentlicht: Alex Shashenko 2014-06-12 alle Artikel | Glossar | FAQ

Ich wurde um drei Uhr morgens von einer SMS geweckt.
Meine Seite fiel fuer drei Minuten ab und fuhr dann von selbst wieder hoch.
Aber ich konnte nicht wieder einschlafen.

Geschichte aus dem wahren Leben

Wie viele wissen, ist HostTracker ein System zur Überwachung der Effizienz von Websites. Eine seiner Hauptfunktionen besteht darin, den Benutzer rechtzeitig über Probleme zu informieren. Die Effizienz der Benachrichtigungen und der akzeptable Grad der Detailliertheit sind wichtig. Wenn Sie bei jedem Niesen eine Benachrichtigung senden, wird die Person die wichtigen Informationen in diesem Fluss nicht finden.

Wir haben mehrere Mechanismen vorgesehen, die den richtigen Personen helfen, die notwendigen Benachrichtigungen zu erhalten:

  • Aufteilung der Benachrichtigungen in mehrere Gruppen entsprechend ihrer Kritikalität;
  • Keine Benachrichtigungen bei kurzfristigen Ausfällen;
  • Sofortige Meldung des Problems an den Vorgesetzten;
  • Melden Sie einen längeren Ausfall an die Verwaltung;
  • Nutzen Sie zuerst die kostenlosen Benachrichtigungen (E-Mail, gtalk) und dann die kostenpflichtigen (SMS oder Telefonanruf);
  • Auf der Ebene des Kontakts – legen Sie die Arbeitszeit fest, zu der dieser Kontakt die Benachrichtigungen erhalten soll.

Es gibt drei Arten von Benachrichtigungen:

  • Die Website ist “abgestürzt”;
  • Die Website ist immer noch “down”;
  • Die Website ist “gestiegen

Die “dropped” und “rose” sind eindeutig. Die Meldungen “site is still down” werden bei jedem Testausfall gesendet, aber nur bei den bestätigten Ausfällen. Der Algorithmus zur Bestätigung der Ausfälle wurde im Artikel “Ausschluss von Fehlalarmen”

Für jedes Website-Kontakt-Paar können Sie den entsprechenden Benachrichtigungstyp aktivieren oder deaktivieren. Die Einstellung findet sich sowohl in den Kontakteigenschaften als auch in der allgemeinen “Matrix” auf der “Benachrichtigungen abonnieren” Seite.

Die Skalierung und der Detaillierungsgrad der Benachrichtigungen.

Angenommen, zwei Personen sind für die Seite verantwortlich:

  • Administrator
  • Manager

Lassen Sie uns versuchen, das folgende Szenario zu implementieren:

  • Im Falle eines “Abbruchs” wollen wir sofort eine E-Mail-Nachricht an den Administrator senden;
  • Wenn die Seite nicht innerhalb von 15 Minuten ansteigt, senden wir eine SMS an den Administrator;
  • Wenn die Website “down” für mehr als eine Stunde ist, dann senden wir eine SMS an den Verwalter.

Hinzufügen der Kontakte für die Benutzer. Achten Sie beim Hinzufügen auf das Fenster “Benachrichtigungsverzögerung”.

Wir haben anscheinend drei Kontakte mit den folgenden Verzögerungen:

  • Administrator (E-Mail) – keine Verzögerung;
  • Administrator (SMS) – 15 Minuten Verzögerung;
  • Manager (SMS) – 1 Stunde Verzögerung.

Nach dieser Konfiguration erhält der Administrator alle Fehlermeldungen per E-Mail, aber SMS-Benachrichtigungen werden nur gesendet, wenn die Website mehr als 15 Minuten lang nicht erreichbar ist. Der Manager erhält nur SMS über größere Ausfälle, die länger als eine Stunde dauern. Einrichten des Arbeitsplans der Kontakte

Angenommen, ein Verwalter ist überlastet, und wir haben einen weiteren Verwalter eingestellt. Der erste arbeitet in der ersten Hälfte der Woche, der zweite in der zweiten Hälfte der Woche. Dementsprechend sollen die Benachrichtigungen an den Administrator “im Dienst” gesendet werden. Um dieses Szenario einzustellen, wird in den Kontakteinstellungen das Fenster “Arbeitszeiten des Kontakts festlegen” verwendet.

In diesem Fall wird der erste Administrator die SMS-Benachrichtigungen von Montag bis einschließlich Donnerstag erhalten. Zusätzlich können Sie die Benachrichtigung für verschiedene Mitarbeiter nach der Tageszeit aufteilen, z.B. indem Sie Tag- und Nachtadministratoren ernennen.

Fazit: Mit Hilfe von relativ einfachen Mechanismen können wir die meisten Benachrichtigungs-Feinabstimmungs-Szenarien abdecken.

Stichworte: usecase
Chief Communications and Technology Officer von HostTracker. Alex ist seit den Anfängen des Unternehmens Teil des Teams. Seine Arbeitsschwerpunkte sind Geschäftsberichte, Analysen von Datenbankstatistiken und Systemadministration. Alex kümmert sich auch u