Host Tracker: Powiadomienie o opuszczeniu witryny tylko dla firm
Opublikowany: Alex Shashenko 2014-03-09 wszystkie artykułyOczywiście, jednym z najważniejszych priorytetów dla każdego menedżera witryny jest zapewnienie, że zasób działa płynnie. Jednak okresowe «upadki » awarii witryny są nieuniknione, a główną rzeczą tutaj —, aby śledzić i rozwiązać problem w czasie.
Oczywiście, nikt nie jest w stanie monitorować wydajność witryny przez całą dobę. Ponadto, zasób może być niedostępny w innym regionie, a ten menedżer nie będzie go śledzić w żaden sposób.
.
I to jest do rozwiązania tych problemów jest zaprojektowany serwis HostTracker, który monitoruje dostępność strony. To rejestruje «downfall» witryny, analizuje problem i wysyła alarm do administratora lub zarządzania zasobami.
Oczywistym jest, że nikomu nie jest potrzebny fałszywy alarm, a zasada «lepiej zabezpieczyć niż żałowaćandrdash; nie jest w tym przypadku najlepszą strategią. Dlatego w pracy serwisu konieczna jest niezwykła dokładność i adekwatność w ocenie problemów.
HostTrekker ma zatem kilka krytycznych zadań: śledzenie i powiadamianie klienta na czas oraz unikanie fałszywych alarmów, a także obliczanie uptime w oparciu o najlepsze i najgorsze scenariusze.
Jak zalogować bezpośredni «drop» zasobu?
Jaki jest najlepszy i najgorszy scenariusz?
Gdy tylko klient doda stronę internetową, system wysyła zapytanie w ustalonym odstępie czasu od jednej minuty do jednej godziny. W tym czasie takie sprawdzanie odbywa się z niezależnych serwerów rozrzuconych po całym świecie w celu przeprowadzenia geograficznie rozproszonego monitoringu. W tej chwili takich serwerów jest ponad pięćdziesiąt. Konkretny agent jest wybierany losowo.
Jeśli zwrócony zostanie błąd walidacji, uruchamiany jest retest dla pięciu do siedmiu kolejnych niezależnych agentów. Jeśli w większości przypadków problem zostanie potwierdzony, zasób uznaje się za «upadły». Jeśli pozostałe agenty nie wykryły żadnych problemów, przyjmuje się, że lokalny problem wystąpił na konkretnym agencie.
W przypadku konieczności określenia, czy dany obiekt jest w stanie up, stosuje się ten sam algorytm. Praktycznie eliminuje on możliwość wystąpienia fałszywych alarmów, chroniąc tym samym spokój klientów serwisu. Niedostępność zasobu jest stwierdzana dopiero po wielokrotnym sprawdzeniu z określonym odstępem czasu.
.
Oczywiście nie da się zagwarantować na sto procent, w jakim dokładnie stanie znajdowała się strona pomiędzy sprawdzeniami. Jednak z najwyższym prawdopodobieństwem w przedziale między kontrolami, które dały błąd witryny & ‖ leży w dół'. Jeśli jednak po błędzie rozpocznie się odzyskiwanie, to pomiędzy kontrolami zasób może nadal działać. Właściwie ten scenariusz jest podstawą do optymistycznego obliczania uptime. Wariant «leżącego» miejsca pomiędzy sprawdzeniami staje się punktem wyjścia do obliczenia scenariusza pesymistycznego.
Scenariusz optymistyczny jest brany pod uwagę podczas analizy statystycznej, ale w przypadku powiadamiania klientów dane są określone dla scenariusza pesymistycznego.
W ten sposób, dzięki obliczeniu wszystkich wariantów i starannemu kompleksowemu monitorowaniu, klient otrzymuje terminowe powiadomienia tylko w przypadku rzeczywistych problemów i może uzyskać pełny i wiarygodny obraz tego, co się dzieje.