Host Tracker: Oznámení o opuštění webu pouze pro firmy
Publikováno: Alex Shashenko 2014-03-09 všechny články
Jednou z hlavních priorit každého správce webu je samozřejmě zajistit bezproblémový chod zdroje. Občasné «pády » webu jsou však nevyhnutelné a hlavní je zde — problém včas vysledovat a vyřešit.
Je zřejmé, že nikdo není schopen sledovat výkon webu nepřetržitě. Navíc může být zdroj nedostupný v jiném regionu a tento správce to nijak nevystopuje.
A právě k řešení těchto problémů je určena služba HostTracker, která monitoruje dostupnost webu. Ta zaznamenává «výpadek» webu, analyzuje problém a posílá upozornění správci nebo správě zdrojů.
Je zřejmé, že nikdo nepotřebuje falešný poplach a zásada «lepší se chránit než litovat;— není v tomto případě nejlepší strategií. Proto je při práci služby nutné být mimořádně přesný a adekvátní při vyhodnocování problémů.
HostTrekker má proto několik zásadních úkolů: sledovat a včas upozornit zákazníka a vyhnout se falešným poplachům a vypočítat dobu provozu na základě nejlepšího a nejhoršího scénáře.
Jak přihlásit přímý «pokles» zdroje?
Jaký je nejlepší a nejhorší scénář?
Jakmile zákazník přidá webovou stránku, systém odešle požadavek v pevně stanoveném intervalu od jedné minuty do jedné hodiny. Přitom se taková kontrola provádí z nezávislých serverů rozesetých po celém světě, aby bylo možné provádět geograficky distribuované monitorování. V současné době je takových serverů více než padesát. Konkrétní agent je vybírán náhodně.
Pokud se vrátí chyba ověření, provede se opakovaný test pro dalších pět až sedm nezávislých agentů. Pokud se ve většině případů problém potvrdí, je zdroj považován za «padlý». Pokud ostatní agenti nezjistili žádné problémy, předpokládá se, že lokální problém nastal u konkrétního agenta.
Pokud je třeba zjistit, zda je lokalita v provozu, použije se stejný algoritmus. Prakticky se tak eliminuje možnost falešných poplachů, čímž se chrání klid zákazníků služby. Nedostupnost prostředku je zjištěna až po několikanásobné kontrole s určitým časovým odstupem.
Samozřejmě nelze stoprocentně zaručit, v jakém stavu se web mezi kontrolami přesně nacházel. Nicméně s největší pravděpodobností v intervalu mezi kontrolami, které vydaly chybu stránky & ‖ leží dole‖. Pokud však po chybě začne obnova, mezi kontrolami může zdroj stále fungovat. Tento scénář je vlastně základem pro optimistický výpočet doby provozu. Varianta «ležícího» místa mezi kontrolami se stává východiskem pro výpočet pesimistického scénáře.
Optimistický scénář se bere v úvahu při statistické analýze, ale v případě upozornění klientů jsou údaje uvedeny pro pesimistický scénář.
Díky výpočtu všech variant a pečlivému komplexnímu sledování tak zákazník obdrží včasné oznámení pouze v případě skutečných problémů a může získat úplný a spolehlivý představu o tom, co se děje.