Host Tracker: notifica di abbandono del sito solo per le aziende
Pubblicato: Alex Shashenko 2014-03-09 all articlesOvviamente, una delle massime priorità per qualsiasi gestore di siti è garantire che la risorsa funzioni senza problemi. Tuttavia, i periodici «down » del sito sono inevitabili, e la cosa principale — rintracciare e risolvere il problema in tempo.
Ovviamente, nessuno è in grado di monitorare le prestazioni del sito 24 ore su 24. Inoltre, la risorsa può non essere disponibile in tempo. Inoltre, la risorsa può essere indisponibile in un'altra regione, e questo gestore non la rintraccerà in alcun modo.
Per risolvere questi problemi è stato progettato il servizio HostTracker, che monitora la disponibilità del sito. Esso registra il «downfall» del sito, analizza il problema e invia un allarme all'amministratore o alla gestione delle risorse.
È ovvio che nessuno ha bisogno di un falso allarme e il principio «meglio prevenire che curare;— non è la strategia migliore in questo caso. Ecco perché nel lavoro del servizio è necessario essere estremamente precisi e adeguati nella valutazione dei problemi.
HostTrekker ha quindi una serie di compiti critici: tracciare e avvisare il cliente in tempo, evitando falsi allarmi, e calcolare il tempo di attività in base agli scenari migliori e peggiori.
Come si registra una risorsa «drop» diretta?
Qual è lo scenario migliore e quello peggiore?
Non appena un cliente aggiunge un sito web, il sistema invia una richiesta a un intervallo fisso tra un minuto e un'ora. Il controllo viene effettuato da server indipendenti sparsi in tutto il mondo per eseguire un monitoraggio geograficamente distribuito. Al momento, esistono più di cinquanta server di questo tipo. Un agente specifico viene selezionato in modo casuale.
Se viene restituito un errore di convalida, viene eseguito un nuovo test per altri cinque-sette agenti indipendenti. Se, nella maggior parte dei casi, il problema viene confermato, la risorsa viene considerata «caduta». Se gli altri agenti non hanno rilevato alcun problema, si presume che il problema locale si sia verificato su un particolare agente. Se è necessario determinare se un sito è attivo, si applica lo stesso algoritmo. In questo modo si elimina virtualmente la possibilità di falsi allarmi, proteggendo così la tranquillità dei clienti del servizio. L'inaccessibilità della risorsa viene stabilita solo dopo controlli multipli con un determinato intervallo.
Naturalmente, è impossibile garantire al cento per cento lo stato esatto in cui si trovava il sito tra un controllo e l'altro. Tuttavia, con la massima probabilità nell'intervallo tra i controlli che hanno dato un errore il sito & ‖ si trova a terra‖. Tuttavia, se dopo un errore inizia il recupero, tra un controllo e l'altro la risorsa può ancora funzionare. Questo scenario è la base per il calcolo ottimistico del tempo di attività. La variante del sito «sdraiato» tra un controllo e l'altro diventa il punto di partenza per il calcolo di uno scenario pessimistico.
Lo scenario ottimistico viene preso in considerazione durante l'analisi statistica, ma in caso di notifica ai clienti vengono specificati i dati per lo scenario pessimistico.
In questo modo, grazie al calcolo di tutte le varianti e a un attento monitoraggio globale, il cliente riceve notifiche tempestive solo in caso di problemi reali e può ottenere un quadro completo e affidabile di ciò che sta accadendo.