Host Tracker: Notificação de abandono do site somente para empresas
Publicado por: Alex Shashenko 2014-03-09 all articlesOf course, uma das principais prioridades para qualquer gerente de site é garantir que o recurso funcione sem problemas. Entretanto, periódicos « downs » acidentes no local são inevitáveis, e o principal aqui — para rastrear e resolver o problema a tempo.
Obviamente, ninguém é capaz de monitorar o desempenho do site 24 horas por dia. Além disso, o recurso pode não estar disponível em outra região, e este gerente não irá rastreá-lo de forma alguma.
E é para resolver estes problemas que foi projetado o serviço HostTracker, que monitora a disponibilidade do site. Ele grava o «downfall» site, analisa o problema e envia um alarme para o administrador ou para a administração dos recursos.
É óbvio que ninguém precisa de um falso alarme, e o princípio «melhor salvaguarda do que arrependimento;— não é a melhor estratégia neste caso. É por isso que no trabalho do serviço é necessário ser extremamente preciso e adequado na avaliação dos problemas.
HostTrekker tem, portanto, uma série de tarefas críticas: rastrear e notificar o cliente a tempo e evitar falsos alarmes e calcular uptime com base nos melhores e piores cenários.
Como você registra um « direto; drop» recurso? <
Qual é o melhor e o pior cenário?
Assim que um cliente adiciona um website, o sistema envia uma solicitação em um intervalo fixo entre um minuto e uma hora. Nesse momento, essa verificação é realizada a partir de servidores independentes espalhados por todo o mundo para realizar o monitoramento geograficamente distribuído. No momento, existem mais de cinqüenta servidores deste tipo. Um agente específico é selecionado aleatoriamente.
Se um erro de validação for devolvido, um novo teste é executado para cinco a sete agentes independentes a mais. Se, na maioria dos casos, o problema for confirmado, o recurso é considerado «fell». Se os outros agentes não detectaram nenhum problema, presume-se que o problema local ocorreu em um determinado agente.
Se for necessário determinar se um site está pronto, o mesmo algoritmo é aplicado. Ele praticamente elimina a possibilidade de falsos alarmes, protegendo assim a paz de espírito dos clientes do serviço. A inacessibilidade do recurso só é estabelecida após múltiplas verificações com um certo intervalo.
Naturalmente, é impossível garantir por cem por cento exatamente em que estado o local se encontrava entre as verificações. No entanto, com a maior probabilidade no intervalo entre as verificações que deram origem a um site de erro & ‖ encontra-se em down‖. Entretanto, se após um erro começar a recuperação, entre as verificações o recurso ainda pode funcionar. Na verdade, este cenário é a base para um cálculo otimista do tempo de atividade. A variante de « mentira» site entre verificações torna-se um ponto de partida para o cálculo de um cenário pessimista.
O cenário otimista é levado em consideração durante a análise estatística, mas no caso de notificação aos clientes os dados são especificados para o cenário pessimista.
Desta forma, graças ao cálculo de todas as variantes e ao cuidadoso monitoramento abrangente, o cliente recebe notificações oportunas somente em caso de problemas reais e pode obter uma imagem completa e confiável picture do que está acontecendo.