Escalações. Serviço de monitoramento de cenários típicos do site
Publicado por: Alex Shashenko 2014-06-12 all articles Fui acordado por um SMS às três horas da manhã. Meu site caiu por três minutos, e ele se elevou de volta.
Mas eu não podia voltar a dormir.
História de vida real
Como muitas pessoas sabem, HostTracker é um sistema de monitoramento de eficiência de sites. Uma de suas principais funções é notificar o usuário sobre qualquer problema prontamente. A eficiência das notificações e o nível aceitável de “detalização” são importantes. Se você enviar alertas em cada “sneeze” a pessoa não encontrará as informações importantes neste fluxo.
Fornecemos vários mecanismos que ajudarão as pessoas certas a obter as notificações necessárias:
- Separação das notificações em vários grupos de acordo com sua criticidade;
- Sem notificações de falhas a curto prazo;
- Relatar o problema ao gerente prontamente;
- Relatar uma falha prolongada à administração;
- Utilizar os alertas gratuitos primeiro – e-mail, gtalk, e depois os pagos – SMS ou telefonema;
- No nível de contato – defina o tempo de trabalho quando este contato deve receber os alertas.
Existem três tipos de notificações:
- O site tem “dropped”;
- O site está parado “down”;
- O website “rose
The “dropped” e “rose” are clear. As notificações “site ainda está em baixo” são enviadas a cada teste falham, mas somente nas quedas confirmadas. O algoritmo de confirmação de falhas foi descrito no artigo “exclusão de alertas falsos”
Para cada par site-contato você pode ativar ou desativar o tipo de notificação apropriado. A configuração pode ser localizada nas propriedades de contato assim como no “matrix” no “Notificações assinatura” página.
Escalação e o nível de detalização das notificações.
Finalidade, duas pessoas são responsáveis pelo site:
- Administrador
- Gerente
Let's tentam implementar o seguinte cenário:
- No caso de um “drop” queremos enviar uma mensagem de e-mail ao administrador imediatamente;
- Se o site não se levantar dentro de 15 minutos, enviamos um SMS para o administrador;
- Se o site é “down” por mais de uma hora, então enviamos um SMS para o gerente.
Adicionando os contatos para os usuários. Enquanto adiciona, chame a atenção para o “Notificação de atraso” window.
Temos aparentemente três contatos com os seguintes atrasos:
- Administrador (e-mail) – sem atraso;
- Administrador (SMS) – 15 minutos de atraso;
- Gerenciador (SMS) – atraso de 1 hora.
Segundo esta configuração, o administrador receberá todas as notificações de falhas no e-mail, mas as notificações por SMS serão enviadas somente se o site for “down” por mais de 15 minutos. O administrador receberá apenas SMS sobre falhas graves com duração superior a uma hora. Configurando o horário de trabalho de contato
Ponha que um administrador não pode lidar com isso, e contratamos mais um administrador. O primeiro funciona durante a primeira metade da semana, o segundo funciona durante a segunda metade. Assim, as notificações devem ser enviadas ao administrador “em serviço” para definir este cenário, a janela “definir o horário de trabalho de contato” é usada nas configurações de contato.
Neste caso o primeiro administrador receberá as notificações por SMS de segunda a quinta-feira inclusive. Além disso, você pode dividir a notificação para diferentes funcionários de acordo com a hora do dia, por exemplo, nomeando administradores diurnos e noturnos.
Conclusões: com a ajuda de mecanismos relativamente simples, podemos cobrir a maioria das notificações para afinar cenários de usuários.