Escalações. Serviço de monitoramento de cenários típicos do site

Publicado por: Alex Shashenko 2014-06-12 all articles | Glossário | PERGUNTAS FREQUENTES

Fui acordado por um SMS às três horas da manhã. Meu site caiu por três minutos, e ele se elevou de volta.
Mas eu não podia voltar a dormir.

História de vida real

Como muitas pessoas sabem, HostTracker é um sistema de monitoramento de eficiência de sites. Uma de suas principais funções é notificar o usuário sobre qualquer problema prontamente. A eficiência das notificações e o nível aceitável de “detalização” são importantes. Se você enviar alertas em cada “sneeze” a pessoa não encontrará as informações importantes neste fluxo.

Fornecemos vários mecanismos que ajudarão as pessoas certas a obter as notificações necessárias:

  • Separação das notificações em vários grupos de acordo com sua criticidade;
  • Sem notificações de falhas a curto prazo;
  • Relatar o problema ao gerente prontamente;
  • Relatar uma falha prolongada à administração;
  • Utilizar os alertas gratuitos primeiro – e-mail, gtalk, e depois os pagos – SMS ou telefonema;
  • No nível de contato – defina o tempo de trabalho quando este contato deve receber os alertas.

Existem três tipos de notificações:

  • O site tem “dropped”;
  • O site está parado “down”;
  • O website “rose

The “dropped” e “rose” are clear. As notificações “site ainda está em baixo” são enviadas a cada teste falham, mas somente nas quedas confirmadas. O algoritmo de confirmação de falhas foi descrito no artigo “exclusão de alertas falsos”

Para cada par site-contato você pode ativar ou desativar o tipo de notificação apropriado. A configuração pode ser localizada nas propriedades de contato assim como no “matrix” no “Notificações assinatura” página.

Escalação e o nível de detalização das notificações.

Finalidade, duas pessoas são responsáveis pelo site:

  • Administrador
  • Gerente

Let's tentam implementar o seguinte cenário:

  • No caso de um “drop” queremos enviar uma mensagem de e-mail ao administrador imediatamente;
  • Se o site não se levantar dentro de 15 minutos, enviamos um SMS para o administrador;
  • Se o site é “down” por mais de uma hora, então enviamos um SMS para o gerente.

Adicionando os contatos para os usuários. Enquanto adiciona, chame a atenção para o “Notificação de atraso” window.

Temos aparentemente três contatos com os seguintes atrasos:

  • Administrador (e-mail) – sem atraso;
  • Administrador (SMS) – 15 minutos de atraso;
  • Gerenciador (SMS) – atraso de 1 hora.

Segundo esta configuração, o administrador receberá todas as notificações de falhas no e-mail, mas as notificações por SMS serão enviadas somente se o site for “down” por mais de 15 minutos. O administrador receberá apenas SMS sobre falhas graves com duração superior a uma hora. Configurando o horário de trabalho de contato

Ponha que um administrador não pode lidar com isso, e contratamos mais um administrador. O primeiro funciona durante a primeira metade da semana, o segundo funciona durante a segunda metade. Assim, as notificações devem ser enviadas ao administrador “em serviço” para definir este cenário, a janela “definir o horário de trabalho de contato” é usada nas configurações de contato.

Neste caso o primeiro administrador receberá as notificações por SMS de segunda a quinta-feira inclusive. Além disso, você pode dividir a notificação para diferentes funcionários de acordo com a hora do dia, por exemplo, nomeando administradores diurnos e noturnos.

Conclusões: com a ajuda de mecanismos relativamente simples, podemos cobrir a maioria das notificações para afinar cenários de usuários.

Tags: usecase
Chefe de Comunicação e Tecnologia da HostTracker. Alex faz parte da equipe desde os primeiros dias da empresa. Seu trabalho se concentra em relatórios comerciais, análise de estatísticas de banco de dados e administração de sistemas. Alex também se encarrega da comunicação com a equipe de desenvolvimento e clientes.