É meu povo, estava demorando pra eu retornar com o tema de continuidade por aqui não é mesmo?
Pois é, hoje eu trouxe um clássico cenário dentro de contiuidade nas empresas...
Então como já é esperado, senta que lá vem história!
Uma das maiores dificuldades que observo é quando as pessoas confundem contingência operacional com disaster recovery. Essa confusão gera infinitas reuniões, emails de desespero, criação de soluções inadequadas e óbvio, custos desnecessários.
Mas pera! O que é Contingência Operacional?
Contingência operacional são as situações do dia a dia que podem interromper o funcionamento normal, mas não destroem nossa infraestrutura, na sequência algumas características e exemplos:
Características da contingência operacional:
- Problemas temporários e reversíveis
- Impacto localizado
- Soluções simples e rápidas
- Causas conhecidas e previsíveis
Exemplos práticos:
- Recursos humanos: O desenvolvedor principal ficou doente na véspera do deploy
- Performance: O sistema ficou lento devido ao pico de acesso inesperado
- Fornecedores: A empresa de internet está com instabilidade
- Processos: O sistema de pagamento está fora do ar por manutenção
O que é Disaster Recovery?
Disaster Recovery envolve situações que comprometem seriamente ou destroem nossa capacidade operacional, exigindo reconstrução ou ativação de ambientes alternativos, na sequência algumas características e exemplos:
Características do disaster recovery:
- Perda significativa de recursos ou dados
- Impacto amplo na organização
- Tempo de recuperação mais longo
- Necessidade de recursos alternativos
- Infraestrutura física: Incêndio no datacenter, enchente, roubo de equipamentos
- Segurança cibernética: Ransomware que criptografou todos os dados
- Falhas sistêmicas: Corrupção completa do banco de dados principal
- Eventos externos: Blecaute prolongado, catástrofes naturais
Solução típica: Ambientes alternativos, backups robustos, sites secundários.
Entendeu que na prática a grande cilada é: Tratar uma contingência operacional como um desastre.
Mas, como identificar o tipo certo de problema para não cair na armadilha da confusão?
Perguntas para Contingência Operacional:
- O problema é temporário e reversível?
- A solução pode ser implementada rapidamente?
- Os dados e sistemas principais estão seguros?
- É um problema que acontece com frequência?
Perguntas para Disaster Recovery:
- Houve perda real de dados ou equipamentos?
- O ambiente principal está comprometido?
- Preciso de infraestrutura alternativa para continuar?
- A recuperação levará horas ou dias?
Foi!? A chave para uma continuidade efetiva é tratar cada problema com a solução adequada. Nem todo problema precisa de uma bazuca - às vezes, um band-aid resolve ;)