Técnicas para resolução de problemas

Resolução de problemas é uma abordagem sistemática para solucionar um problema. O objetivo da resolução de problemas é determinar o motivo de algo não funcionar conforme esperado e como resolver o problema.

A primeira etapa no processo de resolução de problemas é descrever o problema por completo. A descrição do problema irá ajudá-lo e também ao representante de suporte técnico IBM a saber por onde começar a localizar a causa do problema. Essa etapa inclui fazer a si mesmo perguntas básicas:

  • Quais são os sintomas do problema?
  • Onde o problema ocorre?
  • Quando ocorre o problema?
  • Sob quais condições o problema ocorre?
  • O problema pode ser reproduzido?

As respostas a essas perguntas geralmente resultam em uma boa descrição do problema, que por sua vez pode levá-lo à uma resolução de problema.

Quais são os sintomas do problema?

Quando você começa a descrever o problema, a pergunta mais óbvia é "Qual é o problema?" Esta pergunta pode parecer mais simples; no entanto, é possível dividi-la em várias perguntas mais objetivas que apresentam um panorama mais descritivo para o problema. Estas perguntas podem incluir:

  • Quem ou o que, está relatando o problema?
  • Quais são os códigos de erro e as mensagens?
  • Como ocorre a falha do sistema? Por exemplo, é um loop, uma interrupção, um travamento, uma degradação de desempenho ou um resultado incorreto?

Onde o problema ocorre?

Determinar a origem do problema nem sempre é fácil, mas é uma das etapas mais importantes na resolução de um problema. Podem existir muitas camadas de tecnologia entre os componentes que relatam e os que falham. Redes, discos e unidades são apenas alguns dos componentes que devem ser considerados ao investigar problemas.

As perguntas a seguir ajudam a direcionar o foco para onde ocorre o problema para isolar a camada do problema:

  • O problema é específico de uma plataforma ou sistema operacional ou é comum em várias plataformas ou sistemas operacionais?
  • O ambiente e a configuração atual são suportados?
  • Todos os usuários têm o problema?
  • (Para instalações multisite.) Todos os sites têm o problema?

O fato de uma camada relatar o problema não significa que o problema tem origem nessa camada. Parte da identificação onde um problema se origina é compreender o ambiente no qual ele existe. Não tenha pressa em descrever o ambiente com problema por inteiro, incluindo o sistema operacional e versão, todos os produtos de software e versões correspondentes e informações de hardware. Confirme se você está executando em um ambiente que tenha uma configuração suportada; muitos problemas podem ser imputados aos níveis incompatíveis de software que não foram planejados para serem executados juntos ou não foram totalmente testados juntos.

Quando ocorre o problema?

Desenvolva uma linha de tempo detalhada que o leve até a falha, especialmente nos casos que são ocorrências únicas. É possível desenvolver mais facilmente uma linha de tempo trabalhando em retrocesso: Inicie no momento em que foi relatado um erro (da forma mais precisa possível, incluindo o milissegundo), e procure um cluster de erros nos logs nesse momento. Concentre-se no momento mais anterior dos erros no cluster relacionado. Tome cuidado para não voltar muito no tempo quando estiver examinando uma falha anterior em cluster com erro.

Para desenvolver uma linha de tempo detalhada de eventos, responda estas perguntas:

  • O problema acontece apenas em um certo momento do dia ou da noite?
  • Qual a frequência com que o problema ocorre?
  • Qual foi sequência de eventos até o momento em que o problema foi relatado?
  • O problema ocorre após uma mudança no ambiente, como upgrade ou instalação de software ou hardware?

A resposta a esses tipos de questões pode dar a você um quadro de referência no qual investigar o problema.

Sob quais condições o problema ocorre?

Saber quais sistemas e aplicativos estavam em execução no momento em que o problema ocorreu é uma parte importante da resolução do problema. Estas perguntas sobre seu ambiente podem ajudá-lo a identificar a causa raiz do problema:

  • O problema sempre ocorre quando a mesma tarefa está sendo executada?
  • É necessário ocorrer uma seqüência de eventos para que o problema apareça?
  • Algum outro aplicativo falha ao mesmo tempo?

Responder a esse tipo de pergunta pode ajudá-lo a explicar o ambiente em que o problema ocorre e correlacionar quaisquer dependências. Lembre-se de que apenas porque muitos problemas podem ser ocorrido quase ao mesmo tempo, eles não necessariamente estão relacionados.

O problema pode ser reproduzido?

A partir de uma perspectiva de resolução de problemas, o problema ideal é aquele que pode ser reproduzido. Geralmente, quando um problema pode ser reproduzido, você tem à sua disposição um conjunto maior de ferramentas ou procedimentos para ajudá-lo na investigação. Consequentemente, problemas que podem ser reproduzidos muitas vezes são mais fáceis de serem depurados e resolvidos. No entanto, problemas que podem ser reproduzidos possuem uma desvantagem: Se o problema tiver um impacto comercial significativo, você provavelmente não desejará que ele ocorra novamente. Se possível, recrie o problema em um ambiente de teste ou de desenvolvimento, que geralmente oferece maior flexibilidade e controle durante sua investigação.

  • O problema pode ser reproduzido em um sistema de teste?
  • Vários usuários ou aplicativos estão tendo o mesmo tipo de problema?
  • O problema pode ser recriado por meio da execução de um único comando, um conjunto de comandos ou um aplicativo específico?