Identificación de problemas en el entorno de nube

La resolución de problemas es un enfoque sistemático para solucionar un problema. El objetivo es determinar por qué algo deja de funcionar de la forma esperada y cómo resolver el problema.

El primer paso en el proceso de resolución de problemas es describir el problema en su totalidad. Sin una descripción del problema, ni usted ni IBM® pueden saber por dónde empezar a encontrar la causa del problema. Este paso incluye el planteamiento de algunas preguntas básicas, tales como:

Las respuestas a estas preguntas generalmente conducen a una buena descripción del problema, y esta es la mejor forma de iniciar el proceso de resolución del mismo.

¿Cuáles son los síntomas del problema?

Al empezar a describir un problema, la pregunta más obvia es ¿Cuál es el problema? Puede parecer una pregunta muy directa; no obstante, puede desglosarla en varias preguntas más orientadas que creen una imagen más descriptiva del problema. Estas preguntas pueden ser:
  • ¿Quién, o qué, informa del problema?
  • ¿Cuáles son los códigos de error y los mensajes?
  • ¿Cómo ha fallado el sistema? Por ejemplo, ¿es un bucle, se ha colgado, se ha bloqueado, es una degradación del rendimiento o es un resultado incorrecto?
  • ¿Cuál es el impacto empresarial del problema?

¿Dónde se ha producido el problema?

No siempre es sencillo determinar dónde se origina el problema, pero es uno de los pasos más importantes a la hora de resolver un problema. Puede haber muchas capas tecnológicas entre los componentes fallidos y los que originan el informe del problema.

Recuerde que aunque una capa informe del problema, eso no indica necesariamente que el problema se origine en esta capa. Parte de la tarea de identificar dónde se origina un problema es conocer el entorno en el que existe. Tómese su tiempo para describir completamente el entorno del problema. Las preguntas siguientes pueden ayudarle a centrarse en el lugar en el que se produce el problema;
  • Si tiene más de una suscripción en la nube, ¿qué suscripciones se ven afectadas?
  • ¿Qué entornos de servidor de flujos de trabajo se ven afectados, por ejemplo Desarrollo o Producción?
  • ¿Qué aplicaciones se ven afectadas?
  • ¿A qué servicios llama la aplicación y cuál es su versión de software y su información de hardware?

¿Cuándo se ha producido el problema?

Desarrolle una cronología detallada de los sucesos que dan lugar a la anomalía, especialmente en aquellos casos en que el problema se produce sólo una vez. La manera más sencilla de hacerlo es trabajando en sentido inverso: empiece a la hora en que se informó del error (de la forma más precisa posible, incluso hasta los milisegundos) y trabaje en sentido inverso por las anotaciones cronológicas e información disponibles. Habitualmente, sólo tiene que buscar hasta el primer suceso sospechoso que encuentre en un archivo de registro de diagnóstico; sin embargo, esto no es siempre sencillo y requiere cierta práctica. Saber cuándo dejar de mirar es especialmente difícil cuando hay implicadas varias capas de tecnología y cuando cada una de ellas tiene su propia información de diagnóstico.

Para desarrollar una línea cronológica detallada de los sucesos, responda a las preguntas siguientes:
  • ¿El problema ocurre sólo en un momento concreto del día o de la noche?
  • ¿Con qué frecuencia se repite el problema?
  • ¿Cuál es la secuencia de eventos que conduce al momento en que se comunicó el problema?
  • ¿Sucede el problema después de un cambio de entorno como, por ejemplo, al actualizar o instalar software o hardware?

Las respuestas a estos tipos de preguntas le pueden ayudar a proporcionar un marco de referencia en que se pueda investigar el problema.

¿En qué condiciones se ha producido el problema?

Saber que otros sistemas y aplicaciones se están ejecutando en el momento en que se produce un problema es una parte importante de la resolución de problemas. Estas y otras preguntas sobre el entorno pueden ayudar a identificar la causa raíz del problema:
  • ¿El problema siempre ocurre cuando se realiza la misma tarea?
  • ¿Tiene que producirse una secuencia de sucesos determinada para que surja el problema?
  • ¿Alguna otra aplicación falla al mismo tiempo?

Responder a este tipo de preguntas puede ayudarle a explicar el entorno en el que se produce el problema y a correlacionar las dependencias. Recuerde que aunque varios problemas ocurran más o menos a la vez, no tienen por qué estar relacionados.

¿Se puede reproducir el problema?

Desde el punto de vista de la resolución de problemas, el problema ideal es aquél que se puede reproducir. Generalmente, con los problemas que se pueden reproducir se dispone de más herramientas o procedimientos en el proceso de investigación. En consecuencia, los problemas que se pueden reproducir suelen ser más sencillos de depurar y resolver. No obstante, los problemas que se pueden reproducir pueden tener una desventaja: si el problema tiene un impacto significativo en la empresa, no es deseable que vuelva a producirse. Si es posible, vuelva a crear el problema en un entorno de desarrollo o prueba, que suele ofrecer más flexibilidad y control durante la investigación.
Consejo: Simplificar el escenario para aislar el problema a un componente sospechoso.
Las preguntas siguientes pueden ayudarle a reproducir el problema:
  • Se puede volver a crear el problema en otros entornos de nube. Por ejemplo, si el problema se ha producido en el entorno de Desarrollo, ¿se produce también en el entorno de Producción?
  • ¿Son varios los usuarios o aplicaciones que han encontrado el mismo tipo de problema?