Identificación de problemas en el entorno de nube
La resolución de problemas es un enfoque sistemático para solucionar un problema. El objetivo es determinar por qué algo deja de funcionar de la forma esperada y cómo resolver el problema.
Las respuestas a estas preguntas generalmente conducen a una buena descripción del problema, y esta es la mejor forma de iniciar el proceso de resolución del mismo.
¿Cuáles son los síntomas del problema?
¿Cuál es el problema?Puede parecer una pregunta muy directa; no obstante, puede desglosarla en varias preguntas más orientadas que creen una imagen más descriptiva del problema. Estas preguntas pueden ser:
- ¿Quién, o qué, informa del problema?
- ¿Cuáles son los códigos de error y los mensajes?
- ¿Cómo ha fallado el sistema? Por ejemplo, ¿es un bucle, se ha colgado, se ha bloqueado, es una degradación del rendimiento o es un resultado incorrecto?
- ¿Cuál es el impacto empresarial del problema?
¿Dónde se ha producido el problema?
No siempre es sencillo determinar dónde se origina el problema, pero es uno de los pasos más importantes a la hora de resolver un problema. Puede haber muchas capas tecnológicas entre los componentes fallidos y los que originan el informe del problema.
- Si tiene más de una suscripción en la nube, ¿qué suscripciones se ven afectadas?
- ¿Qué entornos de servidor de flujos de trabajo se ven afectados, por ejemplo Desarrollo o Producción?
- ¿Qué aplicaciones se ven afectadas?
- ¿A qué servicios llama la aplicación y cuál es su versión de software y su información de hardware?
¿Cuándo se ha producido el problema?
Desarrolle una cronología detallada de los sucesos que dan lugar a la anomalía, especialmente en aquellos casos en que el problema se produce sólo una vez. La manera más sencilla de hacerlo es trabajando en sentido inverso: empiece a la hora en que se informó del error (de la forma más precisa posible, incluso hasta los milisegundos) y trabaje en sentido inverso por las anotaciones cronológicas e información disponibles. Habitualmente, sólo tiene que buscar hasta el primer suceso sospechoso que encuentre en un archivo de registro de diagnóstico; sin embargo, esto no es siempre sencillo y requiere cierta práctica. Saber cuándo dejar de mirar es especialmente difícil cuando hay implicadas varias capas de tecnología y cuando cada una de ellas tiene su propia información de diagnóstico.
- ¿El problema ocurre sólo en un momento concreto del día o de la noche?
- ¿Con qué frecuencia se repite el problema?
- ¿Cuál es la secuencia de eventos que conduce al momento en que se comunicó el problema?
- ¿Sucede el problema después de un cambio de entorno como, por ejemplo, al actualizar o instalar software o hardware?
Las respuestas a estos tipos de preguntas le pueden ayudar a proporcionar un marco de referencia en que se pueda investigar el problema.
¿En qué condiciones se ha producido el problema?
- ¿El problema siempre ocurre cuando se realiza la misma tarea?
- ¿Tiene que producirse una secuencia de sucesos determinada para que surja el problema?
- ¿Alguna otra aplicación falla al mismo tiempo?
Responder a este tipo de preguntas puede ayudarle a explicar el entorno en el que se produce el problema y a correlacionar las dependencias. Recuerde que aunque varios problemas ocurran más o menos a la vez, no tienen por qué estar relacionados.
¿Se puede reproducir el problema?
ideales aquél que se puede reproducir. Generalmente, con los problemas que se pueden reproducir se dispone de más herramientas o procedimientos en el proceso de investigación. En consecuencia, los problemas que se pueden reproducir suelen ser más sencillos de depurar y resolver. No obstante, los problemas que se pueden reproducir pueden tener una desventaja: si el problema tiene un impacto significativo en la empresa, no es deseable que vuelva a producirse. Si es posible, vuelva a crear el problema en un entorno de desarrollo o prueba, que suele ofrecer más flexibilidad y control durante la investigación.
- Se puede volver a crear el problema en otros entornos de nube. Por ejemplo, si el problema se ha producido en el entorno de Desarrollo, ¿se produce también en el entorno de Producción?
- ¿Son varios los usuarios o aplicaciones que han encontrado el mismo tipo de problema?