Identification et résolution des problèmes et support technique
L'identification des problèmes est une approche systématique de résolution des problèmes. Elle détermine les raisons pour lesquelles l'unité ne fonctionne pas correctement et explique la démarche à suivre pour corriger le problème.
La première étape du processus d'identification des problèmes consiste à décrire le problème dans son intégralité. Les descriptions de problème représentent pour vous-même et pour le support technique IBM le point de départ qui permettra de déterminer la cause du problème. Posez-vous plusieurs questions élémentaires :
- Quels sont les symptômes du problème ?
- Où le problème se produit-il ?
- Quand le problème se produit-il ?
- Dans quelles conditions le problème se produit-il ?
- Le problème peut-il être reproduit ?
La réponse à ces questions débouche en général sur une description adéquate du problème, ce qui constitue le meilleur point de départ pour démarrer sa résolution.
Quels sont les symptômes du problème ?
Lorsque vous commencez à décrire un problème, la question qui s'impose la plus spontanément est "Quel est le problème ?" Elle peut paraître facile, mais vous pouvez la diviser en plusieurs questions plus précises qui permettent d'avoir une idée plus détaillée du problème. Ces questions sont les suivantes :
- Par qui ou par quel élément le problème est-il signalé ?
- Quels sont les codes et les messages d'erreur ?
- Quelle est la nature de la panne du système ? Par exemple, s'agit-il d'une boucle, d'un blocage, d'un arrêt total, d'une détérioration des performances ou d'un résultat incorrect ?
Où le problème se produit-il ?
Déterminer l'origine du problème n'est pas toujours facile, mais c'est néanmoins l'une des étapes les plus importantes pour le résoudre. De nombreuses couches technologiques peuvent s'interposer entre les composants signalant le problème et ceux qui sont défectueux. Les réseaux, les disques et les pilotes ne sont que quelques-uns des composants à envisager lorsque vous analysez un problème.
Les questions suivantes vous aident à déterminer l'endroit où se produit le problème et à isoler ainsi la couche incriminée :
- Le problème est-il spécifique à une plateforme ou un système d'exploitation, ou est-il commun à plusieurs plateformes ou systèmes d'exploitation ?
- L'environnement et la configuration en cours sont-ils pris en charge ?
Rappelez-vous que même si le problème est signalé par une seule couche, cela ne signifie pas forcément qu'il provient de cette couche. L'identification de l'origine d'un problème consiste en partie à comprendre l'environnement dans lequel il survient. Prenez quelques instants pour décrire intégralement l'environnement du problème, en précisant notamment le système d'exploitation et la version, tous les logiciels correspondants et leurs versions, ainsi les informations sur le matériel. Confirmez que vous exécutez le système dans un environnement dont la configuration est bien prise en charge. De nombreux problèmes sont souvent dus à des niveaux de logiciels incompatibles qui ne peuvent pas fonctionner ensemble ou n'ont pas été complètement testés ensemble.
Quand le problème se produit-il ?
Elaborez une chronologie détaillée des événements conduisant à une panne, surtout s'il s'agit d'occurrences isolées. Le plus simple consiste à procéder en remontant dans le temps : commencez par la date/heure à laquelle l'erreur a été signalée (aussi précisément que possible, à la milliseconde près) et remontez en arrière en vous aidant des journaux et des informations disponibles. En général, il suffit de remonter jusqu'au premier événement suspect trouvé dans un journal de diagnostic.
Pour élaborer une chronologie détaillée des événements, répondez aux questions suivantes :
- Le problème se produit-il uniquement à une certaine heure du jour ou de la nuit ?
- Quelle est la fréquence du problème ?
- Quelle est la séquence d'événements conduisant au signalement du problème ?
- Le problème se produit-il après une modification d'environnement, par exemple une mise à niveau ou une installation logicielle ou matérielle ?
La réponse à ces questions vous fournit un cadre de référence qui vous permet d'analyser le problème.
Dans quelles conditions le problème se produit-il ?
Le fait de savoir quels sont les systèmes et les applications qui s'exécutent au moment où survient un problème joue un rôle important dans le dépannage. Les questions suivantes concernant votre environnement peuvent vous aider à identifier la cause première du problème :
- Le problème se produit-il toujours lors de l'exécution de la même tâche ?
- Une certaine séquence d'événements se produit-elle toujours avant que le problème survienne ?
- D'autres applications tombent-elles aussi en panne au même moment ?
La réponse à ces questions vous aide à avoir une idée plus claire de l'environnement dans lequel survient le problème et à mettre en corrélation les dépendances éventuelles. Rappelez-vous que même si plusieurs problèmes se sont produits quasiment au même moment, ils ne sont pas forcément liés entre eux.
Le problème peut-il être reproduit ?
Dans le contexte de l'identification des problèmes, un problème idéal est un problème qui peut être reproduit. En effet, il existe en général un arsenal d'outils ou de procédures qui facilitent l'analyse des problèmes reproductibles. Par conséquent, les problèmes que vous pouvez reproduire sont souvent plus faciles à déboguer et à résoudre. Cependant, ils présentent un inconvénient : si leur impact sur votre activité métier est important, vous devez les empêcher de se reproduire. Si possible, recréez le problème dans un environnement de test ou de développement, qui offre en général plus de souplesse et de contrôle pendant l'analyse.
- Le problème peut-il être reproduit sur un système de test ?
- Plusieurs utilisateurs ou applications rencontrent-ils le même type de problème ?
- Le problème peut-il être recréé en exécutant une seule commande, un ensemble de commandes ou une application particulière ?