Verfahren für die Fehlersuche bei Problemen

Die Fehlersuche ist ein systematischer Ansatz zur Lösung eines Problems. Mit der Fehlersuche soll festgestellt werden, weshalb etwas nicht wie erwartet funktioniert und wie das Problem gelöst werden kann.

Der erste Schritt des Fehlersuchprozesses besteht in der vollständigen Beschreibung des Problems. Eine gute Problembeschreibung ist wichtig, damit Sie und der zuständige IBM Technical Support-Mitarbeiter wissen, wo die Ursache des Problems zu suchen ist. Unter anderem müssen Sie sich in diesem Schritt einige Grundsatzfragen stellen:

  • Wie lauten die Symptome des Problems?
  • Wo tritt das Problem auf?
  • Wann tritt das Problem auf?
  • Unter welchen Bedingungen tritt das Problem auf?
  • Kann das Problem erneut generiert werden?

Normalerweise liefern die Antworten auf diese Fragen bereits eine gute Beschreibung des Problems, was dann wiederum eine Problemlösung ermöglichen kann.

Wie lauten die Symptome des Problems?

Bei der Beschreibung eines Problems stellt sich zunächst die offensichtliche Frage "Worin liegt das Problem?" Diese Frage erscheint möglicherweise etwas zu allgemein, allerdings können Sie diese Frage in einige präzisere Einzelfragen unterteilen, die möglicherweise eine genauere Vorstellung des Problems liefern. Im Folgenden werden beispielhaft einige dieser Fragen genannt:

  • Von wem oder was wurde das Problem gemeldet?
  • Wie lauten die Fehlercodes und Nachrichten?
  • Wie schlägt das System fehl? Handelt es sich beispielsweise um eine Endlosschleife, eine Blockierung, einen Absturz, eine Leistungsbeeinträchtigung oder um ein falsches Ergebnis?

Wo tritt das Problem auf?

Die Ermittlung der Fehlerquelle ist nicht immer einfach, ist jedoch einer der wichtigsten Schritte beim Lösen eines Problems. Zwischen der Meldung und den fehlschlagenden Komponenten können viele Technologieebenen liegen. Bei der Untersuchung von Problemen müssen neben vielen weiteren Faktoren beispielsweise Netzwerke, Datenträger und Treiber überprüft werden.

Mithilfe der folgenden Fragen können Sie sich darauf konzentrieren, wo das Problem auftritt und so die Problemebene eingrenzen:

  • Tritt das Problem nur bei einer bestimmten Plattform oder einem bestimmten Betriebssystem auf, oder wurde es auf mehreren Plattformen oder Betriebssystemen festgestellt?
  • Werden die derzeitige Umgebung und Konfiguration unterstützt?
  • Tritt das Problem bei allen Benutzern auf?
  • (Bei Installationen an mehreren Standorten.) Tritt das Problem an allen Standorten auf?

Das Problem muss nicht notwendigerweise in der Ebene seine Ursache haben, die das Problem meldet. Damit Sie bestimmen können, wo das Problem seinen Ursprung hat, müssen Sie die Umgebung kennen, in der es auftritt. Nehmen Sie sich die Zeit, die Problemumgebung ausführlich zu beschreiben, einschließlich des Betriebssystems und der Version, der gesamten entsprechenden Software mit allen Versionen und der Hardwaredaten. Vergewissern Sie sich, dass Sie das Produkt in einer Umgebung mit einer unterstützten Konfiguration ausführen; häufig sind Probleme auf nicht kompatible Softwareversionen zurückzuführen, die nicht gemeinsam ausgeführt werden können oder deren gemeinsame Ausführung nicht umfassend getestet wurde.

Wann tritt das Problem auf?

Arbeiten Sie einen detaillierten Zeitplan der Ereignisse aus, die zu einem Fehler führen - dies gilt insbesondere in Fällen, die nur einmalig auftraten. Am einfachsten arbeiten Sie sich hierfür Schritt für Schritt zurück: Beginnen Sie bei dem Zeitpunkt, zu dem der Fehler gemeldet wurde (so genau wie möglich, unter Umständen sogar bis auf die letzte Millisekunde), und suchen Sie nach einer Häufung von Fehlern in den Protokollen um diesen Zeitpunkt herum. Konzentrieren Sie sich auf den frühesten der Fehler in der betreffenden Fehlerhäufung. Achten Sie sorgfältig darauf, dass Sie nicht so weit in der Zeit zurückgehen, dass Sie nach einer Fehlerhäufung für einen vorherigen Fehler suchen.

Beantworten Sie folgende Fragen, um einen ausführlichen Zeitplan der Ereignisse auszuarbeiten:

  • Tritt das Problem nur zu einer bestimmten Tages- oder Nachtzeit auf?
  • Wie häufig tritt das Problem auf?
  • Welche Ereignisfolge findet bis zu dem Zeitpunkt statt, zu dem das Problem gemeldet wurde?
  • Tritt das Problem nach einer Umgebungsänderung auf, beispielsweise wenn Software oder Hardware aufgerüstet oder installiert wurde?

Die Beantwortung derartiger Fragen ermöglicht einen Referenzrahmen, innerhalb dessen das Problem untersucht werden kann.

Unter welchen Bedingungen tritt das Problem auf?

Für die Fehlersuche ist es wichtig, zu wissen, welche Systeme und Anwendungen ausgeführt wurden, als das Problem auftrat. Diese Fragen zu Ihrer Umgebung können bei der Bestimmung der Fehlerursache hilfreich sein:

  • Tritt das Problem immer auf, wenn dieselbe Task ausgeführt wird?
  • Muss eine bestimmte Ereignisfolge ablaufen, damit das Problem auftritt?
  • Schlagen zur selben Zeit auch andere Anwendungen fehl?

Durch die Beantwortung dieser Art von Fragen kann die Umgebung, in der das Problem auftritt, verdeutlicht werden, und eventuelle Abhängigkeiten lassen sich möglicherweise erkennen. Denken Sie daran, dass Probleme, die ungefähr zum selben Zeitpunkt auftraten, nicht unbedingt miteinander in Zusammenhang stehen müssen.

Kann das Problem erneut generiert werden?

Für die Fehlersuche ist ein erneut generierbares Problem ideal. Für gewöhnlich stehen für erneut generierbare Probleme mehr Tools oder Prozeduren für die Untersuchung zur Verfügung. Folglich sind erneut generierbare Probleme häufig einfacher zu testen und zu lösen. Erneut generierbare Probleme können jedoch auch von Nachteil sein: Wenn das Problem einen entscheidenden Einfluss auf die Geschäftsabläufe hat, sollte es nicht erneut auftreten. Falls möglich, generieren Sie das Problem erneut in einer Test- oder Entwicklungsumgebung, die für gewöhnlich mehr Flexibilität und Kontrolle während der Untersuchung bietet.

  • Kann das Problem auf einem Testsystem erneut generiert werden?
  • Tritt dieselbe Art von Problem bei mehreren Benutzern bzw. Anwendungen auf?
  • Kann das Problem durch die Ausführung eines einzelnen Befehls oder einer Befehlsgruppe oder durch die Ausführung einer bestimmten Anwendung erneut generiert werden?