Im täglichen IT-Betrieb kommt es immer wieder zu Ausfällen. Um die Ursache eines Problems zu finden, greifen Administratoren auf die Logs von Hard- und Software zurück. Je nachdem, wie ausführlich ein Dienst oder Treiber seine Tätigkeit protokolliert, kann ein Verwalter in den Logs die gesuchten "famous last words" des Prozesses vor dem Absturz vorfinden und daraus auf die Fehlerursache schließen.
Doch je mehr die IT-Installationen in die Cloudära voranschreiten, desto komplexer gestaltet sich die Loganalyse. Eine monolithische Anwendung, die Datenhaltung, Applikations- und Präsentationslogik und Benutzerinteraktionen unter einem Dach vereint, pflegt ein einzel- nes, zentrales Logbuch. Das vereinfacht in der Regel dem Administrator die Fehlersuche – allerdings rechtfertigt dieser eine kleine Vorteil kaum mehr die Investition in Monolithen.
Agile Infrastrukturen bestehen aus vielen miteinander kommunizierenden Microservices. Der Präsentations-Layer wie etwa ein Webfrontend läuft unter Umständen an einem anderen Ort als die Datenhaltung oder die eigentliche Business-Logik der Anwendung. Und zwischen den Modulen arbeiten wiederum andere Tools und Dienste, die die Kommunikation und Service-Konfiguration gewährleisten.
Die Suche nach einem Fehler zieht sich in so einer Umgebung durch eine ganze Reihe von Logs. Läuft ein Service zu langsam oder stockend, geht es ihm selbst möglichweise gar nicht schlecht. Vielleicht hat ja die Datenbank, mit der er kommuniziert, Probleme? Vielleicht geht es dieser aber auch prinzipiell gut, aber die Storage-LUN, auf der sie die Table-Spaces sichert, kämpft mit einem Problem des Raid-Controllers. Ausfälle einer Hardwarekomponente treten somit erst bei der Anwendung an einer ganz anderen Stelle in der IT-Infrastruktur zu Tage. Der alleinige Blick in die Applikations-Logs wird den wahren Fehler nicht zeigen.
Der komplette Artikel ist nur für Abonnenten des ADMIN Archiv-Abos verfügbar.