Availability-Management

Zielsetzung des Availability-Managements ist es, kostengünstig ein bestimmtes Verfügbarkeitsniveau für alle IT-Services zu gewährleisten. Das Availability-Management stellt eine wichtige Komponente dar, um die vom Service-LevelManagement ausgehandelten SLAs einzuhalten. In den SLAs können allerdings neben Anforderungen an die Verfügbarkeit auch nahezu beliebige weitere Eigenschaften eines Services festgelegt sein, unter anderem beispielsweise Qualitätskriterien. Für die Verfügbarkeit wird meist ein Schwellwert festgelegt der nicht über- beziehungsweise unterschritten werden darf. Für das Monitoring erstellt man zusätzlich weitere darüber beziehungsweise darunterliegende Warnschwellen, die darauf hinweisen, dass eine Verletzung der zugesicherten Service-Level droht. Im diesem Teilbereich des Monitoring stellt vor allem Nagios [5] eine sehr ausgereifte und verbreitete Lösung dar, die mit den meisten kommerziellen Anbietern mithalten kann und sich bereits in vielen Unternehmen im professionellen Einsatz bewährt.

Nagios ist ein leistungsfähiges Werkzeug zur Überwachung von komplexeren IT-Strukturen. Es lassen sich sowohl Dienste als auch Infrastrukturkomponenten sehr einfach beobachten. Da Nagios ein Plugin-Konzept verfolgt, ist es sehr einfach um selbstgeschriebene Komponenten zu erweitern. Eine aktive Community nutzt diesen Vorteil auch ausgiebig aus, sodass im Laufe der Zeit Nagios-Plugins für sehr viele Einsatzfälle entstanden sind. Außerdem bietet Nagios eine Eskalationsstrategie, die es erlaubt, statusabhängig bestimmte Aktionen auszulösen, also beispielsweise den Service-Level- oder Availability-Manager auf die bevorstehende Verletzung des SLA hinzuweisen, unter Umständen bevor der Anwender etwas mitbekommt.

Problem-Management

Die Zielsetzung des Problem-Managements besteht in der Lokalisierung, Dokumentation und Verfolgung von strukturellen Störungen und in deren (vorübergehender) Lösung. Um dies zu erreichen, führt man sowohl proaktive als auch reaktive Maßnahmen durch. Proaktiv versucht das Problem-Management unter anderem, durch Monitoring potenzielle Faktoren für Störungen zu identifizieren, bevor die eigentlichen Störungen überhaupt auftreten. Zu den Werkzeugen für diese Art der Überwachungen zählen die schon erwähnten Tools MRTG, Cacti und Nagios. Reaktiv wird unter anderem Monitoring durchgeführt, um bekannte Fehler zu überwachen oder die Untersuchung von Störungen zu erleichtern. Dafür eignen sich auch zahlreiche Linux-Bordwerkzeuge.

comments powered by Disqus

Artikel der Woche

Eigene Registry für Docker-Images

Wer selber Docker-Images herstellt, braucht auch eine eigene Registry. Diese gibt es ebenfalls als Docker-Image, aber nur mit eingeschränkter Funktionalität. Mit einem Auth-Server wird daraus ein brauchbares Repository für Images. (mehr)
Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Konfigurationsmanagement

Ich konfiguriere meine Server

  • von Hand
  • mit eigenen Skripts
  • mit Puppet
  • mit Ansible
  • mit Saltstack
  • mit Chef
  • mit CFengine
  • mit dem Nix-System
  • mit Containern
  • mit anderer Konfigurationsmanagement-Software

Google+

Ausgabe /2019