Auf Knopfdruck das IT-Infrastrukturmonitoring migrieren und modernisieren: Ganz so einfach ist es zwar nicht, mit guter Planung gelingt eine Umstellung von Nagios zu Check_MK aber binnen weniger Tage. Das zeigte sich zum Beispiel im vergangenen Jahr bei einem bayerischen Bautechnikunternehmen mit über 1.000 Mitarbeitern. Das Ziel des Projekts war es, das Monitoring-Tool „Nagios“ durch das moderne und leistungsfähige Tool „Check_MK“ zu ersetzen. Die LIS AG unterstützte hierbei in der Planung, Durchführung und Inbetriebnahme von Check_MK. Der laufende Betrieb sollte später von internen Administratoren des Kunden übernommen werden.
Das Projekt wurde in vier Phasen aufgeteilt.
Erste Phase – Anforderungsanalyse
Ein Workshop beim Kunden vor Ort leitete das Projekt ein. In diesem wurden die Funktionalitäten der aktuell laufenden Nagios-Installation erfasst, sowie die Erwartungen an das künftige System besprochen. Ein beim Kunden zu diesem Zweck vorab installiertes Check_MK-System unterstützte den Prozess zur Veranschaulichung bestimmter Features und Vorgehensweisen. Die Ergebnisse der ersten Phase wurden zusammengefasst und dienten als Grundlage für die zweite Phase.
Zweite Phase – Installation sowie Migration zu Check_MK
In dieser Phase wurde die aktuellste Version von Check_MK (damals 1.5.0) auf einem CoreBiz NUK, virtualisiert auf VMware, installiert und konfiguriert. Anschließend hat ein LIS-Consultant die Agenten auf den zu überwachenden Systemen (Windows, Linux, MacOS) ausgerollt. Durch die bereits über 1.500 vorhandenen Check_MK Plugins, konnten die installierten Agenten bereits einen Großteil der Hardware-Komponenten und Dienste überwachen. Alle anderen Netzwerkkomponenten wie Switches, Hubs, Router, Drucker und weitere wurden via SNMP an das Monitoring-System angebunden.
Innerhalb dieser Phase arbeitete die LIS AG weiterhin eng mit den Systembetreuern des Kunden zusammen, sodass diese bis zum Ende des Projekts ein gutes Verständnis entwickeln konnten, um die Betreuung im Nachhinein im operativen Betrieb zu übernehmen.
Dritte Phase – Polishing und Inbetriebnahme
Anschließend passte der LIS-Consultant, gemeinsam mit den Systembeteuern, die Schwellwerte einiger Dienste an und löste im Testbetrieb auftretende Probleme. Ein typischer Fall ist das Anpassen von Schwellwerten bei der Auslastung von Festplatten oder Filesystemen. Per Default warnt Check_MK bereits bei 80% Füllstand. Bei kleineren Filesystemen von beispielsweise 100 GB kann das sinnvoll sein, bei größeren Systemen im TerraByte-Bereich haben sich andere Schwellwerte bewährt. So stehen dem Admin bei den 100 GB lediglich 20 GB zu Verfügung, hingegen im anderen Fall noch 2 TB. Somit ist in der Regel genügend Spielraum vorhanden. Die auf den Systemen eingerichteten Parameter sind aufgrund unterschiedlicher Rahmenbedingungen stets individuell zu betrachten.
Vierte Phase – Operativer Betrieb
Seit Check_MK in Betrieb genommen wurde, betreut die LIS AG im Rahmen eines 2nd-Level Supportvertrages den Kunden bei Problemen oder Anpassungen von Check_MK.
Fazit
Im Vergleich zu Nagios kann Check_MK deutlich mehr Informationen auslesen und überwachen. Daher ist die Migration oft tatsächlich nur eine Installation von Check_MK, da die Agenten bereits alle zuvor mit Nagios überwachten Komponenten abdecken. Das Projekt hat mit der Prüfung von Nagios, der Installation und Anpassung von Check_MK sowie der Schulung der Mitarbeiter des Bautechnikunternehmens insgesamt 35 Stunden beansprucht. Der anfallende Aufwand kann vorab nur schwer abgeschätzt werden. Er hängt von vielen Randbedingungen ab, unter anderem, wie intensiv ein Unternehmen seine Umgebung überwachen möchte und ob Mitarbeiter zu schulen sind. Von der Grundinstallation bis zur Inbetriebnahme einer Check_MK Instanz werden in der Regel ein bis zwei Arbeitstage benötigt.
Falls Sie an Check_MK interessiert sind, können Sie uns gerne eine Anfrage an sales@linux-ag.com senden. Auch bei Interesse an einer Livedemo können Sie gerne auf uns zukommen.