Downtimes vermeiden: Monitoring-Tools für Webanwendungen im Überblick
Ob eine populäre Unternehmenswebsite, die Tausende Besucher am Tag verzeichnet, ein kritischer SaaS-Dienst, auf den Kunden täglich angewiesen sind, oder eine interne Business-App, ohne die in der Firma nichts läuft: Wer eine wichtige Website betreibt, weiß, dass auch mal was schiefgehen kann – und wie stressig Downtimes werden können. Denn jede Minute, die die Website ausfällt oder die Leistung nachlässt, kann nicht nur Geld kosten, sondern wirkt sich extrem negativ auf die Customer-Experience aus. Betreiber von Webanwendungen müssen daher sicherstellen, dass sie Probleme erkennen, bevor es die Kunden tun. Hier kommen moderne Monitoring-Tools aus der Cloud ins Spiel. Wie viele Ressourcen werden in Spitzenzeiten verbraucht? Wo gibt es Performance-Einbußen? Welche Dienste sind besonders ressourcenhungrig? Wie ausgelastet sind die Datenbankserver? Wo gibt es Optimierungsbedarf? Auf solche kritischen Fragen liefern diese Tools eine Antwort.
Von einfachen Uptime-Monitoring-Lösungen für Einsteiger, die in regelmäßigen Zeitabständen automatisiert überprüfen, ob die Website erreichbar ist, über spezielle Dienste für Anwendungsentwickler, die sich um die Software-Performance kümmern, bis hin zu umfangreichen Plattformen der Enterprise-Klasse, mit denen größere Unternehmen ihre Netzwerke, Server-Infrastrukturen und Webanwendungen zentral überwachen können: Die Angebotspalette ist extrem breit gefächert. Auf den folgenden Seiten präsentieren wir Alternativen aus den Bereichen Website-Monitoring und Application-Performance-Management, kurz APM, die sich durch einfache Einrichtung und durchdachte Funktionen in der Praxis bewährt haben.
Uptime-Monitoring für Einsteiger
Ist die Website überhaupt erreichbar? Es mag banal klingen, aber wenn es um die Überwachung von Webanwendungen geht, dreht sich eigentlich alles um diese eine Frage. Im besten Fall entdeckt man Softwarefehler oder Server-Engpässe, bevor sie zu einem kompletten Anwendungsausfall führen. Doch die Praxis zeigt, dass dies nicht immer gelingt. Die kompletten Ausfälle führender Cloud-Systeme wie Instagram, Whatsapp, Slack oder Skype, die in letzter Zeit immer wieder vorgekommen sind, dienen als Beweis dafür, dass es jeden treffen kann – egal, wie gut das System überwacht und proaktiv geschützt wird.
Vor diesem Hintergrund ist ein Monitoring-Tool, das ständig prüft, ob die Website überhaupt erreichbar ist, unverzichtbar. Sobald es Probleme gibt, wird man per E-Mail, SMS, Telefon, Slack oder Twitter informiert. Das Marktangebot ist hier kaum zu durchschauen: Unzählige Startups und kleine Softwareschmieden bieten Lösungen an. Pingdom, ursprünglich in Schweden entwickelt, konnte sich als einer der führenden Player in diesem Segment positionieren. Das System bietet IT-Administratoren und Softwareanbietern einen einfachen Weg, Server, Websites, Online-Anwendungen, DNS-Dienste, E-Mail-Server und weitere Onlinesysteme professionell zu überwachen. Im Prinzip braucht man nur eine URL beziehungsweise eine IP-Adresse. Nach der einfachen Einrichtung führt das Programm dann Verfügbarkeits-Checks vollständig automatisch in beliebigen Intervallen ab einer Minute aus. Antwortet der Server nicht, wird man unverzüglich per E-Mail, SMS oder Push-Notification benachrichtigt. Dabei kann man auch angeben, aus welchen Standorten die Server-Requests gesendet werden sollen – hilfreich, um regionale Netzwerkprobleme zu entdecken. In der Web-Konsole werden die Monitoring-Statistiken übersichtlich dargestellt.
Ein weiteres, praktisches Feature von Pingdom sind die öffentlichen Status-Seiten. Hier werden wichtige Key-Performance-Indicators (KPI) wie Ladezeit, Verfügbarkeit und Ausfallzeiten in verschiedenen Visualisierungen angezeigt. Diese sind nicht nur dann wichtig, wenn man Service-Level-Agreements, kurz SLA, einhalten muss. Eine Status-Seite kann generell Vertrauen bei den Nutzern schaffen, denn jeder kann jederzeit nachsehen, wie stabil das System läuft. Pingdom kostet ab rund 13 Euro im Monat (bis zu zehn Checks aus mehreren Standorten). Zu den Pingdom-Alternativen zählen Uptime, Testomato, Leankoala, Statuspal, Freshping und Status Cake.
All-in-One-Lösungen für Startups und KMU
Eine Nachricht zu erhalten, dass die Website nicht erreichbar ist, ist erst der Anfang. Sobald der Alarm ausgelöst wurde, müssen sich die Admins auf die Suche nach der Fehlerquelle machen. Wo liegt der Flaschenhals im Netzwerk? Welche Komponente ist Verursacher? Wie viele Nutzer sind betroffen? Was ist zu tun, um die Website wieder online zu bringen? Im Ernstfall müssen solche Fragen so schnell wie möglich beantwortet werden. Und das, während die Uhr tickt und sich immer mehr Kunden beschweren. In solchen Stresssituationen wird man für jedes Tool dankbar sein, das bei der Fehlersuche weiterhilft. Hier kommen ganzheitliche Überwachungsdienste wie Monitis und Site 24×7 ins Spiel. Sie monitoren nicht nur die Verfügbarkeit von Websites und Anwendungen, sondern liefern auch Einblicke in die Performance-Metriken von Server- und Infrastrukturkomponenten, darunter auch CPU-Last, Speicherplatz und Traffic.
Monitis
Bei Monitis handelt es sich um eine umfassende Alternative, die dank ihres modularen Aufbaus und eines flexiblen Preismodells sowohl Einsteiger als auch Profis adressiert. Nach der Anmeldung kann man auf dem Web-Dashboard das Monitoring nicht nur von Websites, sondern auch von MySQL-, FTP- oder E-Mail-Servern zentral konfigurieren. Während Einsteiger den Status von Webservern im Browser monitoren können, stehen Profis weiterführende Features wie etwa Server-Überwachung (CPU, RAM, Prozesse et cetera), eine öffentliche API (Application-Programming-Interface) für benutzerdefinierte Verfügbarkeitschecks sowie Real-User-Monitoring zur Verfügung. Letzteres ermöglicht Unternehmen die Erfassung von Daten zur Leistung ihrer Website, wie sie durch tatsächliche Nutzer erlebt wird.
Site 24×7
Eine leistungsfähige Alternative zu Monitis, die ebenfalls über zahlreiche Funktionsmodule verfügt, ist Site 24×7. Der Service wird vom indischen Softwarehersteller Zoho angeboten, der sich mit populären webbasierten Businesslösungen, allen voran Zoho CRM und Zoho Office, in der Branche einen Namen gemacht hat. Mit diesem Überwachungsservice, der auf Deutsch erhältlich ist, lassen sich sowohl einfache Websites als auch Webanwendungen und Hardwaresysteme auf professionelle und flexible Art und Weise überwachen. Unter den zahlreichen Features, die das Programm zu bieten hat, glänzen zum Beispiel die Hardware-Überwachung von Servern über SNMP (Simple-Network-Management-Protocol) sowie die automatische Überprüfung der Leistung von Java-, .NET- und Ruby-on-Rails-Applikationen. Zudem ermöglicht es das Tool, ausführliche Berichte zu erstellen, die sich nach eigenen Anforderungen anpassen und mit Kollegen oder Vorgesetzten einfach teilen lassen.
Application-Performance-Management
Führende Softwareanbieter sind nicht nur an der Überwachung ihrer Server-Infrastruktur interessiert, sondern wollen auch jederzeit genau wissen, wie es um die Performance ihrer Webanwendungen steht – und zwar auf Code-Ebene. So lassen sich Fehler häufig entdecken, bevor sie skalieren und komplette Ausfälle verursachen. Produkte wie Monitis oder Site 24×7 reichen dabei nicht immer aus. Bei der Überwachung von Webanwendungen auf Code-Ebene kommen weiterführende APM-Lösungen wie Scout, Datadog, Dynatrace und New Relic ins Spiel.
Datadog
2010 in New York gestartet, versetzt Datadog Unternehmen in die Lage, die Performance und Erreichbarkeit von Servern, Online-Anwendungen, virtuellen Maschinen, Datenbanken und weiteren Cloud-Komponenten auf einem einzigen, zentralen Web-Dashboard zu überwachen. Anders als bei den schlanken Uptime-Monitoring-Tools ist beim APM die Installation von Software-Agenten beziehungsweise SDK (Software-Development-Kit) auf den zu überwachenden Systemen erforderlich. Diese erfassen wichtige Metriken automatisch an der Quelle und senden sie an Datadog zur Auswertung und Analyse. Dabei punktet das Programm mit zahlreichen Integrationsmöglichkeiten. So stehen Plugins für Datenbanken wie MySQL, MongoDB und PostgreSQL oder Anwendungsserver wie etwa Tomcat und JBoss ebenso bereit wie für Programmiersprachen wie .NET und Java. Insgesamt unterstützt Datadog über 350 native Integrationen. Anwender können die Leistung ihrer Systeme zentral im Browser überwachen. Dabei lassen sich Datenvisualisierungen und Dashboards individuell nach eigenen Bedürfnissen zusammenstellen. Ebenfalls praktisch: Unternehmen, die AWS (Amazon Web Services), Google Cloud oder Azure nutzen, können ihre Accounts mit Datadog auf einfache Weise integrieren. Sämtliche Metriken aus den eingesetzten Cloud-Infrastruktur-Komponenten zeigt Datadog dann automatisch an.
Scout
Einer der wesentlichen Vorteile von Scout, einer in San Francisco entwickelten und auf der Programmiersprache Ruby basierten Lösung, dürfte ihre einfache Installation sein. Ein paar Konsolenbefehle reichen nämlich aus, um kritische Leistungsmetriken von Webanwendungen automatisiert erfassen zu können. Unterstützt werden Web-Apps, die mit Ruby, Elixir oder Python entwickelt sind. Dabei müssen keine Software-Agenten auf dem Server konfiguriert werden. Entwickler müssen nur die Scout-Library in ihre Projekte integrieren. Sämtliche Statistiken, die Scout erfasst, werden auf dem Web-Dashboard in übersichtlichen Reports visualisiert – in Echtzeit. Das heißt, Entwickler können beispielsweise jederzeit im Browser sehen, wie viele Anfragen die Datenbankserver gerade zu bewältigen haben, welche Querys zu langsam sind, wie viel Arbeitsspeicher im Moment genutzt wird und vieles mehr.
High-end-Lösungen
Dynatrace
Bei Dynatrace handelt es sich um eine leistungsstarke APM-Plattform, die auf künstlicher Intelligenz basiert und dafür konzipiert ist, komplexe Cloud-, On-Premise- und Hybrid-Infrastrukturen zu überwachen. Nach der Einrichtung von Software-Agenten auf den zu überwachenden Systemen werden sämtliche relevante Metriken auf allen Systemebenen – von der Infrastruktur- über die Server- bis hin zur Anwendungsschicht – vollständig automatisiert erfasst. Auf einem Web-Dashboard können Systemadministratoren dann sämtliche Ressourcen zentral in Echtzeit überwachen. Dynatrace bietet einen detaillierten Einblick in die Leistung der eingesetzten Datenbanken, Anwendungs- und HTTP-Server sowie der Software selbst. Neben traditionellen Web-Stacks unterstützt die Lösung auch moderne Devops-Umgebungen und Microservice-Infrastrukturen.
New Relic
In direkter Konkurrenz zu Dynatrace und Scout steht New Relic. Der aus San Francisco stammende Cloud-Service ist seit dem Jahr 2014 an der New Yorker Börse notiert und zählt zu den führenden Monitoring-Diensten für geschäftskritische Applikationsumgebungen, die der Markt zu bieten hat. Dabei wird die umfassende Analyse von Web- und Mobile-Anwendungen in den Fokus gestellt. Der Dienst unterstützt so gut wie alle populären Web-Technologien, darunter Programmiersprachen wie Java, Ruby, .NET, PHP und Python. Zu den Hauptfunktionen der Software zählen unter anderem Java-Profiling, Datenbank-Performance-Monitoring, Deployment-History sowie ausführliche Downtime- und Traffic-Berichte. Weitere High-End-Lösungen, die mit New Relic, Scout oder Dynatrace konkurrieren, sind beispielsweise Appdynamics, das seit 2017 zu Cisco gehört, und Appoptics des Anbieters Solarwinds.
Fazit
Kommerzielle Websites und -anwendungen sollten immer überwacht werden. Wenn es um die Website-Überwachung geht, lautet die Frage also nicht ob, sondern wie. Für kleine Webprojekte wie Blogs oder Firmenwebsites reichen schlanke Monitoring-Tools wie Pingdom, Uptime oder Statuspal in der Regel aus. Unternehmen, die komplexe Webanwendungen betreiben, werden eher auf weiterführende Lösungen wie Site 24×7 oder Monitis zurückgreifen, um Performance-Engpässen und Fehlern auf die Spur zu kommen. Für Unternehmen mit gehobenen Ansprüchen lassen APM-Suites aus dem High-End-Bereich keine Wünsche offen. Welche Monitoring-Lösung die richtige ist, lässt sich pauschal nicht sagen: Die Auswahl hängt vor allem davon ab, wie komplex die zu überwachende Anwendungsinfrastruktur ist und welche Konsequenzen Downtimes verursachen können. Eines ist jedoch sicher: Kein Softwareanbieter sollte heute die Leistung und Verfügbarkeit seiner Webanwendungen vernachlässigen. Ein passendes Monitoring-Tool ist dabei unerlässlich.
Ich vermisse noch Dinge wie netdata und viele der klassischen Lösungen aller Nagios/Icinga usw. Gerade in autoskalierten Cloudumgebungen lässt sich ersteres recht schön verteilen.
CheckMK, Pingdom oder Instana fehlen genauso
oops! Pingdom ist natürlich genannt worden.
Was auch fehlt ist ThousandEyes. Hier wird auch ein Aspekt dargestellt, der bei den anderen Lösungen fehlt: Nämlich die Visualisierung des Netzwerkverkehrs, End-to-End. Eigentlich geht es doch immer als Erstes darum zu sehen, ob es ein internes oder externes Problem ist.
Als europäischer Anbieter hätten wir uns gefreut, bei dem Test ebenfalls berücksichtigt zu werden.
Mit Data Centern in Europa, einem Monitoring Netzwerk von weltweit über 200 Standorten sowie einer Vielzahl an Monitoring Arten wie Uptime, Ladezeit, Webanwendungen, komplexe API´s und eine Reihe weiterer bieten wir für viele Unternehmen eine attraktive Lösung.
Alarmierung, detaillierte Informationen aus dem Monitoring und umfangreiches Reporting sind ebenfalls Teil der Lösung.
Gerne sind Interessenten zu einem kostenlosen, unverbindlichen 30-tägigen Test eingeladen.
Wer es „made in germany“ mag, wegen DSGVO und so, kann sich auch mal Leankoala und/oder koality.io