Slack legt sich mit fehlerhaftem Eintrag selbst lahm – Vorsicht bei der DNS-Änderung
Am Freitagmorgen gibt es immer noch Verbindungsprobleme zum vorwiegend in Unternehmen beliebten Messenger Slack, der es erlaubt, Arbeitskräfte flexibel miteinander zu vernetzen. Betroffene können schlicht keine Verbindung zur Plattform herstellen. Die Apps bleiben teils leer, zeigen Fehlermeldungen oder senden Nachrichten einfach nicht ab.
QS-Management gone wild: Slack ändert DNS-Eintrag und macht dabei offenbar einen Fehler
Wie Slack behauptet, sind lediglich unter ein Prozent aller Nutzenden betroffen. Das würde bei rund zwölf Millionen Accounts immerhin um die 120.000 Konten betreffen. Dabei scheinen die Probleme aber nicht weltweit gleichmäßig verteilt zu sein. In Deutschland scheinen deutlich mehr Konten Schwierigkeiten zu haben als etwa in den USA.
Wie Slack inzwischen ermittelt hat, ist eine fehlerhafte Änderung an den eigenen DNS-Einträgen für das Problem verantwortlich. Offenbar hat Slack seinen DNS-Eintrag angepasst und dabei etwas falsch gemacht. Man könnte an das Wurstfingersyndrom denken, bestätigt ist das aber nicht.
Der DNS-Eintrag, also der Eintrag in den weltweiten Datenbanken, die einen Website-Namen einer IP-Adresse zuordnen, ist indes von vitaler Bedeutung. Ist er falsch, kann der Client eines SaaS (Software-as-a-Service) wie Slack den eigenen Server nicht mehr finden.
Und die Funktionsweise des DNS begünstigt einen längeren Ausfall. Denn DNS-Einträge werden weltweit gespiegelt. Eine Änderung an einem Eintrag im eigenen DNS-Server wirkt also nicht unmittelbar weltweit. Vielmehr rollt die Änderung in einem Zeitfenster von bis zu 72 Stunden aus. Maximal so lange kann es also dauern, bis eine Änderung weltweit gleichermaßen aktiv ist, wenn auch über die 72 Stunden bereits immer weitere Teile des Internet mit den aktualisierten Daten werden arbeiten können.
Funktionsweise des DNS-Systems weltweit begünstigt Probleme
Passiert nun ein Fehler, wie offenbar im Falle Slacks, und bleibt der vorerst unbemerkt, kann er sich weltweit propagieren, also in die DNS-Server schreiben. Wird er erkannt und behoben, dauert es wieder seine Zeit, bis alle Einträge korrekt synchronisiert sind.
Dazu passt, dass Slack vorschlägt, Nutzende mögen doch ihre DNS-Serverbetreiber bitten, die Einträge proaktiv zu löschen. Alternativ könnten die Google-DNS-Server für die Namensauflösung über die Router, etwa die eigene Fritzbox, eingetragen werden, weil die bereits aktuell sind. Ist beides nicht gewünscht oder möglich, rät Slack, immer wieder die Tastenkombination Strg+R zu drücken, um den Client zu immer neuen Verbindungsversuchen zu zwingen.
Da kann man mal sehen, was für massive Auswirkungen relativ schnell passierte Nachlässigkeiten im Zweifel nach sich ziehen können. Slack jedenfalls bittet vielmals um Entschuldigung.