Microsoft Office und Teams: Das war der Grund für die Störung
Gute fünf Stunden konnten User am 20. Juli nicht auf Microsoft Office und Teams zugreifen – weltweit, besonders spürbar jedoch in der Asia/Pacific-Region, da die Störung in deren Geschäftszeiten fiel. Nach und nach kommt jetzt Licht ins Dunkel, was den Ausfall des Services verursacht haben könnte.
Wie das Portal Bleeping Computer mitteilte, ist die Störung durch eine Neuinstallation in einem Datenzentrum ausgelöst worden. Demnach hat eine fehlerhafte Bereitstellung des Enterprise Configuration Service (ECS) zu kaskadenartigen Ausfällen und Verfügbarkeitsproblemen geführt.
Codefehler im ECS führte zu weltweitem Ausfall
Der Basis-Dienst ECS ermöglicht es Microsoft-Diensten, dynamische Änderungen über mehrere Dienste und Funktionen hinweg sowie gezielte wie spezifische Konfigurationen pro Mandant oder Benutzer vorzunehmen. „Eine Bereitstellung im ECS-Dienst enthielt einen Codefehler, der sich auf die Abwärtskompatibilität mit Diensten auswirkte, die ECS nutzen. Das Nettoergebnis war, dass für Dienste, die ECS nutzen, falsche Konfigurationen an alle Partner zurückgegeben wurden“, zitiert Bleeping Computer einen vorläufigen Bericht von Microsoft.
Das Ausmaß der Auswirkungen war demnach davon abhängig, „wie die einzelnen Microsoft-Dienste die von ECS bereitgestellte fehlerhafte Konfiguration nutzten“, heißt es weiter. In vielen Fällen stürzten Dienste wie Teams ab, in der Folge weiteten sich die Probleme auf weitere Microsoft-365-Dienste mit Teams-Integration aus, zum Beispiel Exchange Online, Windows 365 und Office Online. Microsoft zufolge waren etwa 300.000 Calls von der Störung betroffen.
Störungen wie diese will Microsoft künftig vermeiden, indem Methoden zur Fehlerbehandlung in den existierenden Workflow integriert werden. Auch eine Fallback-Ebene, dank der bei einem Ausfall auf zwischengespeicherte ECS-Konfigurationen zurückgegriffen werden kann, ist für die Dienste eingeplant.