Reddit ausgelesen: Studierende helfen der Nasa, Erdrutsche zu finden
Von Erdrutschen werden künftig immer mehr Siedlungen in armen Regionen der Welt betroffen sein, hieß es erst vor Kurzem in einer Mitteilung des Deutschen Geoforschungszentrums Potsdam. Umso wichtiger, dass diese unterschätzten Naturkatastrophen, die häufiger vorkommen als jedes andere geologische Ereignis, dokumentiert und die Daten für die Vorhersage weiterer möglicher Erdrutsche verwendet werden.
In wenigen Minuten von der Erdrutsch-Nachricht bis zur öffentlichen Datenbank
Eine entsprechende öffentliche Datenbank der Nasa existiert bereits unter dem Namen Cooperative Open Online Repository, kurz: COOLR. Bislang mussten die Daten, die im Nasa Landslide Viewer visualisiert werden, manuell eingereicht werden.
Doktoranden der University of British Columbia haben jetzt ein automatisiertes Tool entwickelt, das die Vorhersage von Erdrutschen vorantreiben könnte.
Für ihr Projekt haben Badr Jaidi und sein Team Computer trainiert, um automatisch nützliche Informationen aus relevanten Nachrichtenartikeln über Erdrutsche zu extrahieren, die auf Reddit veröffentlicht wurden. Die Computerlinguisten arbeiteten mit einem natürlichen Sprachverarbeitungsmodell, das darauf trainiert wurde, spezifische Informationen über Erdrutsche zu erkennen.
Das Portal Reddit wurde dem Portal Techxplore zufolge vor allem deshalb ausgewählt, weil es kostenlos ist, auf dessen API zuzugreifen. „Wir wollten klein anfangen und beweisen, dass es mit Reddit funktioniert. Aber es könnte auf größere Plattformen und Quellen ausgeweitet werden, sofern sie Nachrichtenartikel haben“, wird Jaidi in dem Beitrag zitiert.
Die Entwicklung des Tools, das laut Jaidi auch für andere Naturkatastrophen herangezogen werden könnte, dauerte etwa zwei Monate. Die Nasa prüft derzeit, ob das Tool unverändert ausgeführt werden kann oder Anpassungen benötigt.