von Dr. Sören Auer, Sebastian Dietzold, Michael Martin, 02.12.2008

Neue Dienste ebnen den Weg vom Dokumenten- zum Daten-Web: Semantische Webapplikationen entwickeln

Aus dem
t3n Magazin Nr. 14

Jetzt kaufen

DBpedia: Semantik aus der Wikipedia

Das Ziel des DBpedia-Projekts [4] ist es, die größte im Web verfügbare Informationsquelle, Wikipedia, als eine semantische Wissensbasis zur Verfügung zu stellen. Dazu wurden eine Reihe von Wissensextraktoren entwickelt, die strukturierte Daten aus verschiedenen Elementen von Wikipedia-Artikeln extrahieren und als RDF-Wissensbasis verfügbar machen. Quellen für Semantik in Wikipedia sind vor allem die vielen Artikeln zugeordneten Faktboxen, das Kategoriensystem oder auch die Verweise zwischen Artikeln (z. B. in verschiedenen Sprachen).

Mittels der DBpedia-Extraktion ist es gelungen, weit über 100 Millionen Fakten aus Wikipedia zu extrahieren und als RDF-Wissensbasen zum Download bereitzustellen. Die Wissensbasen werden auch in Form eines öffentlich zugänglichen SPARQL-Endpunkts verfügbar gemacht, mit dem man eigene Anfragen stellen kann. Durch die Vielzahl der von Wikipedia abgedeckten Gebiete ist die DBpedia-Wissensbasis überaus reichhaltig und ermöglicht erstaunliche Anfragen. So können beispielsweise alle Fußballspieler herausgesucht werden, die auf ihrem Trikot die Nummer 10 tragen und in einem Club spielen, in dessen Stadion mehr als 10.000 Zuschauer passen. Durch die Größe, die Vielzahl der repräsentierten Gebiete und den Gemeinschaftskonsens, den die aus Wikipedia abgeleitete Wissensbasis widerspiegelt, hat sich DBpedia inzwischen zu einem Kristallisationskern des zunehmend größer werdenden Daten-Web entwickelt.

Seite:  1 2 3 4 5 6 7 8 9

Empfohlene Artikel