Anzeige
Anzeige
UX & Design
Artikel merken

Fortschritt mit (r)evolutionärem Potenzial: Grundlagen des Semantic Web

Was das Web 2.0 und Social Software für die soziale Dynamik zwischen Usern bewirkt hat, wird das Semantic Web auf der Ebene der maschinellen Verarbeitung von Daten bewirken. Semantic Web erhöht den Gebrauchswert von Information. Die Entwicklung neuer Applikationen und Dienste wird erleichtert. Organisationale Veränderungen sind nicht ausgeschlossen, die Grundlage für neue, technologiebasierte Geschäftsmodelle ist jedoch gelegt.

9 Min. Lesezeit
Anzeige
Anzeige

Schwerpunkt Semantic Web
Grundlagen des Semantic Web S. 22
Semantic Web Tools S. 26
Semantische Webapplikationen entwickeln S. 27
Vom Web 2.0 zum Semantic Web S. 33

Semantic Web behandelt das Problem der einheitlichen Beschreibung und Adressierbarkeit von Daten, nicht nur im WWW, sondern auch in Inhouse-Lösungen. Daten und Informationen sind heute im Internet und in Intranets weitreichend verfügbar und leicht zugänglich. Doch die Informationsfülle setzt der inhaltlichen Erschließung durch den Menschen Grenzen, weshalb nach Wegen gesucht wird, Daten für die maschinelle Interpretation aufzubereiten.

Anzeige
Anzeige

Heutzutage sind Computer zwar in der Lage, HTML-Dokumente zu lesen und darzustellen, der Inhalt der Dokumente bleibt den Maschinen jedoch weitgehend verborgen. Gängige Suchmaschinen etwa liefern Ergebnisse, die nicht notwendigerweise mit den Schlagwörtern korrespondieren, die der Nutzer eingibt. Die relevanten Suchergebnisse verbergen sich stattdessen in schier endlosen Trefferlisten, die inhaltliche Verknüpfung zwischen Dokumenten und Themen bleibt verborgen. Das Semantic Web hilft nun der Maschine dabei, nicht nur den isolierten Suchbegriff, sondern auch den Zweck und den Kontext einer Suchanfrage zu interpretieren. Entsprechend liefert eine semantische Suche präzisere und gleichzeitig reichhaltigere Ergebnisse und unterstützt den Nutzer bei der inhaltlichen Orientierung und Navigation. Voraussetzung dafür ist die so genannte „Semantifizierung“ von Daten.

Metadaten, Ontologien und URIs

Diese beginnt mit der Annotation von Dokumenten, beispielsweise durch Verschlagwortung (Tagging). Dabei generierte Metadaten beschreiben nicht nur das Dokument selbst, sondern auch die Relationen, wie Dokumente miteinander in Beziehung stehen. Zusätzlich können nicht nur Dokumente, sondern auch einzelne Abschnitte, Begriffe, Entitäten und ihre Relationen annotiert werden, was die Genauigkeit der Beschreibung und gleichzeitig die semantische Reichhaltigkeit eines Dokuments erhöht.

Anzeige
Anzeige

Zur Vermeidung von Namenskonflikten muss jedoch jedem Objekt eine eindeutige Kennung zugeordnet werden. Dieser so genannte Uniform Resource Identifier (URI) stellt sicher, dass es zu keinen Verwechslungen zwischen Objekten und/oder Relationen kommt. Semantische Eindeutigkeit wird dadurch möglich.

Anzeige
Anzeige

Verwaltet werden die Metadaten und ihre Relationen mittels so genannter Ontologien. Das sind Modelle, die vergleichbar sind mit relationalen Datenbanken. Dabei sind sie jedoch weitaus flexibler und geben eine Ordnungsstruktur vor, die es der Maschine ermöglicht, sinnvolle Zusammenhänge zu erkennen und den Kontext zu erkennen, aus dem sich ein Nutzer einem Thema annähert.

Das Schaubild zeigt, wie das SIOC-Projekt Verbindungen zwischen Social Communitys schaffen will.

Das Schaubild zeigt, wie das SIOC-Projekt Verbindungen zwischen Social Communitys schaffen will.

Eine Schlüsselfunktion des Semantic Web ist die Herstellung „semantischer Interoperabilität“. Diese wird über die Verwendung einheitlicher syntaktischer Metadaten- und Ontologie-Standards gewährleistet. Vergleichbar mit HTML hat das World-Wide-Web-Konsortium in den vergangenen Jahren eine Reihe solcher Standards verabschiedet. Mit RDF (Resource Description Framework) [1] und OWL (Web Ontology Language) [2] sind die technologischen Bausteine des Semantic Web bereits vorhanden und halten sukzessive Einzug in unterschiedlichste Anwendungsbereiche. Eine Reihe von spezialisierten Vokabularien wie zum Beispiel SKOS (Simple Knowledge Organisation System) [3], FOAF (Friend of a Friend) [4] oder SIOC (Semantically Interoperable Online Communities) [5] bieten eine Reihe von Möglichkeiten, um die Ausdruckskraft semantischer Daten zu erweitern und für bestimmte Zwecke wie Wissensorganisation, Social Networking oder Community Management einzusetzen.

Anzeige
Anzeige

Was semantische Technologien können

Mit der zunehmenden Verfügbarkeit semantisch angereicherter Daten werden Suchergebnisse präziser und für den Endnutzer brauchbarer. Suchmaschinen basieren dann nicht mehr nur auf Schlagwörtern, sondern explorieren „Konzepte“, d.h. Bedeutungsräume, die unterschiedliche Zugänge zu einem Thema erlauben und zwischen unterschiedlichen Typen von Information unterscheiden können. Online-Shop-Betreiber sind dann in der Lage, ihre Produkte präziser zu beschreiben und zu katalogisieren. Beispiel: Im Falle einer Fahrradmanufaktur kann jedes Produkt mittels mehrerer RDF-Tags wie Farbe, Größe, Einsatzgebiet, Wartungsintensität, Können, Zahlungsbereitschaft und Verbundenheit mit anderen Produkten beschrieben werden. Diese Tags beinhalten die Kontextinformation, die für die Kaufentscheidung des Kunden relevant ist. Suchmaschinen werden damit zunehmend zu Empfehlungssystemen, die auf individuelle Bedürfnisse reagieren und einen personalisierten Zugang zu Information gestatten.

Dies wird auch dadurch begünstigt, dass auf Basis der semantischen Interoperabilität externe Daten kosteneffizienter integriert werden können und eine neue Qualität von Mashups ermöglichen. Daten müssen damit nicht mehr notwendigerweise in einer eigenen Datenbank vorrätig gehalten werden, sondern können direkt aus dem Web abgerufen und integriert werden. Ein aktuelles Beispiel ist etwa DBPedia Mobile [6], eine mobile Applikation, die Daten aus unterschiedlichen Quellen zu neuen Services verdichtet. Die Grundlage dafür ist das „Linking Open Data Project“ des W3C [7]. Mit mehreren Milliarden Datensätzen, die sich aus Quellen wie Wikipedia, Flickr, Geonames, EuroStats, US Census, CIA World Factbook, BBC und anderen speisen, stellt die „Open Data Cloud“ [8] das derzeit größte offene Daten-Repository der Welt dar. Alle Daten sind mittels RDF einheitlich beschrieben und lassen sich dadurch in entsprechende Anwendungen integrieren.

In weiterer Folge eignen sich Semantic-Web-Technologien für die Verbesserung Service-orientierter Architekturen. Unterschiedliche Web Services und Applikationen können mittels semantischer Beschreibungen leichter gefunden, auf ihre Kompatibilität getestet und im Bedarfsfall effizienter integriert werden. Vormals getrennte Datenbestände und Datenbanken wachsen über den Semantic Layer zusammen, verringern die Fehleranfälligkeit und den Arbeitsaufwand der Datenportabilität und erhöhen die Effizienz der Informationsarbeit. Obwohl die Machbarkeit semantischer Web Services noch kontrovers diskutiert wird, testet die British Telecom bereits seit einigen Jahren deren Einsatz für die Identifikation, Diagnose und Behebung technischer Netzwerkprobleme. Zusätzlich unterstützen die Services den Kunden-Support und sollen die Service-Qualität verbessern.

Anzeige
Anzeige

Semantic Web auf dem Weg in den Massenmarkt

Ohne Zweifel stellt das Semantic Web derzeit noch eine Nischenerscheinung dar. In den vergangenen Jahren haben sich eine Reihe von Startups etabliert, die basierend auf W3C-Standards und der Integration unterschiedlicher bedeutungsverarbeitender Softwarekomponenten neue Applikationen und Services auf den Markt gebracht haben. Deren kommerzielle Tragfähigkeit muss sich nun beweisen.

Auf der anderen Seite haben große Player wie Yahoo, Microsoft, Thomson, Oracle, Sun Microsystems und British Telecom ein klares Commitment zu Semantic Web bekundet oder entsprechende Konzepte ohne großes öffentliches Aufsehen bereits internalisiert, wie am Beispiel Google nachzuvollziehen ist. Insbesondere in der Medizin und der Medienbranche sind Semantic-Web-Technologien auf dem Vormarsch. Im letzten Fall bekennen sich etwa Reuters, Dow Jones, die New York Times oder die BBC zum Semantic Web. Auch im deutschsprachigen Raum ist die Medienbranche in Bewegung, hält sich aber gerne bedeckt. Dies darf auch nicht verwundern, denn Daten und Datenstrategien sind aus unternehmerischer Perspektive oftmals zu „intim“, um sich damit in der Öffentlichkeit zu präsentieren.

Die Zeichen weisen jedoch untrügerisch in die Richtung, dass Semantic-Web-Technologien sukzessive in bestehende Architekturen und Anwendungen integriert werden und so auf leisen Sohlen ihren Weg in den Massenmarkt finden. Im Rahmen der „Semantic Web Initiative“ von Drupal [9] soll im nächsten Release des Content Management Systems eine serienmäßige Integration von RDFa [10] erfolgen. Dieser Semantic-Web-Standard für Mikroformate ermöglicht die maschinenverarbeitbare Annotation von bestimmten Content-Entitäten. Beispiel: Zahlenwerte können automatisch als Preise, als Konfektionsgrößen, als Altersangabe oder Autokennzeichen ausgewiesen werden. Mehr noch: Ganze Dokumenttypen, wie etwa Jobausschreibungen, können mittels eines Schemas semantisch angereichert und leichter auffindbar gemacht werden, wie etwa Drupal-Gründer Dries Buytaert in einem aktuellen Blogpost [11] verdeutlicht: „Imagine a standard Drupal node-type called ‚job‘. The fields in the job node-type would have RDF properties associated with them mapping to salary, duration, industry, location, and so on. Creating a new job posting on a Drupal site would generate RDFa that semantic search engines like Yahoo’s SearchMonkey would pick up and the job would be included in their world-wide job database.”

Anzeige
Anzeige
Yahoos SearchMonkey integriert semantische Funktionen, hier beispielsweise weitere Informationen zu einem Film, in die Suchergebnisse.

Yahoos SearchMonkey integriert semantische Funktionen, hier beispielsweise weitere Informationen zu einem Film, in die Suchergebnisse.

Ein weiteres Beispiel ist der Semantic Desktop, welcher in Linux KDE Version 4 [12] realisiert wird und eine vollwertige Semantic-Web-Architektur integriert, die im Rahmen des EU-Projekts NEPOMUK entwickelt wurde [13]. Der Semantic Desktop stellt eine Art persönliches Wissensmanagement-System dar, welches die automatische Strukturierung von Dokumenten und deren Integration in Workflows unterstützt.

Und mehr noch: Reuters stellt seit einigen Monaten mit seinem Dienst OpenCalais [14] ein automatisches RDF-Verschlagwortungstool für unstrukturierten Text zur Verfügung und Yahoo setzt im Rahmen seiner SearchMonkey-Initiative [15] ganz gezielt auf den Nutzen vernetzter Daten mittels RDF. Hierbei ist zu beobachten, dass entsprechende Projekte und Dienste sehr stark von kollaborativen, das heißt auf gemeinschaftlichen Wertschöpfungsprinzipien beruhenden Elementen durchdrungen sind, denn: Semantic Web ist kein Feld für Einzelkämpfer. Es ist ein großtechnisches System, dessen Relevanz und Qualität ebenso wie andere Netztechnologien von seiner Verbreitung und der gemeinschaftlichen Akzeptanz abhängen.

Die Entwicklung von auf Semantic-Web-Technologien basierenden Geschäftsmodellen schreitet hierbei kontinuierlich voran. Allerdings ist zu erwarten, dass der kommerzielle Roll Out in der ersten Phase vorrangig im B2B-Segment vonstatten gehen wird. „Index-Licensing“, also die (kostenpflichtige) Lizenzierung gut strukturierter Metadaten-Bestände, oder automatische „Annotation Services“ für unterschiedliche Fachthemen, Branchen oder Nutzergruppen sind erste Indikatoren dieser Entwicklung, die schwerpunktmäßig durch betriebliche beziehungsweise professionelle Nutzer getrieben ist.

Anzeige
Anzeige

Im B2C-Segment nähert sich die Werbewirtschaft über das Schlagwort „kontextualisierte Werbung“ dem Thema sukzessive an. Als Weiterentwicklung der wortbasierten Werbeformen wird hier das so genannte „Concept Advertising“ eine Rolle spielen, welches nicht nur den Bedeutungsgehalt eines Worts, sondern ebenso sinnvolle Relationen heranzieht, um Werbung effektvoll zu platzieren. Auf diese Weise wird man wohl bald nicht mehr darüber schmunzeln können, dass neben einem News-Beitrag zum Thema „Alkoholsucht“ eine Bierwerbung auftaucht. Semantik unterstützt hier die Qualitätssicherung von Werbeschaltungen und ermöglicht gleichzeitig die automatisierte Werbebewirtschaftung von Nischenthemen und des Long Tail.

dms_c8ea17eec330bfb4a8dc31a8ceb1ecbb

Kritik und Machbarkeit

Eine oft zu hörende Kritik ist jedoch, dass das Semantic Web aus technischer und organisatorischer Perspektive zu komplex ist, um überhaupt realisiert werden zu können. „Wer soll das denn alles machen?“, heißt der Einwand, der unterstellt, dass weder die Systemadministratoren noch die Endnutzer für die Bedienung semantischer Systeme geschult oder einfach zu faul sind, um dem mit der nötigen Sorgfalt nachzukommen.

Anzeige
Anzeige

Andernorts wird davor gewarnt, dass die zunehmende Semantifizierung zu „MetaCrap“ führt, der erst recht keine Verbesserung von Suche und Datenintegration erlaubt und die erhofften Effizienzgewinne und Usability-Verbesserungen letzten Endes wieder konterkariert. Zudem bestehe die Gefahr, dass durch irreführende Annotationen die Spam-Problematik in eine neue Ebene gehievt werden könnte. Ebenso ist bisher weitgehend offen, inwieweit sich in einem Semantic Web die Anforderungen an Datenschutz, Urheberrecht und Wettbewerbsregulierung ändern werden. Experten attestieren hier jedoch bereits Handlungsbedarf auf Ebene der Gesetzgebung.

Kritik dieser Art ist ernst zu nehmen, denn sie bringt nicht nur die berechtigte Skepsis, sondern auch die relevanten Problembereiche zum Ausdruck. Zudem relativiert sie die teilweise unreflektierte Technologie-Euphorie und den Machbarkeitsfetisch der Technik-Geeks. Allerdings sei auch angemerkt, dass viele kritische Stimmen nicht differenziert argumentieren und ein vielschichtiges und facettenreiches Phänomen pauschal ablehnen. Wie so oft liegt hier der Weg in der Mitte und die Lösung im gesellschaftlichen und unvoreingenommenen Diskurs.

Resümee: „A little semantics goes a long way“

Die Frage ist nicht, ob das Semantic Web kommen wird, sondern nur in welcher Form. Grundsätzlich gilt: „A little semantics goes a long way“, also nicht die technischen Möglichkeiten, sondern der sinnvolle und reflektierte Einsatz entscheiden über den Nutzen und die Akzeptanz von Semantic-Web-Technologien. Oft bringen hierbei kleine Schritte mehr Benefit als die großangelegte Offensive.

Anzeige
Anzeige

Zusätzlich wird das Semantic Web nur dann erfolgreich sein, wenn es seine immanente Komplexität „unter der Motorhaube“ verbirgt und der Endnutzer davon unbelastet bleibt. Doch dies sind nur Symptome von Kinderkrankheiten und keine tiefliegenden konzeptionellen Defizite.

Semantic Web ist eine generische Technologie und eine inkrementelle Innovation, die sich schrittweise in unserem Alltag etablieren wird. Denn Semantic Web bedeutet für das Unternehmen ebenso wie den Endnutzer in erster Linie technologische Planungssicherheit und Unabhängigkeit von technologischen Lock-Ins oder proprietären Sackgassen. In anderen Worten: Semantic Web hilft nicht nur dort, wo wir den Wert von Information bereits kennen, sondern vor allem dort, wo wir das (noch) nicht tun.

Mehr zu diesem Thema
Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Schreib den ersten Kommentar!
Bitte beachte unsere Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Melde dich mit deinem t3n Account an oder fülle die unteren Felder aus.

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Anzeige
Anzeige