Du hast deinen AdBlocker an?

Es wäre ein Traum, wenn du ihn für t3n.de deaktivierst. Wir zeigen dir gerne, wie das geht. Und natürlich erklären wir dir auch, warum uns das so wichtig ist. Digitales High-five, deine t3n-Redaktion

t3n 12

Mikroformate: Das Semantische Web „von unten“

Mikroformate ergänzen (X)HTML-Dokumente menschen- und maschinenlesbar durch zusätzliche Auszeichnungen. Benutzerprogramme können diese Informationen aus Webseiten extrahieren und ermöglichen so weiteren Programmen den Zugriff auf die entsprechenden Inhalte. Dieser Artikel führt in Mikroformate ein und zeigt unter anderem Beispiele für die Auszeichnung von Kontaktinformationen und Veranstaltungen.

Tim Berners-Lee entwickelte im Jahre 1990 die Hypertext Markup Language als eine einfache Hypertextsprache, die der Zusammenstellung von Basismenüs für die Hypertextnavigation und einfachen Dokumenten wie Hilfedateien, Protokolle und technischen Dokumentationen dienen sollte. Die ersten Versionen verfügten über rund 50 Elementtypen zur Auszeichnung von Inhalten. Das heute aktuelle HTML 4.01 und seine „große Schwester“ XHTML 1.0 kennen zwar mittlerweile rund 90 Elementtypen zur semantischen Annotation von Inhalten, es gibt aber bei weitem nicht so viele Auszeichnungsmöglichkeiten wie Bedeutungen. Wenn wir beispielsweise mit (X)HTML eine Buchrezension veröffentlichen möchten, dann stehen keine Elementtypen zur Verfügung, mit denen Rezensent, Buchtitel, Autor, Verlag, ISBN, Zusammenfassung oder Fazit ausgezeichnet werden können. Entsprechend gibt es etwa auch keine speziellen Auszeichnungen für Visitenkarten, Termine, CD-Sammlungen oder Tagebücher.

Werfen wir einmal einen Blick auf ein herkömmliches, vereinfachtes Beispiel für die Auszeichnung von Kontaktinformationen mit XHTML:

Herkömmliche Auszeichnung von Kontaktdaten

<address>
	yeebase media solutions GbR<br />
	Expo Plaza 3<br />
	30539 Hannover<br />
	<br />
	E-Mail: <a xhref="mailto:info@yeebase.com">info@yeebase.com</a><br />
	<br />
	Telefon: +49 511 5902799-0<br />
	Fax: +49 511 5902799-8
</address>

Listing 1

Maschinenlesbar, das heißt für Browser und andere Benutzerprogramme erkennbar, ist die Information, dass es sich um Kontaktinformationen inklusive einer E-Mail-Adresse handelt, die durch einige Zeilenumbrüche strukturiert sind. Wir Menschen, so wir der verwendeten, natürlichen Sprache mächtig sind, können weit mehr Informationen ausmachen: Wir erkennen den Namen des Unternehmens, eine Adresse, bestehend aus Straße, Hausnummer, Postleitzahl und Ort sowie eine Telefon- und eine Faxnummer. Diese Informationen sind jedoch nicht maschinenlesbar und damit nicht oder nur beschränkt programmatisch wiederverwendbar.

Genau diesen Unterschied in der Lesbarkeit von Informationen lösen Mikroformate [1]. Dabei handelt es sich um Formate zur semantischen „Feinstrukturierung“ von Webseiten. Dokumente, vor allem (X)HTML-Dokumente, können durch zusätzliche Semantik gleichzeitig menschen- und maschinenlesbar gemacht werden. Mittlerweile gibt es zahlreiche Formate für sehr spezifische Auszeichnungen, bei denen generell zwischen elementaren und zusammengesetzten Mikroformaten unterschieden wird.

Zusammengesetzte Formate basieren auf elementaren Formaten, die wiederum auf XHTML aufbauen.
Zusammengesetzte Formate basieren auf elementaren Formaten, die wiederum auf XHTML aufbauen.

Elementare Mikroformate

Elementare Mikroformate bieten eine minimale Lösung für ein einfaches Problem. Dabei kommt entweder ein „class“- oder ein „rel“-Attribut zum Einsatz.

Das Attribut „class“ weist einem Element einen Klassennamen oder einen Satz von Klassennamen zu; dieser Klassenname kann einer beliebigen Anzahl von Elementen zugeordnet werden. Das Attribut „rel“ wird hauptsächlich an „a“-Elementen notiert und beschreibt die Beziehung des aktuellen Dokuments zu der im „href“-Attribut angegebenen Zielressource. Der Attributwert ist eine durch Leerzeichen getrennte Liste von Werten.

Folgende Tabelle führt die am häufigsten verwendeten elementaren Mikroformate auf:

Mikroformat Beschreibung
rel-license Link zu einer Seite mit Lizenzinformationen (http://microformats.org/wiki/rel-license)
rel-nofollow Kennzeichnung eines Links, der nicht zur Berechnung der Linkpopularität der verlinkten Seite herangezogen werden soll (http://microformats.org/wiki/rel-nofollow)
rel-tag Link zu einer Seite mit Links zu weiteren Seiten mit diesem Stichwort

(http://microformats.org/wiki/rel-tag)

XFN Ausdruck von persönlichen Beziehungen im Web und in sozialen Netzwerken (http://gmpg.org/xfn/)
XOXO Auszeichnung von baumartigen Listen, beispielsweise Navigationsstrukturen (http://microformats.org/wiki/xoxo)

Tags sind Schlagwörter, die das Thema eines Artikels oder einer Webseite prägnant auf den Punkt bringen. Im Web 2.0 sind Tags eine wichtige Informations- und Navigationsform; ein Klick auf ein Tag führt üblicherweise zu einer Übersicht weiterer, thematisch ähnlicher Webseiten. Das folgende Codebeispiel zeigt den Einsatz des Mikroformats „rel-tag“. Der Link führt den Nutzer zu einer Liste aller Webseiten, die bei Mister Wong [2], einer Website für Social Bookmarking, mit dem Tag „mikroformate“ verschlagwortet sind; durch das rel-tag wird diese Information auch dem Browser zugänglich gemacht.

Das Mikroformat rel-tag

<a xhref="http://www.mister-wong.de/tags/mikroformate/"
	rel="tag">Mikroformate</a>

Listing 2

Finde einen Job, den du liebst

Bitte beachte unsere Community-Richtlinien

Eine Reaktion
Cami
Cami

I feel so much hiapepr now I understand all this. Thanks!

Du musst angemeldet sein, um einen Kommentar schreiben zu können.

Jetzt anmelden