Onlineshop-SEO: So vermeidest du Duplicate Content
Duplicate-Content-Probleme sind bei einer Vielzahl der Websites im Netz in der einen oder anderen Form vorhanden. Mal ist beispielsweise die Startseite über verschiedene URLs erreichbar:
- www.beispielseite.de
- www.beispielseite.de/index.html
…oder alle Inhalte der Domain sind mit und ohne www verfügbar:
- www.beispielseite.de/produkt
- beispielseite.de/produkt
Duplicate Content kann aber auch andere Ursachen haben. Besonders Shop-Systeme wie beispielsweise Magento oder Oxid besitzen von Haus aus dieses Problem, insbesondere was ihre Kategorie- und Kategorieunterseiten angeht.
Duplicate Content bei Magento und Oxid
Bei Shop-Systemen resultieren die Probleme in der Regel daraus, dass sich die Darstellungs- und Sortierweise der Kategorieseite in der URL an eigenen Parametern zeigt. Somit werden unterschiedliche URLs erzeugt, die aber identischen oder sehr ähnlichen Inhalt anzeigen.
Diese URLs sehen dann beispielsweise so aus:
Magento:
- http://www.beispielshop.de/beispielkategorie.html?mode=list
- http://www.beispielshop.de/beispielkategorie.html?dir=asc&mode=list&order=name
Bei Magento stehen beispielsweise Parameter wie mode=list
für die Darstellung als Liste und order=name
für die Sortierung anhand des Namens.
Oxid:
- http://www.beispielshop.de/index.php?tpl=&_artperpage=30&cl=alist&searchparam=&cnid=4_1310000000
- http://www.beispielshop.de/index.php?stoken=C57CE11F&force_sid=&cnid=4_1300000000&listorder=asc&
cl=alist&listorderby=oxtitle
Beim Oxid Shopsystem steht artperpage=30
beispielsweise für die Darstellung von 30 Produkten gleichzeitig und listorderby=oxtitle
fürs Sortieren über den Produkttitel.
Diese Problematik haben natürlich auch die Hersteller und Entwickler erkannt und so bietet das Shopsystem Oxid bereits seit Ende 2009 (Version 4.2.0) die automatische Generierung von „canonical-Tags“ an und nahezu jede SEO-Extension für Magento bietet die Möglichkeit des Einsatzes einer „Canonical URL“. Was damit gemeint ist, erkläre ich gleich noch. Kurz gesagt geht es darum, gegenüber Suchmaschinen festzulegen, welche von den vielen ähnlichen Seiten denn diejenige ist, die gewertet werden soll.
Aber es gibt noch weitere Features, die für Duplicate Content sorgen können.
Duplicate Content durch Paginierung
Auch die Paginierung kann ein Problem sein, also die Aufteilung langer Texte oder von vielen Inhalten in Teilstücke und die Vergabe einer Nummerierung.
Hier ein Beispiel für Paginierung auf der Google Suchergebnisseite:
Die Paginierung ist meiner Meinung nach heute keine optimale Präsentationsform mehr für Webinhalte. Natürlich hat sie Ihre Daseinsberechtigung und ist manchmal nicht zu vermeiden (siehe Google), aber häufig kann man sie umgehen. Dazu nehmen wir mal an, wir haben einen Onlineshop für Gartenbedarf und eine Kategorie mit über 200 Produkten z.B. Pflanzensamen.
Schritt 1: Weitere Kategorien schaffen
Der erste Schritt ist der Versuch, das Angebot weiter zu kategorisieren. In unserem Beispiel mit dem Onlineshop für Gartenbedarf wären das bei den Pflanzensamen Unterkategorien wie: Frühblüher, Spätblüher oder Blumensamen, Grünpflanzensamen, Rasensamen, etc.
Bevor man also eine Paginierung vornimmt, sollte man sich immer überlegen, ob man die Produkte nicht weiter kategorisieren kann. Gleichzeitig erhält man so auch weitere Landingpages für detailliertere Suchanfragen. In unserem Beispiel: nicht nur für Pflanzensamen sondern auch für Blumensamen, Rasensamen, etc. Das ist wertvoller Longtail-Content, der sehr gezielt Besucher auf die Website bringen kann.
Schritt 2: Limitierungen überdenken
Häufig wird dem Nutzer bei Kategorie-Unterseiten mit einer Vielzahl von Produkten im ersten Schritt nur ein Teil des Angebotes angezeigt. Dabei ist die Begrenzung auf 10, 12 oder 15 Produkte veraltet und auch zum Teil auf geringe Bandbreiten vergangener Jahre zurückzuführen. Heute kann man Nutzern getrost 30, 50 und mehr Produkte mit Bild und Titel übersichtlich auf einer Seite präsentieren, ohne sie zu überfordern. Moderne User sind Scrollen gewohnt!
Natürlich sollte man die Ladezeit besonders bei den vielen Bildern nicht gänzlich außer acht lassen, sondern experimentieren, wo die Grenze des Erträglichen erreicht ist. Länger als fünf bis sechs Sekunden will niemand auf neue Inhalte warten und das ist somit vielleicht ein guter Richtwert. Und wie immer bei Bildern gilt: Bestmöglich komprimieren und idealerweise in CSS-Sprites zusammenfassen.
Bin ich dennoch gezwungen bei Kategorieunterseiten eine Limitierung einzusetzen, so sollte es immer eine „Alle anzeigen“-Seite geben. Diese vollständige Ansichtsseite der Pflanzensamen (um bei unserem Beispiel zu bleiben) gebe ich bei allen anderen limitierten und sortierten Ansichtsseiten über das canonical-Tag als bevorzugte Quelle an.
Bei der Sortierung der vollständigen Ansicht lasse ich das Nutzerinteresse entscheiden, also „meist verkaufte“ oder „meist gesuchte“ Produkte. Natürlich können sich auch einige „höchste Marge“-Produkte darunter schleichen…
Und auf Seite 2 lest ihr zum Thema Duplicate Content, was der canonical-Tag ist und wie er das Problem löst…
Der Problemlöser in Sachen Duplicate Content: canonical-Tag
Mit dem canonical-Tag haben Seitenbetreiber seit Anfang 2009 eine sehr elegante Möglichkeit, Duplicate-Content-Probleme auf der eigenen Internetpräsenz zu lösen. Beim canonical-Tag handelt es sich um einen Link-Tag (<link>) der im Head-Bereich (<head>) einer HTML-Seite eingesetzt wird. Beispiel:
<link rel=“canonical“ href=“http://www.beispielseite.de/ganze-kategorie“ />
In dem Beitrag zur Einführung des Elements heißt es auf dem offiziellen Google Webmaster Central Blog:
“We now support a format that allows you to publicly specify your preferred version of a URL. If your site has identical or vastly similar content that’s accessible through multiple URLs, this format provides you with more control over the URL returned in search results. It also helps to make sure that properties such as link popularity are consolidated to your preferred version.”
Bei diesen Aussagen sind besonders die letzten drei Zeilen sehr bedeutend: Neben der Vermeidung von duplicate content, bestimmt man mit dem canonical Element gleichzeitig auch, welche URL in den Suchergebnissen angezeigt werden soll. Man bestimmt also bei mehreren Seiten mit gleichen oder ähnlichen Inhalten, welche Google als die ursprüngliche und beste ansehen soll.
Den canonical-Tag intelligent einsetzen
Darum geben wir als bevorzugte Quelle die URL mit der größten Produktauswahl sowie der nutzerorientierten Sortierung an. Die Annahme dahinter: Präsentiere ich den Nutzern alle meine Pflanzensamen, ist die Chance am größten, dass er/sie auch das Passende findet. Sortiere ich sie zudem nach den bisherigen Nutzerinteressen, stehen die Pflanzensamen ganz oben, die bei neuen Besuchern (wahrscheinlich) saisonbedingt im Fokus stehen.
Gleichzeitig soll das Element helfen, die Linkpopularität auf eine bevorzugte URL zu bündeln und weiterzuleiten. Zuvor war das nur durch den Einsatz einer 301-Weiterleitung möglich, mit dem Unterschied, dass Suchmaschinen-Bots und User nur diese URL angezeigt bekamen.
Dank des canonical-Tags kann es verschiedenen Versionen einer HTML-Seite für User geben und man kann ausschließlich eine bevorzugte Version für Suchmaschinen bestimmen. Überspitzt könnte man sagen: Erlaubtes cloaking!
Über den Gastautor
Khalil Agheli Zadeh ist Gründer und Inhaber von SEO Deutschland. Seit 2001 beschäftigt er sich bereits mit Suchmaschinenoptimierung und gründete 2004 die Agentur SEO Deutschland. Neben der Durchführung von SEO-Kampagnen für internationale Konzerne wie die Pirelli Italy SpA, berät und betreut SEO Deutschland nationale Unternehmen wie die TUI Deutschland GmbH und veranstaltet beispielsweise interne Workshops zum Aufbau von Inhouse-Resourcen.
Zitat:
Die Paginierung ist meiner Meinung nach heute keine optimale Präsentationsform mehr für Webinhalte:
Genau deshalb wurde der Artikel wohl auf 2 Seiten aufgeteilt ;)
-> Und auf Seite 2 lest ihr zum Thema Duplicate Content, was der canonical-Tag ist und wie er das Problem löst…
Warum machen das die Portale? Ganz einfach weil zwei Seitenaufrufe mehr sind als ein Seitenaufruf -> Pageviews erhöhen sich -> mehr Traffic und damit mehr Einnahmen durch die Werbeschaltungen / Banner.
@thomas und @gbreitenberger
Herrlich;-) Super Beispiel! Darum beginnt der Name des Artikels auch mit Onlineshop-SEO, Online-Magazine haben keine DC-Probleme;-)
Also abgesehen davon, dass es in dem Beitrag nun eindeutig um Onlineshops geht und nicht um eine News-Website wie t3n.de, brauchen wir offensichtlich einen Disclaimer für solche Artikel ;-) In etwa so:
„1. Die in diesem Artikel wiedergegebenen Tipps sind Empfehlungen des jeweiligen Autors, die befolgt oder ignoriert werden können. Vor allem ist im Einzelfall zu entscheiden, welcher Tipp überhaupt zutrifft oder nicht. Ein solcher Post kann naturgemäß nur allgemeine Empfehlungen, Richtlinien und Erfahrungswerte weitergeben. Diese Tipps sind begründet, sind aber deshalb keine absoluten Wahrheiten.
2. Es ist somit nur logisch, dass auch t3n.de selbst nicht allen Tipps folgt, die in diesem Artikel gegeben werden. Das kann, wie überall, verschiedenste Gründe haben. Ganz abgesehen davon, dass der Autor nicht Mitarbeiter von t3n ist und nicht dafür zuständig ist, auf t3n.de diese Dinge zu entscheiden. Siehe ergänzend dazu 1.“
Würde es damit klarer? ;-) Finde es ziemlich ermüdend, so oft unter Artikeln mit hilfreichen Tipps und Tricks erst einmal zu lesen, dass auf t3n.de aber X anders gemacht wird und Y anders gelöst ist. Es gibt eben nicht nur eine Wahrheit, wir machen nicht immer alles perfekt „richtig“ (wofür es, wie jeder weiß, diverse Gründe geben kann) und trotzdem können die Tipps aus dem Artikel gute Tipps sein… die wir vielleicht später auch umsetzen, oder auch nicht ;-)
Die Paginierung ist bei uns zum Beispiel durchaus umstritten, aber es gibt gute Gründe dafür und dagegen. Das sollte aber eigentlich niemanden überraschen ;-) Auf einer News-Website wie t3n.de bedeutet tatsächlich nahezu jeder Klick Geld, während er in einem Onlineshop hingegen Geld kosten kann, weil die Nutzer eventuell abspringen. Ganz abgesehen vom Duplicate-Content-Problem, um das es in diesem Artikel hier geht und das es bei einem paginierten Newsbeitrag logischerweise gar nicht gibt ;-)
Mich würde ja viel mehr interessieren, ob ihr denn nun die angesprochene Paginierung in Onlineshops (!) ebenso kritisch seht wie Khalil und was ihr von den anderen Tipps und Hinweisen haltet. Wäre ganz schön, wenn sich die Diskussion jetzt wieder ums Thema drehen könnte.
Ich denke, dass Paginierung durchaus auch aus SEO-Gründen wichtig ist. Stichwort „Keyword Spamming“. Außerdem kann man sich vermutlich darüber streiten, ob ein Produkt dass im 249. HTML-Element der Seite 1 eine bessere Relevanz hat, als im 15. der Seite 3… ;-)
Aus Usability-Gründen bevorzuge ich (derzeit) eine ordentliche Paginierung ohne viel Scrollen, damit der Benutzer auch sofort sieht, dass es weitergeht ohne den Scrollbalken zu beachten (OK, das hat nichts mit SEO zutun, aber mit Konversion). Zudem kommt es auch auf die Ziel-Gruppe eines Shops an. Produkte für ältere Semester werden vermutlich eine klassische Bedienform bevorzugen („im Katalog blättert man ja auch“). Durch alternative Bedienweisen ala Facebook (runterscrollen -> Content nachladen) wird sich natürlich das Nutzerverhalten in den nächsten Jahren verändern. Das „Überfrachten“ von Seiten ist meiner Erfahrung nach kontraproduktiv.
Definitiv wichtig zu erwähnen: Der Canonical-Tag kann jetzt auch via Header ausgegeben werden:
http://googlewebmastercentral.blogspot.com/2011/06/supporting-relcanonical-http-headers.html
Vielleicht sollte man als einen der wichtigen Punkte noch hinzufügen, dass Shopbetreiber nicht ständig losziehen sollen und die Texte ihrer Konkurrenz „klauen“, nur weil sie entweder zu faul oder zu geizig sind, sich selbst eigene Texte einfallen zu lassen. Im Laufe der Jahre habe ich x „Kollegen“ deswegen anschreiben und auch abmahnen dürfen. Aus meiner Sicht eine Plage ohne Ende :-(
Weitere Unterkategorien bedeuten natürlich auch längere Klickwege, eine Navigation die tiefer als in eine 4 Ebene geht sollte aus Usabilitygründen vermieden werden. Ansonsten wie Herr Wacker sagt, es kommt auf dier Zielgruppe an…
@Thomas Wacker
Wie Du selber so schön sagst: „bevorzugst Du bzw. Deine Zielgruppe die Paginierung“ Wunderbar dann bleib dabei, der Erfolg gibt Dir Recht! Darum hab ich auch geschrieben „meiner Meinung nach“. Ich gehöre wohl eher zur jungen Generation;-)
Was Paginierung und SEO bzw. Keyword-Spamming angeht, so muss Dein CMS aber auch die nachfolgenden Seiten mit einzigartigen Titeln bestücken. Shopsystem neigen dazu Titel gleich zu belassen und nur die URL ändert sich. Das wird Dir als Seitenbetreiber dann anschließend in den Google Webmaster Tools bei den HTML Vorschlägen als Doppelte „title“ Tags angezeigt.
Und wenn SEO mit etwas zu tun hat, dann doch mit Conversions und Usability!
Deswegen auch der Abschnitt mit der Wahl der richtigen Ziel-URL für den canonical-Tag. So kannst Du weiter die Paginierung betreiben, aber dem Suchenden die „Alles Anzeigen“ Seite in den Suchergebnissen anzeigen lassen. Schließlich findet der Suchende dann beispielsweise zum Thema Blumensamen, auch wirklich alle meine Blumensamen auf einen Blick (oder wenigen Drehungen am Scrollrad;-).
@Heiko
Richtig und zudem sehr wichtig! Man Du bist aber auch immer up to date;-)
@Björn Puls
Ich halte von so generellen Aussagen wie: „eine Navigation die tiefer als in eine 4 Ebene geht sollte aus Usabilitygründen vermieden werden“ nicht viel. Genauso wie es beim Design, Layout und dem Einsatz der Paginierung auf die Zielgruppe und die Berücksichtigung von Konventionen geht, so gilt dies auch für Navigationsebenen auf einer Webseite.
Wenn es mein Angebot notwendig macht, dann gibt es halt 8 Ebenen. Baue ich meine Webseite von vornherein mit einer intelligenten Linkarchitektur auf, dann schadet das weder Nutzern noch meinem Ranking. Natürlich sollten arg verschachtelten Webseiten Sitemaps (HTML, XML) bereitstellen und besonders wertige Inhalte von der Startseite verlinken.
Naja, meiner Erfahrung nach wird das Duplicate Content Problem das auf der Wiederholung von Inhalten durch dynamische Seiten innerhalb einer Webseite Seite beruht, überbewertet, bzw. ist so gar nicht existent. Im Gegenteil – da wird von Möchtegern SEOs oft viel kaputt gemacht indem vermeintlicher Duplicate Content entfernt wird, der in Wirklichkeit gar keiner ist.
Viel gravierender ist das Problem, daß die meisten Shopseiten lediglich aus Produktbeschreibungen des Herstellers bestehen die sich zu Dutzend auf anderen Shops wiederfinden. Da nützt dann auch der Canonical Tag nix.
Lieber Gastautor, t3n-Team und Mitlesende,
wie mache ich es jetzt korrekt? Habe durch mein System folgendes Problem und es gibt kein einfaches Plugin dafür – muss es also händisch machen. Nur wie? Was muss ich wie stricken?
Wie im Beispiel oben erzeugt eine Paginierung und Listenansicht der Artikel (10, 50, 100) folgende duplicate Content URLs:
http://www.beispielshop.de/beispielkategorie.html ist auch über
http://www.beispielshop.de/beispielkategorie.html?mode=list und
http://www.beispielshop.de/beispielkategorie.html?dir=asc&mode=list&order=name
erreichbar. Die letzten beiden URLs werden dynamisch unter Hinzunahme eines oder mehreren Parameter-Wertes generiert. Was, wo, wie soll ich hier das Canonical setzen?
Canonical-Tag auf der Seite
http://www.beispielshop.de/beispielkategorie.html auf sich selbst?
Danke!
Hallo, ich möchte eine Dienstleistung zum Thema sprachen lernen anbieten, und zwar zu vielen unterschiedlichen Sprachen. Die Dienstleistung an sich ist aber immer die gleiche (eine spezielle Art zu lernen).
D. h. ich könnte z. b. eine Seite zum Thema „englisch lernen“ erstellen. EXAKT DIE GLEICHE SEITE könnte ich zum Thema französich, spanisch, italienisch, etc lernen erstellen, ich würde nur statt „englisch“ die jeweils andere sprache schreiben. Aber das wäre ja eindeutig Duplicate Content, oder nicht?? Was wäre die Alternative?
Ich könnte mit dem canonical-tag eine original seite bestimmen, z. b. „englisch lernen“, mit dem tag von ALLEN anderen Seiten auf die „englisch lernen“-Seite verlinken, oder? aber dann würden all die anderen Seiten gar nicht in den SERP´s auftauchen, oder? Das wäre ja ein massiver Nachteil. D. h. wenn jemand nach „spanisch lernen“ googelt dann würde in den SERP´s meine Original-Seite „englisch lernen“ auftauchen. Das ist doch schlecht…oder es taucht gar keine meiner Seiten in den SERP´s auf? Das wäre noch schlechter.
Ich habe gelesen, dass es gut wäre, wenn man auf jeder Seite eigenen, also jeweils neu formulierten Content schreibt. Ich wüsste aber nicht, wie ich die Dienstleistung auf 10 verschiedene Arten beschreiben soll, bzw. wenn ich es tue, dann benutze ich bestimmte Worte (sprachschule, sprachkurs, sprache schnell lernen, und noch viele mehr) immer wieder, entweder weil sie gut passen, oder weil es Begriffe sind nach denen die Leute suchen, d. h. zumindest diese wichtigen Begriffe wären auf allen 10 Seiten gleich…wäre das dann nicht auch Duplicate Content? Falls ja, dann müsste ich diese Begriffe weniger benutzen, aber das ist ja total kontraproduktiv, weil wie gesagt diese begriffe gut meine Dienstleistung erklären UND nach Ihnen gesucht wird….also auch nicht wirklich ein gute Lösung, oder? Oder ist es vielleicht doch möglich die Seiten auf 10 verschiede Arten zu beschreiben UND dabei diese wichtigen Begriffe durchaus oft zu benutzen, aber irgendwie so, dass es doch kein Duplicate Content ist???
Was mir noch einfällt wäre, NUR EINE Seite zu erstellen, und auf dieser zu erklären, dass ich diese Dienstleistung für verschiedene Sprachen anbiete, aber da sehe ich den Nachteil, dass ich die einzelnen Worte „englisch“, oder “französisch“ oder „spanisch“ , und die restlichen Sprachen nicht oft verwenden kann. Sagen wir jemand googlet nach „englisch lernen“, und aus SEO-Sicht wäre es gut auf der Seite die ranken soll 10x „englisch“ einzubinden, das ginge, aber dann wäre da kein Platz mehr für 10x „französisch“, „spanisch“, etc. D. h. diese EINE Seite würde für englisch lernen evtl. gut ranken, aber kaum für die anderen Sprachen, oder??? Ausserdem ist es wohl auch aus verkaufstaktischer Sicht vermutlich besser dem Kunden der englisch lernen will eine Seite anzuziegen die EXAKT zum Thema „englisch lernen“ erstellt worden ist, und nicht eine auf der er theoretisch auch noch andere sprachen lernen könnte. Also auch ne schlechte Lösung…was ist in so einem Fall die best practise? danke