Duplicate Content

Wörtlich übersetzt bedeutet Duplicate Content doppelter Inhalt und ist das Vorkommen identischer oder sehr ähnlicher Inhalte auf mehreren URLs im Web. Dies kann auf mehreren Unterseiten innerhalb einer Website, aber auch auf verschiedenen Websites vorkommen. Solch eine Dopplung kann beabsichtigt, aber auch unbeabsichtigt geschehen.

Die Problematik mit Duplicate Content

Erkennt eine Suchmaschine Duplicate Content, so wirkt sich dies negativ auf die Suchmaschinenoptimierung einer Website aus. Google möchte, dass Websites einzigartigen Content bieten. Haben mehrere URLs denselben Inhalt, so kann Google nicht einschätzen, welche Seite den Content erstellt hat und welche von beiden den größten Mehrwert für die User bildet. Auch muss Google seine zeitlichen Kapazitäten verwalten und es kann sein, dass der Crawler abbricht, wenn man zu viel Duplicate Content anbietet. Dies kann dazu führen, dass wichtige URLs nicht indexiert werden und der Nutzer gar nicht erst auf die eigene Seite findet. Schließlich hat auch Google nur begrenzte Kapazitäten und kann nicht unbegrenzt Inhalte speichern.

Arten von Duplicate Content

Exakt gleicher Inhalt oder große Teile gleichen Inhalts
Inhalte sind über mehrere Domains, Subdomains bzw. URLs erreichbar (www / non-www / http / https / index.html / ?utm= …)
verschiedene mobilfreundliche URLs, Druckerfreundliche URLs, CDN–Anbieter …
Tag-Seiten, Pressemitteilungen Syndizierte Inhalte, Identische Seitentitel und Descriptions …

Übersetzungen, unterschiedliche Seiten mit gleichen Metadaten und Inhalte in Apps werden nicht als Duplicate Content gezählt.

Entstehung von Duplicate Content

Duplicate Content kann viele verschiede Ursachen haben:

Inhalte sind mit und ohne www., sowie über http und https erreichbar
Inhalte sind in einem Onlineshop unter verschiedenen Sortierungen zu finden (z.B. bei Saisonware und Garten)
Wechsel der Domain ohne Löschen der alten Inhalte
Besitz verschiedener Domains mit gleichem Inhalt, um eine Verwendung durch Dritte zu verhindern.
Druckversionen von einzelnen Seiten
verschiedene Sprachversionen einer Seite
mobile Versionen mit identischem Inhalt
Verwendung von Inhalten, die von Fremdwebsites kopiert wurden.

Vermeidung von Duplicate Content

Es gibt verschiedene Möglichkeiten Probleme mit Duplicate Content zu beheben oder ihnen direkt vorzubeugen.

Weiterleitungen: Mit einer http 301-„Moved permanently“-Umleitung erscheint der Duplicate Content nicht mehr in den Suchergebnissen und die Nutzer werden direkt auf die neue URL dieser Seite weitergeleitet. Dies bietet sich beim Umzug der Website an.
Der Canonical Tag: Dies ist ein Tag, der in den HTML-Code der Website eingebaut wird und angibt, dass die Seite ein Duplikat ist, mit Hinweis auf das Original. Dies eignet sich gut bei Druckversionen.
Ausschließen der Indexierung: Wird der Duplicate Content ausgeschlossen, hat Google auch hier kein Problem zu entscheiden, welche von beiden Seiten indexiert werden soll.

Am sichersten ist es immer noch, wenn man darauf achtet einzigartige und hochwertige Inhalte für seine Website zu kreieren. Wenn sich Duplicate Content nicht vermeiden lässt, ist es sinnvoll, auf eine der oben genannten Methoden zurückzugreifen. Auch sollten die folgenden technischen Aspekte bei der Websiteerstellung berücksichtigt werden:

Bei Domainwechsel muss von der alten auf die neue eine Weiterleitung eingerichtet werden und es sollte immer auf die korrekte Unterseite verlinkt werden.
URLs sollten sich auf die kleingeschriebene Variante beschränken.
Hat eine Liste verschiedene Sortieroptionen, so sind diese per Canonical Tag auf eine Variante der Sortierung zu begrenzen.
Auf Seiten, die Ergebnisse, wie beispielsweise Blogbeiträge zusammenfassen, ist es hilfreich diese Beiträge nur kurz anzureißen oder einen separaten Vorschautext zu verwenden.

Zurück zum Glossar