Duplicate Content

Duplicate Content bezeichnet gleichen Inhalt auf verschiedenen Websites und wird von Suchmaschinen wie Google durch Nichtbeachtung abgestraft. Kannst Du Duplicate Content nicht vermeiden, solltest Du ihn als irrelevant kennzeichnen. Wie Du mit Duplicate Content umgehst, zeigen wir Dir hier.

Duplicate Content – Darum solltest Du ihn vermeiden

Generell solltest Du auf Einzigartigkeit bei Deinem Content achten, um den Besuchern Deiner Website einen Mehrwert zu bieten. Außerdem kann bei der Verwendung von Duplicate Content Deine ganze Online Marketing Strategie hinfällig werden, weil Deine Website abgestraft wird. Wir geben Dir Taktiken an die Hand, wie Du Duplicate Content vermeiden kannst und worauf Du dabei achten solltest.

Was versteht man unter Duplicate Content?

Duplicate Content (doppelte Inhalte) bedeutet, dass derselbe Inhalt unter mehreren URLs auftaucht. Entweder auf derselben Domain oder auf verschiedenen Domains. Die Websites sind dabei entweder komplett identisch oder in Teilen übernommen. Mitunter lassen sich auch sehr ähnliche Formulierungen feststellen. Seiten mit gleichem Content stellen die Bots der Suchmaschinen, wie den Google Crawler, vor ein Problem: Er weiß nicht, welche Website den relevanteren Content hat und im Ranking der organischen Suchergebnisse angezeigt werden soll. Der Google Algorithmus ist so programmiert, dass jeder Content immer nur unter einer URL erreichbar sein soll. Bei den doppelten Inhalten unterscheidet man:

  • Intern Duplicate Content
  • Extern Duplicate Content

Interner Duplicate Content entsteht, wenn es auf derselben Domain mehrere unterschiedlichen URLs mit gleichen Texten oder Textteilen gibt. Interner identischer Text entsteht, wenn die Website über mehrere URLs erreichbar ist. Das passiert, wenn die doppelten Inhalte nicht mit einer 301 Weiterleitung auf die wichtigste Domain verweisen. Dies kann ganz einfach mit Hilfe der htaccess-Datei behoben werden. Sie liegt im Root Verzeichnis der eigenen Website.

Die interne Duplizierung von Content hat oft technische Ursachen. Das Content Management System verteilt die Texte auf HTTP und HTTPS Seiten. Ebenso auf Seiten mit www und ohne www Attribut. Erreichst Du die Website über Groß- und Kleinbuchstaben, dann gilt eine von ihnen als Kopie. Für uns User ist das alles gleich. In der Google-Suche gilt aber jede von ihnen als andere Domain.

Bei Shopsystemen entsteht doppelter Inhalt, wenn die Produktseiten unter mehreren Kategorien angezeigt werden. Darüber hinaus kommt gleicher Inhalt durch Stellenangebote, Printversionen von Websites und mobiltaugliche URLs zustande.

Führt dein Content deine Leser auf eine Reise, oder stopft er sie nur als Leads in eine Pipeline?

Ann Handley

Externer Duplicate Content als Problem

Externe Kopien stellen für Google und den Webmaster ein größeres Problem dar. Doppelter Content entsteht, wenn der Text einer Internetseite auf verschiedenen Domains erreichbar ist. Dies ist meist bei Online-Shops der Fall. Die Produktbeschreibungen werden oft vom Hersteller per RSS Feed übernommen. Danach werden sie dann nicht mehr umgeschrieben. Zitate, die im Quelltext nicht entsprechend gekennzeichnet sind, lassen sich ebenfalls nur als identische Textpassagen identifizieren. Wird ein Websiteinhalt nahezu unverändert als Pressemitteilung herausgegeben, gilt dieser für die Suchmaschinen als extern Duplicate Content. Kein Duplicate Content sind:

  • Übersetzungen einer Seite
  • in Apps dargestellte Texte
  • verschiedene Seiten mit dem gleichen Titel und der gleichen Beschreibung

Doppelt vorhandener Content bereitet dem Crawler Schwierigkeiten, den ursprünglichen Text zu identifizieren. Bei gleichen oder sehr ähnlichen Inhalten ist es nicht möglich, alles zu indexieren. Der Bot indexiert mal die eine und mal die andere URL. Wird der Duplicate Content nicht entfernt, kommt es beim Ranking in den Suchergebnissen zu Schwankungen. Außerdem schaffen extern Dupblicate Content keinen Mehrwert. Doch ist Content mit Mehrwert für ein hohes Ranking der Website und nicht zuletzt für die Besucher wichtig.

Google bestraft zwar doppelten Inhalt nicht grundsätzlich, weist aber darauf hin, dass duplizierter Text das Ranking in den SERPs negativ beeinflusst, wenn er nicht als solcher gekennzeichnet ist. Geht Google davon aus, dass Du Dein Google Ranking durch externen Duplicate Content manipulieren willst, musst Du mit einer Abstrafung rechnen. Das ist der Fall, wenn der Inhalt mit Absicht auf verschiedenen Seiten derselben Domain platziert ist. Der Website Traffic steigt dann zwar vielleicht, aber es ist trotzdem nicht von Vorteil, weshalb Duplizierter Content zu vermeiden ist. Semantische Suchmaschinen identifizieren Duplicate Content noch leichter. Kopierte Texte werden dann erkannt, wenn sie sprachlich zwar unterschiedlich sind, aber der Inhalt gleich ist.

Das kann zu Abstrafungen bei Duplicate Content führen

Im Normalfall wird nur externer Duplicate Content mit einer Abstrafung geahndet. Matt Cutts von Google sagte hierzu, dass dies vor allem bei Spam Inhalten und Keyword Stuffing der Fall sei.

Dies geschieht bei gespinnten und gescrapten Seiten. Gespinnte Seiten entstehen, wenn der Nutzer eine vorhandene Seite mithilfe eines Spinning Tools umschreibt oder übersetzt. Bei Scraper Websites handelt es sich um Seiten, die ein Programm automatisiert stiehlt. Die Abstrafung erfolgt durch eine Korrektur des Google Index. Die Folge: eine Verschlechterung des Rankings der Seite in den Suchergebnissen. Bei gravierenden Manipulationsversuchen nimmt Google die Inhalte komplett aus der Indexierung. Der User findet diese dann nicht mehr unter den Suchergebnissen.

Google rät dringend zur Vermeidung von duplizierten Inhalten. Nicht nur, um den Nutzern der Suchmaschinen Einträge und Informationen mit hohem Mehrwert zu bieten. Da der Bot regelmäßig Millionen neuer URLs crawlt und indexiert, sind seine zeitlichen Kapazitäten begrenzt. Trifft er auf interne identische Inhalte, ist es möglich, dass er die Erstellung des Index abbricht. Relevante Seiten berücksichtigt der Bot dann nicht mehr im Index. Trotz Googles immenser Speicherkapazität ist diese nicht unendlich. Daher solltest Du Duplicate Content vermeiden oder wenigstens als solchen markieren.

Online Agenturen, die Online Marketing Maßnahmen oder SEO Maßnahmen anbieten, kennen sich auch mit Duplicate Content aus. Eine SEO Beratung hilft also zum Beispiel auch in dieser Hinsicht, falls Du ratlos bist. Wende Dich für eine kostenlose Erstberatung sehr gerne an unsere Experten!

Am Online Marketing arbeitet das Team von Kundenwachstum bestehend aus Christian.
Am Online Marketing arbeitet das Team von Kundenwachstum bestehend aus Christian.
Christian Vogel

Online-Marketing ist wie eine Welle: Entweder man lernt, auf ihr zu surfen oder man geht in ihr unter.

So vermeidest Du Duplicate Content

Die beste Möglichkeit, Duplikate zu verhindern, besteht darin, sie nicht zu produzieren. Achte bei den Content Marketing Maßnahmen für eigene Domains unbedingt darauf, keine gleichen oder zu ähnlichen Formulierungen zu verwenden. Hast Du einen Online-Shop und stellst die Produkte über einen RSS Feed auf Produktvergleichsportalen ein? Dann solltest Du dies erst dann tun, wenn Deine Produktinformationen bereits indexiert sind. Denn SEO Manager gehen davon aus, dass der Suchmaschinen Crawler den Text als Original indexiert, der zuerst vorhanden war. Also keine Angst vor nachträglichem Content Diebstahl durch andere Seiten.

Noch besser für Dein Ranking: Schreibe den Content selbst. Füge interessante Informationen und eigene Kommentare hinzu. Reichere auch die Tag Seiten mit einzigartigen Inhalten an. Außerdem ist der Ausschluss bestimmter URLs über die Search Console (nofollow) eine praktikable Alternative zur Vermeidung von gleichen oder sehr ähnlichen Inhalten. Hilfreich ist auch die Anweisung an den Crawler, die Seite nicht in den Index aufzunehmen (noindex). Wie jedoch Google kürzlich mitteilte, sollte sich der Webmaster der Tatsache bewusst sein, dass es im Fall vorhandener Links im Backlinkaufbau in den Duplikaten zu einer Verschlechterung des Rankings kommt: Wird die Seite nicht indexiert, nimmt der Linkaufbau Schaden. Und darunter leidet dementsprechend Dein Link Juice. Dies ist jedoch beim Einsatz von Canonical Tags nicht zu befürchten. Googles SEO Experten raten außerdem, Probleme mit Duplicate Content folgendermaßen zu verhindern:

  • Verwende je Text nur eine URL.
  • Schreibe pro Seite nur über ein einziges Thema.
  • Variiere die URL nur, wenn es nicht anders geht.
  • Kannst Du die Kopien nicht entfernen, setze den Meta Robots noindex-Tag ein.
  • Achte auf einheitliches und schlüssiges internes Linkbuilding.
  • Führe identische Texte und Textpassagen unter einer einzigen URL zusammen.
  • Sorge dafür, dass Seiten ohne Inhalt und Platzhalterseiten nicht indexiert sind.

Duplicate Content: Absolute No-Go’s

  • Die Nutzung des Robots.txt. Dieser Bot verhindert, dass sich der Suchmaschinen Crawler die betreffende Domain anschauen kann, weil sie für ihn nicht erreichbar ist. Diese Form der Vermeidung von Duplicate Content hat oft eine Abstrafung zur Folge.
  • Das einfache Umschreiben der Inhalte, ohne Neues hinzuzufügen.
  • Die Verwendung von URL Removal Tools. Mit ihnen entfernst Du die URL lediglich aus den Suchergebnissen.

Bring Dein Online-Marketing 2021 ein Level weiter!

90 Minuten gratis Beratung

SEO
Optimierung

Nachhaltig mehr Reichweite und Sichtbarkeit in Deiner Zielgruppe erreichen!

SEA
Marketing

Schnell, direkt und zielgerichtet Angebote Deiner Zielgruppe präsentieren!

Marketing
Automation

Erstklassige Benutzererlebnisse für höhere Kundenbindung und Conversion!

Wie Duplicate Content überprüfen?

Die Vermeidung von doppelten Inhalten spielt im SEO Marketing eine wichtige Rolle. Dies gilt für genau doppelte und nahezu identische Texte gleichermaßen. Auch dieser Near Duplicate Content hat für den Leser keinen Mehrwert. Dadurch verschlechtert sich die User Experience. Zum Identifizieren von doppelten Inhalten gibt es im Internet verschiedene kostenfreie und kostenpflichtige Website Analysetools. Der Optimizer von SISTRIX bietet eine automatische Domainanalyse. Diese macht identische Inhalte ausfindig und zeigt sie in einer Liste an. Auf diesem Weg können sie Website Betreiber schnellstmöglich entfernen oder kennzeichnen. Durch das Content Management System verursachter doppelter Inhalt kannst Du mithilfe von MOZ oder dem Searchmetrics Crawler identifizieren. Auch bei diesen werden Dir die Duplizierungen angezeigt. Du kannst sie entfernen bzw. kanonisieren.

Ein komfortabel anzuwendendes Tool zum Aufspüren gleicher Inhalte auf der eigenen Website, ist Siteliner. Du gibst dort einfach die URL Deiner Domain ein und bekommst ähnliche Wörter und Phrasen angezeigt. Außerdem macht Dich das Tool sogar auf fehlerhafte Links aufmerksam. Externe Duplikate lassen sich gut mit Copyscape finden. Nach der Eingabe der URL durchsucht das Tool seine eigene Datenbank und externe Internetquellen. Anschließend stellt es die Treffer in einer Übersicht und mit Angabe der externen Quellen dar.

Interne und externe Duplikate kannst Du mithilfe des Google Suchfeldes finden. Du kopierst Deinen Text in Abschnitten von jeweils maximal 32 Wörtern in das Suchfeld und setzt die Textpassage in Anführungszeichen. Gibt es keine Duplikate, zeigt Dir Google nur ein Suchergebnis an, nämlich Deine eigene Webseite. Sind externe Kopien vorhanden, erhältst Du eine Auflistung der anderen URLs. Liegen innerhalb der Domain Ähnlichkeiten vor, bekommst Du einen entsprechenden Hinweis. Du siehst um welche URLs es sich handelt, wenn Du die Suche wiederholst. Mitunter tauchen dort sogar externe Kopien auf.

Rechtliche Konsequenzen bei Duplicate Content schneller erkennen

Diese Duplicate Checker sind nicht nur für ein gutes Ranking in Suchmaschinen wie Google wichtig. Widerrechtlich kopierte Texte stellen auch ein juristisches Problem dar: Die Verletzung des Copyrights kann Rechtsstreitigkeiten nach sich ziehen. Doch Vorsicht: Sogar die besten Checker bieten keine umfassende Sicherheit vor möglichen juristischen Auseinandersetzungen. Das liegt daran, dass der Google Index nicht alle im Internet vorhandenen Seiten erfasst. Dennoch greifen viele Programme auf diesen Index zurück. Außerdem kann der kopierte Inhalt aus Büchern oder von passwortgeschützten Websites stammen. Auf die hat der Google Crawler keinen Zugriff.

Die aufgeführten SEO Tools lassen sich Deinen Vorstellungen entsprechend einstellen. Du kannst generell wählen, ab welcher Anzahl von Wörtern ein Text als Duplikat gelten soll. Die Feineinstellung des Suchfilters identifiziert vier gleiche zusammenhängende Wörter als Kopie des Originaltexts. Außerdem sind die Plagiatsprüfungen mit einem unterschiedlichen Funktionsumfang erhältlich. Sie

  • markieren die entdeckten identischen Textstellen
  • prüfen den Content der Website selbsttätig
  • laufen unbemerkt im Hintergrund ab
  • dokumentieren die Ergebnisse der Plagiatsprüfung in vor Gericht verwertbaren Reports
  • lassen sich als Logo in die Website integrieren, damit Du Kopierende abgeschreckt.

Duplicate Content kennzeichnen

Enthält Deine Webseite gleiche Inhalte, die sich nicht verhindern lassen, hast Du grundsätzlich zwei Möglichkeiten. Für welche Du Dich entscheidest, hängt davon ab, ob der jeweilige Text dem Leser einen Mehrwert bietet oder nicht. Ist dies nicht der Fall, richtest Du eine 301 Weiterleitung zu einer wirklich relevanten URL ein. Der Leser kann den Inhalt der Seite, von der aus weitergeleitet wird, gar nicht erst sehen. Zum Erstellen der 301 Weiterleitung nutzt Du beispielsweise .htaccess. Damit nimmst Du eine Weiterleitung der Domain ohne www auf die mit www vor.

Doch Vorsicht: Nutzt Du die Weiterleitung zu häufig, kann dies das Ranking Deiner Website in den Suchergebnissen negativ beeinflussen. Ziehst Du Deine alte Domain auf eine neue um, verwende am besten .htaccess für eine 301 Redirect Weiterleitung. Dabei bleibt das zuvor erzielte Ranking erhalten.

Bei der Kanonisierung legst Du mithilfe der sogenannten Canonical Tags fest, welche URL die relevante Seite sein soll. Diese bieten Googles SEO Marketing Experten als zweite Lösung an. Die Seiten mit den Kopien sind für den Leser allerdings weiterhin erreichbar. Diese Methode eignet sich hauptsächlich für Onlineshops und Seiten mit Druckversionen. Die 301 Weiterleitung und die Canonical Tags helfen beim Identifizieren der ursprünglichen Inhalte. Jedoch haben sie aber keinen Einfluss auf das Ranking der Domain in den Suchmaschinen.

Bist Du unsicher, was den Aufbau Deiner Website mit allen Unterseiten angeht? Nicht nur in Sachen Duplicate Content? Dann empfehle ich Dir, unsere GRATIS Sichtbarkeitsanalyse. Wir geben Antworten auf solche Fragen, decken Potential zur technischen und SEO Optimierung auf und wie diese umzusetzen ist.

Detaillierte Auswertung und direkte Optimierungs-
vorschläge, komplett kostenlos und unverbindlich.

Detaillierte Auswertung und direkte Optimierungsvorschläge, komplett kostenlos und unverbindlich.

Fazit

Der Algorithmus von Google bevorzugt zweifellos einzigartigen Content gegenüber Duplicate Content – daher gilt es diesen, so gut es geht, zu vermeiden. Dies ist dennoch nicht immer möglich, vor allem, wenn es sich um kleine Textpassagen handelt. Dabei sollte doppelter Inhalt in jedem Fall gekennzeichnet werden. Generell solltest Du mit Sorgfalt darauf achten, unnütze Dopplungen zu umgehen. Bei kleineren Webseiten werden die Konsequenzen noch nicht unbedingt deutlich, spätestens wenn Deine Webseite wächst und Du mehr Unterseiten aufbaust, kann es fatal werden.

Du hast Fragen zum Duplicate Content ?
Hier findest Du passende Antworten!

Laut Aussagen von Google ist Duplicate Content kein negativer Rankingfaktor und wirkt sich damit nicht nachteilig auf den Rang in der Suchmaschine aus. Diese Information ist jedoch nur auf Duplicate Content – also einzelne Inhaltsbereiche einer Seite – und nicht etwa auf Duplicate Pages anzuwenden.

Werden ganze Seiten kopiert, berücksichtigt Google dabei nur die Page, welche dafür den Algorithmus am relevantesten ist. Doch für die weniger relevante Seite hat auch dies keine negativen Auswirkungen auf das Google Ranking.

Trotzdem solltest Du externe doppelte Inhalte durch 301-Weiterleitungen, Canonical Tags oder einen noindex Meta Tag verdeutlichen, um sicherzustellen, dass Du keine fremden Inhalte unrechtmäßig kopierst. Denn dies wird von Google durchaus als Täuschungsversuch gewertet und kann sogar zur Entfernung Deiner gesamten Website führen.

Bei einer kanonischen Seite handelt es sich um das Original. Werden von dort Inhalte dupliziert, weiß Google, dass die kanonische Seite für den Algorithmus relevanter ist und ignoriert die Seite mit dem Duplicate Content – ohne sie abzustrafen.

Um dem Bot der Suchmaschine dies zu verdeutlichen, setzt Du einen Canonical Tag via Quellcode in den Header der Seite. So signalisierst Du Google, dass die jeweilige Page die originalen Inhalte enthält. Dies kommt beispielsweise bei doppelten Produktbeschreibungen in einem Online-Shop oder Blogartikeln vor, welche mehrmals in verschiedenen Kategorien erscheinen.

Du möchtest noch mehr Wissen?

Weitere Tipps und interessante Artikel findest Du in unserer Ratgeber-Übersicht.

Beginnen Sie mit der Eingabe und drücken Sie Enter, um zu suchen