Inhaltsverzeichnis:

Duplicate Content – Der Killer Deiner Rankings

Duplicate Content – Der Killer Deiner Rankings

Lesezeit: 9 Min

Du hast Deine Webseite mit Content bestückt, den ein oder anderen Backlink eingesammelt und doch kommst Du mit Deiner Seite nicht weiter nach vorne im Ranking. Dann gilt es hier, sich die Frage zu stellen, habe ich Duplicate Content im Umlauf?

Für Duplicate Content kann es mehrere Faktoren geben darunter technische Aspekte, aber auch Textklau. Wie dieser doppelte Inhalt vermieden werden kann, beziehungsweise behoben werden kann wird in diesem Artikel aufgedeckt.  Hierfür gibt es einige Tools, die ich später näher vorstellen werde.

1. Doppelter Inhalt aufgrund des fehlenden “Trailing Slash”.

Webseiten die ohne Dateiendung aufgebaut werden (.html, .php, etc.) und je nach Einstellung des verwendeten Systems und Servers kann es vorkommen, dass am Ende der URL ein Slash „/“ fehlt. Daher ergeben bei einer Abfrage zwei URLs einen Statuscode „200 OK“ zurück. Diese Prüfung kann mit dem Chrome Browser erfolgen, hier wird nicht wie bei Firefox automatisch ein Slash angehängt. Du kannst auch andere Tools, wie “SEO-Tools for Excel”, oder das Online-Tool „httpstatus“ zur Prüfung verwenden.

Auch wenn Dein Contentstück eigentlich unique ist, stellst Du durch diesen Fehler einen doppelten Inhalt her und behinderst Dich  so selbst an der Erreichung eines besseren Rankings.

2.  Umstellung auf https – Ist wirklich alles umgeleitet?

Seit dem 25. Mai 2018, dem DSGVO-Armageddon, ist die Nutzung eines SSL-Zertifikats, also die Umstellung der Website von „http“ auf „https“ erforderlich. Meist wird hier allerdings nur die Richtigkeit der Startseite überprüft, die Unterseiten aber außer Acht gelassen. Die richtige Anpassung der .htaccess ist hier vonnöten, damit auch alle Unterseiten nur über https erreichbar sind. Ist dies nicht der Fall, entsteht dasselbe Phänomen wie bei der Trailing Slash-Problematik. Auch hier gilt die Überprüfung über die o.g. aufgeführten Tools. Nimm das nicht auf die leichte Schulter und hab Deine Website im Griff.

So vermeidest Du DC nach der Umstellung von http auf https per .hatacces

So vermeidest Du DC nach der Umstellung von http auf https per .hatacces

 

3. Verwendung von non-www und www

Eine weitere Möglichkeit sich internen Duplicate Content aufzubauen, ist die Verwendung von www, sowie ohne www zum Aufruf der Webseite.

Gerade in früheren Jahren, als die meisten Webseiten noch komplett in HTML, PHP, etc. erstellt wurden, trat dieser Fehler mit am häufigsten auf. Auch heute gibt es diesen Fehler noch, meist bei selbstgeschriebenen CMS-Systemen. Da zeigt es sich wieder, dass ein Programmierer auch die wichtigsten Hausaufgaben der Suchmaschinenoptimierung beherrschen sollte. Also hab Deine Seite im Griff!

Duplicate Content: Statuscode "200 OK" wenn non-www und www eingesetzt wird.

Duplicate Content: Statuscode “200 OK” wenn non-www und www eingesetzt wird.

 

4. Aufruf der Seite mit index.html/.php, etc.

Der letzte Punkt der internen Duplicate Content verursachen kann ist, wenn die Webseite, insbesondere die Startseite nicht nur per Domainnamen, sondern noch mit einer Index-Anweisung aufgerufen werden kann. Viele noch händig geschriebene Webseiten und einige CMS-Systeme von heute, wie z. B.: Joomla!, TYPO3, Contao, Shopware, etc. beinhalten diese Aufrufmöglichkeit. Auch hier gilt es diese Aufrufe per .htaccess so umzuleiten, dass nur eine Version aufrufbar ist. In einigen Fällen, sind Systeme, bzw. Webseiten so aufgebaut, dass diese zwar ein Unterverzeichnis haben, aber dort auch eine index-Datei beheimatet ist. So kann dort auch über beide Wege, also direkter Zugriff per Verzeichnisaufruf, oder aber mit angehängter index.(Dateiendung) aufgerufen werden.

5. Duplicate Content durch internen Wettbewerb

Nicht nur aus technischer Sicht ist es unabdingbar, die eigene Webseite im Griff zu haben. Auch was den Content selbst angeht, muss hier auf eine klare Struktur und Zuweisung der Keywords geachtet werden. Um internen Duplicate Content zu vermeiden ist es wichtig, eine Keywordmap zu erstellen, also am Anfang sich damit auseinander zu setzen, welche Seite, für welches Keyword ranken soll. Hier gilt die Maßgabe:

omt logo

Eine URL darf / kann für mehrere Keywords ranken,
aber ein Keyword darf nur einer URL zugewiesen sein!

Wer diesen Rat befolgt, hat sehr viel richtig gemacht. Es gibt natürlich immer wieder Themen, die sich ein wenig ähneln, aber genau dafür ist es wichtig, über die Keywordmap und daraus resultierende interne Verlinkungen immer die richtige Seite zum Ranken zu bringen. Damit auf Deiner Webseite der richtige Inhalt zu Deinem gewünschten Keyword ranken soll, arbeite hier immer mit einem harten Ankertext.

Sinnvoll ist es, mit einer Pillar-Page-Strategie zu arbeiten. Dies bedeutet ein Thema als Säule, z. B.: Suchmaschinenoptimierung, darunter kommen dann weitere Artikel aus diesem Bereich. Innerhalb der Artikel kann dann aufgrund der verwendeten Keywords eine Verlinkung über harte Anker, ggf. Suchmaschinenoptimierung, zur Säulenseite, aber auch zu anderen Artikeln innerhalb des Säulensystems verlinkt werden. So bekommt die Webseite nicht nur eine gute interne Linkstruktur, nein es wird auch für Einzigartigkeit gesorgt.

Duplicate Content: Aufbau einer Keywordmap zur Vermeidung von internem DC.

Duplicate Content: Aufbau einer Keywordmap zur Vermeidung von internem DC.

 

Alles weitere, was Du zum Thema Pillar-Content beachten musst, kannst Du hier nachlesen!

6. Duplicate Content durch Metadaten

Im Rahmen der Suchmaschinenoptimierung ist es wichtig, auch die Metadaten, also Meta-Title und Meta-Description auf Vordermann zu bringen. Über einen Crawl mit Hilfe des Screaming Frogs, aber auch über die HTML-Verbesserungen die in der Google Search Console angezeigt werden, lassen sich so interne Fehlerquellen, die ein Ranking behindern eruieren und beheben. Oftmals tauchen doppelte Metadaten auf, wenn es Umzüge von Domaininhalten gab. Ein Beispiel ist hier die Zusammenführung von zwei oder mehr Inhaltsseiten. Solltest Du die alten URLs erreichbar lassen produzierst Du Duplicate Content.

Neben dem Screaming Frog, können auch andere Tools wie Ryte oder Sitebulb zum Einsatz kommen.Ryte und Sitebulb decken wie der Screaming Frog auch andere Fehler der Seite auf, liefern aber eine grafische Darstellung der Ergebnisse. Gerade für nicht SEOs erleichtert dieses „bunte Spektaktel“ die Arbeit erheblich. An dieser Stelle ist noch zu sagen, dass wenn Du in die Optimierung der Metadaten gehst, auch auf den Aufbau nach dem AIDA-Prinzip achtest. Der Einbau von Emojis hilft Dir zu einer verbesserten CTR. Felix Beilharz hat hierzu eine Liste mit den Emojis veröffentlicht, die auf jeden Fall ausgegeben werden: http://bit.ly/bunte-serps.

7. Duplicate Content durch Parameter, PDFs, o. ä.

Ein großer Aspekt in Sachen Duplicate Content sind auch PDFs, die indexiert werden. Meist steht in den PDFs der gleiche Text, wie auf der Webseite. Wenn dies der Fall ist, muss hier umgehend gehandelt werden. Wenn PDFs weiterhin als Download verfügbar sein sollen, muss alles was mit der Endung “.pdf” auf der Seite zu finden ist per robots.txt ausgeschlossen werden, um Duplicate Content zu vermeiden.

Des Weiteren sind Parameter innerhalb einer URL große Probleme für internen Duplicate Content. Durch Anhänge von Affiliate-Partnern oder durch Google Ads-Anzeigen besteht so die Gefahr für Duplicate Content. Daher ist es wichtig, die Parameterbehandlung der Google Search-Console im Auge zu behalten und nicht alles dem Bot zu überlassen. Dank der Parameterbehandlung der Google-Search-Console, lassen sich alle Parameter einer Webseite einzeln bewerten, wie mit diesen verfahren werden oder ob der Bot sich selbst damit auseinandersetzen soll.

Weitere Probleme für Duplicate Content können folgende Punkte sein:

  • Paginierungsseiten
  • URLs zu Druckversionen
  • URLs, die per Groß- und Kleinschreibung erreichbar sind
  • Produktdetailseiten, die Farben und Größen mit in der URL haben
  • Tag-Seiten, die vom System automatisch generiert wurden

8. Duplicate Content durch externe Seiten

Neben dem internen Duplicate Content gibt es auch noch Einflüsse externer Natur. So kann externer Duplicate Content, durch weitere, eigene, aber auch durch Fremdwebseiten vorhanden sein. Um dies herauszufinden, gibt es verschiedene Tools, wie z. B.: Copyscape, Siteliner  oder auch den XOVI Duplicate Content Checker. Meist handelt es sich hier nur um geringe Anteile, die auch auf anderen externen Webseiten erscheinen. Wir reden hier von ca. 10-20% des Textes, oft verursacht durch die Bereitstellung von PDFs, oder anderen Produkten. Dies ist noch die harmlose Variante. Viel schlimmer gestaltet es sich, wenn der Wert an die 100% geht, dann besteht ein gehöriges Problem, denn dann wird es schwer diesen Duplicate Content zu eliminieren.

Durch externen Duplicate Content, steht die eigene Domain so stark in Gefahr, dass eine Penalty durch die Suchmaschine droht und es somit ein Rauswurf aus den SERPs nach sich ziehen kann. Wenn Du hiervon betroffen bist, versuche den Betreiber der Seite anzuschreiben und zu bitten, den Text zu entfernen. Sollte dies nicht funktionieren, muss ein Anwalt her, der sich dann um alles weitere kümmert. Um nicht langfristig Gefahr zu laufen, dass einen die Abstrafung tritt, ist es hier ratsam schnellstens einen geänderten Text online zu stellen. Eine weitere Möglichkeit um Dir und Deiner Webseite zu schaden ist die Verwendung von Expired Domains, mit einem schlechten, giftigen Linkprofil. Wird eine solche Domain auf Deine URL weitergeleitet, erntest Du alle diese schädlichen Links. Solltest Du einen Abfall Deiner Rankings feststellen, führe einen Link-Detox durch. So kannst Du die schadhaften Backlinks per Disavow-Liste über die Google Search Console entwerten lassen.

9. Wie wirkt sich Duplicate Content auf die Suchmaschinenoptimierung aus?

Google, sowie alle anderen Suchmaschinen, mögen Duplicate Content nicht. Sorge also dafür, dass im Rahmen Deiner Suchmaschinenoptimierung einzigartiger Content erstellt wird, den es noch auf keiner anderen Webseite gibt. Sollte Duplicate Content vorhanden sein, kommst Du nicht sofort in eine Penalty rein, solltest aber ein Auge auf Deine Webseite haben und die vorliegend behandelten Punkte prüfen. Google selbst zeigt in der Search-Console-Hilfe auf, wie aktiv zur Vermeidung von Duplicate Content beigetragen werden kann. Duplicate Content wirkt sich natürlich negativ aus, da die Suchmaschine zum gegenwärtigen Zeitpunkt nicht wissen kann, welches Contentstück, also welche URL er nun priorisieren soll. Dadurch landen meist auch mehrere URLs im Index. Somit ist es wichtig, das Du Deine eigene Webseite im Griff hast.

Fazit: Halte Deine Seite im Griff

Duplicate Content ist nicht schön und gehört verhindert. Sollte er natürlich schon da sein, nichts wie ran und weg mit ihm. Die schnellsten Lösungen und besten Quick-Wins gibt es, wenn der eigene interne Duplicate Content behoben wird. Dies kannst Du selbst steuern und hast die Hygiene Deiner Webseite selbst in der Hand. Sollte es darüber hinaus noch externen Duplicate Content geben gilt auch hier, Eile ist geboten.

Mit den Aufräumarbeiten setzt Du die eigentlich schon längst abgeschlossenen Hausaufgaben um. Bevor Du in etwaige große Optimierungen gehst, prüfe zunächst, ob von der technischen Seite her alles im grünen Bereich ist. Nutze kostenlose Tools zur Prüfung von Content-, aber auch Metadatenduplikaten. Deine Rankings werden es Dir danken. Duplicate Content verursacht keine Penalty, aber Deine Webseite wird in den Suchergebnisseiten weiter hinten einsortiert. Wenn Deine Seite keinen Duplicate Content mehr aufweist, solltest Du einen positiven Impact innerhalb der SERPs spüren.