Die technische Seite der Suchmaschinenoptimierung ist die Grundlage aller Erfolge. Die Sicherstellung der „Crawlability“ der Inhalte hat daher oberste Priorität. Zudem ist es wichtig, den Crawler nicht an Seiten herankommen zu lassen, die man ohnehin nicht im Index haben möchte und den Index gleichzeitig nicht mit unnützen Seiten zu überfrachten.
Die goldene Regel bei der Steuerung der Indexierung lautet: “Jede Seite im Index muss eine Suchanfrage beantworten, die ein Nutzer so bei Google stellt.
Ist dies nicht der Fall, erfüllt diese Seite aus Sicht der Suchmaschine keinen Zweck und mindert die Qualität der Domain insgesamt.”
Der zweite wichtige Grundsatz für die Indexierung lautet: Jeder Inhalt darf nur unter einer einzigen URL abgerufen werden können. Diese URL nennt sich auch die „kanonische URL“
Führen mehrere URLs zu gleichen Inhalten entsteht ein Problem durch sog. „Duplicate Content“ und “Keyword-Kannibalisierung”*. Eine mögliche Lösung für diese Problematik stellt der sog. „Canonical Tag“ dar.
Der vergleichsweise neue „Canonical Tag“ ist ein weiterer Schritt der großen Suchmaschinenbetreiber um dem „Duplicate Content“ “Herr zu werden”. Allerdings ist die Anweisung durch den Canonical-Tags lediglich eine Empfehlung an die Suchmaschine, was bei unsachgemäßem Einsatz, wie z.b. bei der Paginierung zu einem Problem wird.
Aus diesem Grund habe ich in diesem Artikel die häufigsten Fehler, die beim Einsatz des Canonical-Tags entstehen können aufgeführt und erkläre hierbei, wieso dies ein Problem ist und wie es sich vermeiden lässt.
Wie macht man es richtig?
Google selbst empfiehlt für den Einsatz des Canonicals folgende Best Practice:
1. Weitgehende Übereinstimmung
Ein Großteil der Information der Duplikatsseite sollte auf der kanonischen Version enthalten sein.
2. Vorgehen bei der Überprüfung
Um dies zu überprüfen, empfiehlt Google sich vorzustellen, man verstünde die Sprache der Seite nicht und die kanonische und die duplizierte Seite nebeneinander zu legen und zu überprüfen ob ein sehr großer Teil der Wörter auf beiden Seiten identisch ist.
3. Canonical Tag wird von Google ignoriert
Wenn die Seite lediglich thematisch ähnlich sind, aber nicht wortwörtlich übereinstimmen, kann der Canonical-Tag von den Suchmaschinen ignoriert werden!
4. Existenz der Zielseite überprüfen
Überprüfe stets, dass das Ziel des Canonical-Tags auch tatsächlich existiert.
5. “Noindex” Status überprüfen
Stelle sicher, dass die kanonische URL keinen “noindex” Robots Meta-Tag enthält.
6. Ist die kanonische URL diejenige, die auch in den Suchergebnissen erscheinen soll (anstatt der duplizierten URL)
7. Platzierung des Tags an verschiedenen Stellen möglich
Der Canonical-Tag kann sich sowohl im <head> Element der Webseite als auch im HTTP-Antwort-Header befinden.
8. Nur einen Canonical-Tag definieren
Definiere nur EINEN Canonical-Tag. Sollte dieser mehrfach vorhanden sein, werden sämtliche Canonical-Tags ignoriert!
Fehler 1: rel=canonical** auf die erste Seite einer Paginierung
Dieser Fehler wird leider immer wieder gemacht. Man möchte natürlich, dass die Kategorieseiten gut ranken und so kommen viele SEOs auf die Idee mithilfe des Canonical-Tags die paginierten Seiten 2,3,4 etc. auf die erste Seite zu verweisen, um dort die maximale Kraft zu bündeln.
Stelle Dir vor, Du hast beispielsweise URLs wie:
- example.com/kategoriexyz/
- example.com/kategoriexyz/?seite=2
- example.com/kategoriexyz/?seite=3
und so weiter.
Hier nun den “rel=canonical” von Seite 2 und den Folgenden auf die erste Seite zeigen zu lassen, ist kein korrekter Einsatz des Canonicals, da dies keine Duplikate der ersten Seite sind!
In diesem Beispiel sorgt der Canonical-Tag sogar dafür, dass der gesamte Inhalt dieser Seiten nicht indexiert wird und auch die dort enthaltenen Links auf weitere Produkte etc. nicht von der Suchmaschine gewertet werden. Manchmal ignoriert Google jedoch falsche Angaben im Canonical-Tag, wenn sich die Seiten unterscheiden.
So geht es richtig:
Im Falle von paginierten Seiten sollte man entweder den Canonical-Tag auf eine URL zeigen lassen, auf der alle Produkte gelistet sind (“View-All-Page”) oder den Canonical-Tag selbstreferenzierend auf die jeweilige Seite. Den “rel-prev” und “rel-next” Link beachtet Google nicht (mehr) und Seite 2 und Folgende auf “Noindex” zu setzen, ist leider auch keine Lösung mehr, seit dem Google Long-Term-Noindex-Seiten wie Nofollow-Seiten behandelt.
Fehler 2: Absolute URLs versehentlich als relative URLs verwendet
Der Canonical-Tag akzeptiert grundsätzlich sowohl relative als auch absolute URLs. Hierbei kann es jedoch zu falscher Verwendung kommen, insbesondere wenn die Seite mit einem “<base>-Tag” und relativen URLs arbeitet.
wird fehlerhaft interpretiert, je nachdem in welchem Verzeichnis sich die Seite gerade befindet als:
http://example.com/example.com/cupcake.html oder gar http://example.com/verzeichnis-der-aktuellen-seite/example.com/cupcake.html
Idealerweise wird die gesamte URL angegeben:
oder die absolute URL ohne Domain angegeben:
Denn auch bei Verwendung einer relativen URL wie:
kann es in einem Unterverzeichnis dazu kommen, dass die URL falsch zusammengesetzt wird.
Fehler 3: Versehentliche Mehrfachverwendung des Canonical-Tags
Gerade bei selbst entwickelten Content Management– oder Shop-Systemen kann es passieren, dass mehrere Regeln greifen und der Canonical-Tag dann Doppelt oder gar noch häufiger ausgegeben wird.
Ist dies der Fall ignoriert Google sämtliche Anweisungen und behandelt die Seite wie eine URL ohne Canonical-Tag!
Fehler 4: Canonical-Tag um unterschiedliche Seiten zusammen zu fassen
Insbesondere seit das Page-Rank-Sculpting mit internen “Nofollow”-Links nicht mehr funktioniert, versuchen viele SEOs die Kraft von Seiten, die zwar sehr viele Links erhalten, aber eigentlich gar nicht ranken sollen (Beispiel Impressum, AGB, Datenschutz) mittels Canonical-Tag auf eine gewünschte SEO-Landingpage zu verschieben. Leider ist diese Mühe zumeist vergeben, da die Seiten einfach zu unterschiedlich sind und außerdem die Gefahr besteht, dass Google sämtliche Canonical-Tags der Domain ignoriert.
Fehler 5: Der Canonical-Tag im <body> der HTML-Seite
Das Canonical-Tag gehört in den “<head>-Bereich” des HTML-Dokuments. Findet die Suchmaschine einen Canonical-Tag im “<body>” wird dieser schlicht ignoriert. Zu groß wäre hierbei die Gefahr durch eingeschleusten Code von Außen die Kraft der URL abziehen zu können.
Fehler 6: Keinen “Rel-Canonical” bei URL-Parametern
Bei vielen Seiten ist standardmäßig gar kein Canonical-Tag implementiert. Der Bedarf wird häufig nicht gesehen, doch auch wenn man nicht bewusst mehrere Seiten zusammenführen möchte, sollte der Canonical-Tag stets auf die kanonische URL zeigen, also auf die URL unter der die jeweilige Seite erreichbar ist. Der Grund hierfür sind URL-Parameter, die sich häufig durch Tracking oder andere Gründe in die URL einschleichen und schnell für eine Mehrfacherreichbarkeit sorgen und im schlimmsten Falle Duplicate Content verursachen.
Selbst SEOs machen diesen Fehler, wie man bei einer Abfrage von SEO mit “inurl:utm_source” leicht herausfinden kann:
Fehler 7: Keinen Canonical-Tag in der mobilen Webseite
Mobile Webseiten werden immer wichtiger, soviel ist klar. Oft wird die Webseite für mobile Endgeräte unter einer anderen URL ausgeliefert, z.b. “m.example.com” oder Ähnliches.
Wichtig hierbei ist es, die mobile Variante nicht nur von der Normalen aus mittels “Rel-Alternate” anzugeben:
Sondern eben auch auf der mobilen Webseite dann die jeweilige URL der Desktop Version im Canonical-Tag anzugeben:
Dies empfiehlt Google auch explizit im Leitfaden für mobile Webseiten.
Fazit
Ich hoffe dass ich mit diesem Artikel einige Fehlannahmen beseitigen konnte und Ihr nun den Canonical-Tag korrekt einsetzen könnt.
Falls Euch noch häufige Fehler einfallen oder Ihr Fragen zu konkreten Anwendungsfällen des Canonical-Tags habt, freue ich mich sehr über einen Kommentar!
* Kannibalisierung im Marketing findet statt, wenn sich unterschiedliche Produkte eines Unternehmens in direkter Konkurrenz zueinander befinden, das heißt den gleichen Markt bearbeiten und sich gegenseitig Marktanteile rauben. In Sachen SEO bedeutet die Kannibalisierung auf Keyword-Ebene, dass sich mehrere Seiten gegenseitig im Ranking Konkurrenz machen, da diese zu ähnlich sind und auf die gleichen Begriffe abzielen. Oft treten dadurch negative Effekte auf, so dass keine der Seiten wirklich gut rankt, da die Suchmaschine nicht entscheiden kann, welches die „richtige“ bzw. die beste Seite zu diesem Begriff ist. Daher rankt meist keine der Seiten.
** http://googlewebmastercentral.blogspot.de/2013/04/5-common-mistakes-with-relcanonical.html
Guter Artikel. Bin darüber gestolpert, da ich gerade gestern meine selbstgestrickte “Uralt-Webseite” aktualisiert habe und nach Einreichen der Sitemap in der Google Search Console unter “Abdeckung” gelesen habe, dass eine Seite wegen “Duplicatcontent” nicht indexiert wurde. Und das ist leider gerade die HAUPT- bzw. Startseite. Der HJinweis der Meldung lautet: “Duplikat – eingereichte URL nicht als kanonisch festgelegt” Nun, die Startseite lautet einerseits auf www………….index.html (das ist auch diejenige welche “beanstandet” wurde. Ansonst wurde in der Sitemap auch die normale url der Startseite hochgeladen. Diese wurde akzeptiert. Wohin gehört nun der Canonical-Tag , in die “index-seite” oder in die normale… Weiterlesen »
Die .index.html und die domain ohne was dahinter http://www……….de/ sind wohl identisch, wenn ich deine Ausführungen korrekt interpretiere. Daher würde ich Dir vorschlagen, den Canonical Tag auf der index.html auf http://www….de/ zu stellen. Dann haste dort die Startseite und kein Duplikat mehr unter index.html
Danke bestens für den Tip. Ja, du hast recht. Beide Seiten sind intentisch. Also Canonical-Tag in die “Index-Seite”.
In der Zwischenzeit habe ich den Canonical auf der indek-Seite hochgeladen und dieser wird im Header auch korrekt angezeigt. Leider aber ist die index-Seite nach wie vor einzeln aufrufbar. Benötigt das eine gewisse Zeit bis der Canonical greift (Beispiel bis zum nächsten Google-Crawling) oder müsste die Index-Seite nach den Upload des Canonical sofort weg sein?
Interessanter Artikel. Ich habe gerade überlegt wie ich das auf einer Affiliate Seite löse auf der pro Kategorie 50 Artikel angezeigt werden. Google mag ja verständlicherweise keine Linklisten. Wenn jeweils der Titel, das Bild und ein “zum Shop” Button verlinkt sind macht das pro Seite 150 externe “nofollow” Links. Ich denke mir mal das kann nicht gut sein, muss aber sagen das Ranking ist dafür wirklich nicht schlecht. Jetzt mache ich gerade einen Test bei dem ich zuerst nur die ersten 5 Ergebnisse ausgebe (url: https://www.domain.de/shop?marke=test&modell=test&sent=1) danach einen “mehr anzeigen…” Balken mit Link zu (url: https://www.domain.de/shop?marke=test&modell=test&sent=2) wo dann die kompletten… Weiterlesen »
Vielen Dank für den tollen Artikel! Ein Aspekt des canoncial-Links, der mich gerade beschäftigt, sind Produktseiten in einem Online-Shop, der sehr viele Varianten-Artikel anbietet. Eine Variante kann beispielsweise das gleiche T-Shirt in rot oder weiß sein. Jede Variante ist einzigartig und ist über eine eigene URL aufrufbar. Trotzdem unterscheidet sich der Content nur minimal. Allerdings hat jede Variante eine eigene Artikelnummer und sollte deshalb auch selbst ranken bzw. über Google gefunden werden können. Empfiehlt es sich trotzdem, mit einem canonical Link von allen Varianten z.B. auf die günstigste Variante zu verweisen? Oder würde Google einen nicht vorhanden canonical-Link in diesem… Weiterlesen »
Das ist immer ein Grenzfall, den man je nach Anzahl und Bedeutung der Farbvarianten individuell entscheiden muss. Falls man nicht jede Farbvariante zum ranken bringen kann oder will, sollte idealerweise die Farbe über einen gesperrten Parameter ausgewählt werden, so dass der Googlebot die Varianten garnicht lesen kann. Zumindest sollte der Canonical hier, trotz kleiner Abweichungen greifen, zur Sicherheit würde ich alle, bis auf eine Farbe auf noindex setzen oder einen Artikel mit mehreren Farben, die zur Wahl stehen in Title etc. in den Index nehmen und die einzelnen Farben nicht. ODER eben jede Farbe ausoptimieren und separat zum ranken bringen.… Weiterlesen »
Hallo Kai, Entweder stehe ich gerade etwas auf dem Schlauch, oder aber es ist etwas unglücklich formuliert, wie eine korrekte Pagination ausgezeichnet sein sollte. Einerseits schreibst Du, bzw. ist die Google Vorgabe: “Ein Großteil der Information der Duplikatsseite sollte auf der kanonischen Version enthalten sein.” “Wenn die Seite lediglich thematisch ähnlich sind, aber nicht wortwörtlich übereinstimmen, kann der Canonical-Tag von den Suchmaschinen ignoriert werden!” Andererseits aber: “Im Falle von paginierten Seiten, sollte man entweder den Canonical-Tag auf eine URL zeigen lassen, auf der alle Produkte gelistet ist …” Das wären dann in Deinem Lösungsvorschlag doch komplett unterschiedliche Inhalte? Einmal eine… Weiterlesen »
Hallo Frank, zu deinen Fragen: Im ersten Punkt ist mein Artikel in der Tat etwas unglücklich formuliert. Laut Google sollte die URL exakt übereinstimmen, oder wie im Beispiel mit der View-All-Page den Inhalt vollständig enthalten. So wären hier Seiten 1 bis X auf eine gemeinsame View-All-Page kanonisiert, die alle Produkte enthält, die auf den paginierten Seiten aufgeteilt zu sehen sind und damit stimmen die Inhalte ebenfalls überein! Mit dem Thema Long-Term-Noindex sprichst Du einen guten Punkt an: Mittlerweile lasse ich das noindex auf den Seiten 2 und folgenden ebenfalls weg, da Google hier mehrfach nachgelegt und diese Vorgehensweise als die… Weiterlesen »
Hallo Kai, ja, mittlerweile habe ich das noindex auf den gepagten Seiten auch bei allen Kunden raus genommen und stattdessen bei allen gepagten URLs ein Canonical auf sich selbst. Finde ich auch blödsinnig, aber irgend ein kleinstes Übel muss man ja wählen 😉 Bei den kanonischen Verweisen der einzelnen gepagten URLs auf eine View-All zweifle ich etwas daran, dass Google das tatsächlich so korrekt interpretiert, speziell bei einer größeren Anzahl gepagter URLs. Da auch in der GSC immer wieder verwirrende eigene Google-Theorien zu “vermeintlich korrekten” kanonischen URLs auftauchen, traue ich deren Fähigkeiten nicht so weit wie ich gucken kann. Und… Weiterlesen »
Ich habe unter Fehler 3 Ursprung meines Problems gefunden, jedoch keine Lösung… Wie schaffe ich die kryptischen Seiten (bspw. “8/?et_blog”) von meiner Website gelöscht? Gefühlt sind sie genauso viele wie meine Beiträge