Wie setze ich einen Canonical

Voraussichtliche Lesedauer: 8 Minuten

Canonicals – technische Möglichkeiten für mehr organischen Traffic

Es ist viel über das Thema der technischen Suchmaschinenoptimierung geschrieben worden. Zu unserem großen Erstaunen gibt es aber immer noch Probleme mit den HTML-Elementen Canonical, Noindex und Hreflang. Von vielen Webentwickler*innen und SEO-Fachleuten wird der Nutzen dieser Tags unterschätzt. Was es damit auf sich hat und welchen Einfluss diese Seo Technical Issues auf die Suchmaschinenergebnisse haben, möchten wir in diesem Blogbeitrag kurz erläutern.

Das Problem des Duplicate Content

Um ein besseres Verständnis zu ermöglichen, gehen wir zunächst darauf ein, welchen Einfluss der Duplicate Content auf die organische Suche hat. Die Indexierung von Webseiten kostet Suchmaschinenbetreibern viel Zeit und damit Geld. Sie wollen die Mehrfachindexierung von Seiten mit gleichem Inhalt so weit wie möglich vermeiden, um diese Betriebskosten zu senken. Existieren Seiten mit nahezu identischen Inhalten und Suchbegriffen, so konkurrieren diese um die Spitzenpositionen bei den Suchanfragen. Dieser Prozess lässt sich treffend als “Kannibalisierung” oder “Keyword Canibalisation” bezeichnen. Google „motiviert“ mit dem Ranking Systems Guide die Website-Betreiber, Duplicate Content zu vermeiden, indem inhaltsidentische Seiten mit einem schlechteren Ranking bestraft werden.
Aber auch doppelte URLs mit identischem Inhalt sind von diesem Problem betroffen. Man spricht von Dopplungen der URLs, wenn eine Seite unter mehreren URLs (oder mit unterschiedlichen Schreibweisen) erreichbar ist. Alle Domains mit identischem Inhalt werden von Google mit einer deutlich schlechteren Platzierung in den Suchergebnissen bestraft. Und noch nachteiliger ist manchmal, dass Google selbst eine Seite zur Hauptseite erklärt: „Eine kanonische URL ist demnach die URL einer Seite, die Google als die repräsentativste aus mehreren duplizierten Seiten ausgewählt hat.“ Was versteht Google unter Kanonisierung? Kanonisch ist die ursprüngliche URL, die aus der Sicht von Google als Hauptdomain fungiert.

Mit welchen Richtungs- und Stoppschildern kann man Google die Anweisung zur Indizierung bzw. Nichtindizierung von Seiten geben, um Probleme mit Duplicate Content zu vermeiden? Dies möchten wir im Folgenden kurz erläutern.

Canonicals – die Richtungsweiser für Suchmaschinen

Seiten mit identischem Inhalt und gleicher Keyword-Optimierung lassen sich nicht immer vermeiden. Auf welcher Seite befindet sich der Originaltext? Diese Entscheidung sollte keinesfalls Google & Co. überlassen werden. Während man sich wegen des „Kopierens“ an die Konkurrenz wenden muss, kann man den eigenen inhaltsgleichen Website-Content mit einer Reihe von technischen Lösungen priorisieren.
Das Problem des doppelten Inhalts gilt auch für Duplikate- Websites. Es muss angegeben werden, welche Webseiten von der Indexierung ausgeschlossen oder als Hauptseite zugelassen sind. Google weiß somit Bescheid und belohnt die „Arbeitsersparnis“ beim Crawlen mit einem besseren Ranking der Seiten.

Woher wissen Google, Microsoft und Yahoo, welches die Originale sind?

Wie bereits erwähnt: Suchmaschinen priorisieren nach eigenem Ermessen. Und das muss nicht unbedingt im Einklang mit unseren eigenen Zielen stehen. Mit dem HTML-Element Canonical Tag, in das ein Link eingebettet ist, kann auf die Seiten verwiesen werden, auf denen sich der Hauptinhalt befindet. Man gibt den Suchmaschinen einen Richtungsweiser in Form eines Links, der angibt, wo das eigentliche Original zu finden ist. Er legt fest, welche Seiten mit sich wiederholenden Inhalten ignoriert und somit nicht indexiert werden sollen.
Dieser Tag gehört direkt in den HEAD-Bereich der Webseite. Er sollte niemals im Body-Bereich stehen, da er dort von Google ignoriert wird. Unser Beispiel-Link führt direkt zu unserem ursprünglichen Blog-Beitrag und dem Quelltext: Hier müsste der Link stehen, geht aber nicht durch die Linkkontrolle.

1. Bei Seiten mit identischen Inhalt und gleicher Keyword-Optimierung zeigt der Canonical mit dem Link den Suchmaschinen an, auf welcher Landingpage der Originaltext zu finden ist. Damit wird dem Crawler von vornherein signalisiert, was zu tun ist. Verständlicherweise sollten diese Links niemals auf 404-Seiten verlinken.
Seiten, auf denen der Originaltext steht, werden mit einem selbstreferenzierenden Canonical-Link-Tag versehen. Selbstreferenzierend bedeutet, dass der Link auf dieselbe Seite (auf sich selbst) verweist und den zu indexierenden Originalinhalt enthält.

2. Auch bei mehreren URLs einer Domain, also Variationen von URLs, markiert das Canonical-Tag die Domain-Adresse, die beim Crawlen den Vorrang haben soll. Verweist das Tag auf eine andere Domain, wird der Originaltext auf dieser Zielseite angezeigt.
Wenn der Link selbstreferenzierend ist, also auf die gleiche Seite verweist, erkennen die Bots, dass es sich bei dieser URL-Variante um die Haupt-URL der Domain handelt, die auch als kanonische Ursprungsseite bezeichnet wird. Sie erhält Priorität bei der Indexierung. Die Link-Popularität der verweisenden Seiten wird ebenfalls auf diese Hauptdomain übertragen.

Noindex Tag – das Stoppschild für Suchmaschinen

Das Gegenstück zu den richtungsweisenden Links ist das HTML-Element „Noindex“ im HEAD-Bereich des Quelltextes. Es wird wörtlich angegeben, dass diese Seite bei der Indexierung nicht berücksichtigt werden soll. Dies gilt für verschiedene URL-Varianten und inhaltsgleiche Unterseiten. Auf diese Weise werden Abstrafungen beim Ranking wegen Duplicate Content auch vermieden.

Rank Math – das leistungsstarke SEO-Tool

Das Setzen der oben genannten HTML-Elemente hört sich sehr kompliziert an und ist sehr aufwendig. Für eine technisch einwandfreie Website und gute organische Suchergebnisse ist bei Duplicate Content die Verwendung allerdings unerlässlich. Viele CMS-Systeme, wie z. B. WordPress, bieten Plugins an, mit deren Hilfe die Links automatisch gesetzt werden können.
Bei dem Rankmath-Tool handelt es sich zum Beispiel um ein Plugin, das in WordPress integriert werden kann. Dieses Suchmaschinenoptimierungs-Plugin erleichtert und erspart SEO-Profis eine Menge Arbeit. Dadurch wird der zeitraubende Aufwand für die Anpassung jeder einzelnen Seite erheblich reduziert und es sind keine Änderungen am Quellcode erforderlich.
Das Rank Math Tool ist aus 15 verschiedenen Modulen zusammengesetzt. Je nach Bedarf kann das passende Tool für verschiedene Suchmaschinenoptimierungsmaßnahmen konfiguriert werden. Benutze nur das, was du brauchst.

Hreflang für mehrsprachige Webseiten

Gleiche Inhalte in verschiedenen Sprachen, die für verschiedene Länder bestimmt sind, sollten nicht als Duplicate Content betrachtet werden. Außerdem möchten deutsche Website-Besucher die deutsche Version der Website sehen. Dazu ist eine Spracherkennung erforderlich, denn Suchmaschinen sind bestrebt, die für den jeweiligen Nutzer am besten geeigneten Ergebnisse anzuzeigen. Bei mehrsprachigen Webseiten gibt ein selbstreferenzierender Hreflang den Suchmaschinen die deutsche URL an. Auf diese Weise ist eine Unterscheidung zwischen Märkten und Sprachen möglich.
Und das Hreflang-Tag beseitigt damit auch das Problem doppelter und konkurrierender Inhalte in verschiedenen Sprachen. Allerdings kann man beim Implementieren einiges falsch machen. Wir empfehlen dir, in der Google Search Console stets zu überprüfen, ob das Hreflang-Tag korrekt gesetzt ist. Darüber hinaus hast du hier auch die Möglichkeit, das Land anzugeben, auf das deine Website ausgerichtet ist.

Paginierung und Canonicals

Unter Paginierung versteht man die Zusammenfassung von Website-Inhalten, die auf verschiedene Komponentenseiten mit unterschiedlichen URLs verteilt sind. Dabei werden die Inhalte der einzelnen Unterseiten zusammengefasst, um sie für das Crawling nutzbar zu machen.
Ein typisches Beispiel sind die Shop-Kategorieseiten, deren Inhalte auch auf die verschiedenen Produktseiten verteilt sind. Für den Nutzer wird die Webseite durch die Paginierung übersichtlicher und verständlicher. Die Navigation durch die verschiedenen Inhalte wird verbessert. Der Benutzer findet sich immer zurecht. Eine gute Paginierung ist benutzerfreundlich.
Für die Paginierung werden die Attribute rel=“next“ und rel=“prev“ verwendet. Sie teilen Google mit, auf welchen Unterseiten die zugehörigen Informationen zu finden sind. Durch die Paginierung wird auch der gesamte Linkjuice auf die erste Seite gesetzt. Auf diese Weise wird die SEO-Performance verbessert. Die Nutzerinnen und Nutzer müssen nicht mehr so tief in die Seite hineinklicken und die Ladezeiten verkürzen sich.
Allerdings sollten Canonical bei der Paginierung so eingesetzt werden, dass sie an Google keine Mixed Signals senden. Verweist Link bei der Paginierung auf die erste Seite, geht Google davon aus, dass es sich bei den paginierten Seiten um Duplikate handelt und indexiert nur diese und die weiteren Unterseiten nicht.
Wenn die Links selbstreferenzierend sind, d. h. auf sich selbst verweisen, kann dieses Problem umgangen werden. Jede Komponentenseite muss dann die Robots-Meta-Tags “index” und “follow” enthalten.
Übrigens sollten SEO-Texte idealerweise nur auf der ersten Komponentenseite und nicht weiter unten stehen. Im Idealfall sind Title Tag und Meta Description der paginierten Seiten unterschiedlich.

Fazit

Das technische SEO sollte stimmen, bevor das Content Marketing starten kann. In diesem Blogbeitrag haben wir gezeigt, wie spezifisch die Lösungen für das Duplicate Content Problem sind. Das Tool Rank Math hilft WordPress-Nutzern, Probleme mit inhaltsgleichen Seiten zu beheben oder zu vermeiden. Das HTML-Element Canonical Tag bietet bei richtiger Anwendung für viele Websites ein entscheidendes SEO-Potenzial.

Cookie Consent mit Real Cookie Banner