INFOPORTAL BERLIN

Immer wiederkehrende Fragen einfach erklärt

Duplicate Content

Duplicate Content / Near Duplicate Content

Als Erstes klären wir einmal, was hier der Unterschied zwischen Duplicate Content und Near Duplicate Content ist. Beide Bezeichnungen geben den Hinweis auf doppelten oder mehrfach vorhandenen Content (Text) auf einer Seite. Google straft es ab und hat direkten Einfluss auf unserem Ranking.

Gleich oder fast gleich?

Beim Duplicate Content ist der Inhalt unseres Textes absolut gleich. Duplicate Content für alle Geräte vermeidenZudem ist bei der Near Variante dieser Text fast gleich. Dieser Text ist identisch, hat jedoch geringe Abweichungen. Hierbei werden Teile eins zu eins kopiert oder es wurden Boilerplates benutzt. Boilerplates sind zum Beispiel vorgefertigte Komponenten, die ein Entwickler von Webseiten einsetzt. Sie helfen die Entwicklungszeit zu verkürzen, indem wir eine vorgefertigte Grundstruktur benutzten. Dabei werden jedoch immer wieder identische Textpassagen verwendet. Kommen wir nun aber zu den wichtigen Details und wie wir sie vermeiden können.

Wie entstehen gleiche Inhalte?

Wir können davon ausgehen, dass niemand einen Text kopiert und diesen dann unbearbeitet auf der eigenen Seite einsetzt. Meistens werden wir von diesen Meldungen überrascht und wissen nicht warum. So jedenfalls ist meine Erfahrung bei den immer wieder kehrenden Anfragen zu diesem Thema. Die einfachste Variante ist vom System her sowieso schon einmal vorgegeben. Unsere Internetpräsenz ist mit zwei verschiedenen URL Varianten aufrufbar.

„http://fragmich.berlin“

„http://www.fragmich.berlin“

Schon hierbei ist für die Suchmaschine unser Content zweimal vorhanden. Beide dieser Aufrufe hat eine eigene URL. Haben wir für unsere Seite ein Zertifikat als Sicherheit eingetragen, gibt es somit eine neue Duplikation.

„http://www.fragmich.berlin“

„https://www.fragmich.berlin“

Hinzu kommen natürlich noch die Aufrufe ohne www.

Weitere Varianten als Beispiel:

Der Aufruf mit oder ohne Slash wird oft übersehen

„https://fragmich.berlin/duplicate-content/“

Der Seitenaufruf mit Angabe der Index Datei

„https://fragmich.berlin/index.php“

Die Liste von Möglichkeiten kann noch erheblich erweitert werden. Mir fallen hierzu spontan noch folgende ein. Groß- oder Kleinschreibung in der URL, Produkt- oder Session Angaben, Tracking- oder Filter Aufrufe.

Mit welchen Möglichkeiten kann ich so etwas vermeiden?

Als Erste und wichtigste Grundlage benutze ich die Steuerung mittels der .htaccess Datei. In einem weiteren Beitrag ist die Steuerung mittels diverser Parameter erklärt. Vorrangig werden die Varianten von http und https, sowie die Angaben von „www“ Parametern geregelt. Weiterführende Informationen hier zum Beitrag über .htaccess.

Eine weitere wichtige Möglichkeit ist die 301 Umleitung (Redirect) von Unterseiten auf die Hauptseite.

Für etwas weiterführende Steuerungen können wir die Parameter Behandlung in den Google Webmaster Tools einsetzen.

Als letzten Vorschlag empfehle ich den Einsatz von Canonical Tags. Auch hierzu ist eine detaillierte Beschreibung im Beitrag zu „Canonical Tags“ vorhanden.

Nachricht hierzu an die Administration

Updated: 19. Januar 2018 — 23:02
INFOPORTAL BERLIN © 2017 >> Impressum << - >> Datenschutz << - >> Disclaimer << Frontier Theme