• Jetzt anmelden. Es dauert nur 2 Minuten und ist kostenlos!

Immer noch duplicate content - wo und wie beheben?

Franky2207

Neues Mitglied
Hallo zusammen,

ich kämpfe nun schon seit geraumer Zeit auf technischer Seite mit duplicate content. Laut seitenreport.de wird mir immer wieder angezeigt, dass der noch vorhanden ist, obwohl ich nun eigentlich schon einige Maßnahmen ergriffen habe, und ich nicht mehr weiß, wovon der duplicate content noch hervorgerufen wird. Ich muss dazu sagen, dass ich kein Profi bin!
Laut der Seite siteliner.com ist mein "Top Issue: http vs. https different content was found." Nun habe ich mir dazu auch schon was durchgelesen und bin dem Lösungsvorschlag einer Seite gefolgt, der besagte, dass man zwei robots.txt nutzen soll und in der .htaccess einstellen muss, dass die https nicht gecrawlt wird - genauer kann ich das leider nicht erklären.
Außerdem habe ich einen canonical-tag in die head-Zeile meiner Seite eingefügt.
Trotzdem wird immer noch 100% duplicate content angezeigt.. ich verstehe nicht, woran das noch liegen soll..

edit: Ich sehe gerade noch, dass seitenreport auch anzeigt, dass ich keine gültige Fehlerseite mehr hätte.. weiß da vllt jemand woran das liegen könnte? Fehlerseite ist hochgeladen und in .htaccess eingebaut, vor ein paar Tagen wurde die auch noch als gültig angezeigt :(

Hier mal mein canonical tag:
<link rel="canonical" href="http://www.nachhilfeteam-bonn.de"/>

Und meine .htaccess:
ErrorDocument 404 /error404.php

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www. [NC]
RewriteCond %{HTTP_HOST} !^$
RewriteRule ^(.*) http://www.%{HTTP_HOST}/$1 [R=301]

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\/index\.php\ HTTP/
RewriteRule ^index\.php$ http://www.nachhilfeteam-bonn.de/ [R=301,L]

RewriteCond %{SERVER_PORT} ^443$
RewriteRule ^robots\.txt$ robots_ssl.txt [L]

RewriteRule ^Index\.php$ /index.php [R=301,L]
Redirect 301 /WarumdasNachhilfeteam.php http://www.nachhilfeteam-bonn.de/warum-einzelnachhilfe-bonn.php

RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index\.(html?|php)\ HTTP/
RewriteRule ^index\.(html?|php)$ http://www.nachhilfeteam-bonn.de/ [R=301,L]
RewriteRule ^index\$ http://www.nachhilfeteam-bonn.de/ [R=301,L]


Vielleicht kennt sich ja einer von euch damit aus und könnte mir weiterhelfen! Vielen Dank schon mal für jegliche Mühe! Ich hoffe, ich habe das alles einigermaßen richtig gepostet :)
 
Zuletzt bearbeitet:
Werbung:
Einfacher wäre es wohl, wenn Du alle Requests auf https umleitest.

Code:
RewriteCond %{SERVER_PORT} !443
RewriteRule ^(.*)$ https://%{HTTP_HOST}/$1 [L]

Das hat auch insbesondere bei Google Vorteile, da Google eine per SSL ausgelieferte Seite im Ranking bevorzugt.
 
Danke erst mal für die Hilfe. Das heißt, ich bräuchte die robots_ssl.txt nicht mehr und könnte
Code:
RewriteCond %{SERVER_PORT} ^443$
RewriteRule ^robots\.txt$ robots_ssl.txt [L]

durch

Code:
RewriteCond %{SERVER_PORT} !443
RewriteRule ^(.*)$ https://%{HTTP_HOST}/$1 [L]

ersetzen?
 
Werbung:
Wenn Du es so formulieren willst, ja. Eine extra robots.txt für SSL-Verbindungen würde ich generell nie anlegen.
 
Ok danke dir, dann bin ich mal gespannt, ob das den duplicate Content schon löst. Hast du (oder jemand andres) vielleicht noch eine Idee, wieso die (gültige) Fehlerseite auf einmal als nicht vorhanden angezeigt wird? Sie wird normal aufgerufen, hat einen Link zur Startseite und ist in .htaccess wie man sieht eingebaut.. verstehe da auch nicht wirklich, wo da noch der Fehler liegt :(

edit:/ ich habe das so eingesetzt und jetzt ist die Seite nicht mehr erreichbar, da darauf hingewiesen wird, dass dies keine sichere Verbindung sei. Kann ich das irgendwie beheben? Das https:// streicht der oben durch. Hab ich da was vergessen einzustellen?
(ich habe die Zeile jetzt erst mal wieder aus .htaccess gelöscht)
 
Zuletzt bearbeitet:
Wenn https durchgestrichen ist, deutet es darauf hin, dass in deinem Quelltext irgendeine Datei ohne https geladen wird. Eine per SSL ausgelieferte Seite setzt voraus, dass auch alle Inhalte per SSL ausgeliefert werden.

Und wg. der Fehlerseite verstehe ich nichts ..
 
Werbung:
Irgendeine Datei? Was genau könnte das sein? Ich bin noch nicht so erfahren in der Materie..
Ich habe nur normales html drin, Bilder (die aber nur vom Server reingeladen werden und eben auf der Seite verlinkt sind) und Links. Zählt es schon, wenn ich Links drin habe, die auf http anstatt auf https verlinken?

Und zu der Fehlerseite: Ich habe eine error404.php (inkl. eines Links zur Startseite) erstellt, sie bei .htaccess eingebaut und sie wird auch aufgerufen, wenn ich meine URL falsch eingebe - und trotzdem erhalte ich von Seitenreport.de die Meldung, dass ich keine gültige Fehlerseite hätte.
 
Zuletzt bearbeitet:
Zurück
Oben