Der Vladimir hat bei sich im Blog einen guten Hinweis, um die Umstellung der Permalink-Struktur zu absolvieren. Mit dem Update auf WordPress 3.3 wurde endlich ein Umstand behoben, der auch mich lange nervte. WordPress lud bis dahin die Seiten schneller, wenn die Artikel-ID in der URL enthalten war. Eine tiefere Erklärung erspare ich euch.
Die Artikel-ID war schnell hinten drangehangen. So sah meine URL-Struktur vor dem Update wie folgt aus: /%postname%-%post_id%/
Ich habe dann mit dem Update auch die Struktur verändert. Ob das nun aus SEO-Sicht sinnvoll oder nicht ist, kann ich euch nicht sagen. Die Umstellung der URLs war relativ einfach, da ich mich auch Yoasts Tool behalf.
Ich sagte dem Server also: »Freundchen, hör zu, wenn jemand den Artikel lesen will, dann schneide die ID ab«. Dies führte zu einigen Umleitungsfehlern, denn das Modul macht keinen Unterschied von der Art der Zahl am Ende. Somit lief jeder Artikel mit einer Zahl am Ende, die keine Artikel-ID war, in eine Endlosschleife.
Ein Problem, was natürlich nur einen Bruchteil der Artikel betrifft. Aber welche? Ich hatte nicht vor den ganzen Blog zu durchforsten, um mir die URLs anzusehen. Es geht auch einfacher, die meisten werde es sogar im Einsatz haben. Die guten alten Google Webmastertools liefern euch diese Informationen, zumindest wenn ihr eure Seite dort hinterlegt habt. Google spuckt mir die URLs aus, die einen Umleitungsfehler haben. Ihr findet die betroffenen URLs unter Diagnose → Crawling-Fehler.
Dies hilft mir, recht rasch mein Problem zu lösen. Viel wichtiger ist mir allerdings, dass ich hinterher die Gewissheit habe, auch alle URLs erwischt zu haben.
Die Frage die für mich bleibt, wie lassen sich die in der Crawling Übersicht gelisteten Einträge entfernen. Oder anders gefragt: Woher bezieht Google diese URLs?
Ich selbst habe 38 falsche URLs da drin stehen und keinen Plan, woher Google diese Info nimmt.
Ich dachte stets aus der sitemap.xml aber die passt bei mir.
Danke dir schon mal.
Da gibt es verschiedene Möglichkeiten. Es können durch RSS-Feeds erstellte Links sein, die automatisiert z.B. bei Twitter eingeparst wurden und mit bestimmten Zusätzen ergänzt wurden. Es könnten aber auch Links zu irgendwann mal gelöschten Beiträgen sein. Vielleicht hat auch nur jemand von seiner Seite irgendwann mal was falsch verlinkt.
Stell doch mal eine dieser URLs hier rein, dann kann man sich das mal anschauen.
Klar, gerne. 🙂
Hier als Screenshot: Crawling-Fehler
Die Infos bezieht Google teils aus eigenen Onsite-Crawlingprozessen (fernab der sitemap.xml) aber auch aus externen Linkquellen … wenn mal also jemanden ärgern will, packt man 30 nicht funktionierende Linkverweise auf eine Seite und ein paar Tage später findet der diese Hinweise in den GWT wieder 😉
Im Idealfall leitet man die identifizierten fehlerhaften URLs via 301 wahlweise auf das richtige Ziel oder die Hauptseite … auch falsche Links, sind Links. 😉
Mache ich das in der -htaccess?
Und gibts da einen Befehl, der automatisch alle falschen URLs auf die Hauptseite lenkt – also ohne jede einzelne URL umleiten zu müssen?
Ja und nein 😉
Ich behelfe mir da immer mit einem kleinen PHP-Snippet: http://pastebin.com/GFFCnd5e (URL entsprechend anpassen). Das ganze als z.B. error404.php auf den Account laden.
in die .htaccess kommt dann folgendes:
ErrorDocument 404 /error404.php
Damit wird immer, wenn der Server einen 404 erkennt das Script aufgerufen und das leitet via 301 auf die Hauptseite.
Dies sollte allerdings als letzte Instanz genutzt werden … vorangig stünde die Identifizierung der richtigen Zielurls und die saubere Umleitung auf die diese.
Bsp.:
RewriteRule deine/falsche/url$ die/richtige/url [R=301,L]
In deinem Reporting hast du den Punkt „Verlinkt von“ … das sind quasi die linkgebenden Seiten, die du prüfen musst / solltest.
Btw. es gibt auch RedirectPlugins für WordPress, die mehr oder minder selbständig versuchen, geänderte und fehlerhafte URLs zu matchen und umzuleiten … kann leider nur keines empfehlen, da bisher nie wirklich genutzt.
Geht auch ohne Script recht einfach. Ansonsten gebe ich dem Rene da aber recht.
Den Ordner /wp-content/plugins/appstore/ tät ich für den Crawler komplett sperren.
Ich habe hier und da dieses Plugin in Gebrauch:
http://wordpress.org/extend/plugins/redirection/
Es loggt alle fehlerhaften Links und quasi per Mausklick kann man sie auf einen passenden Artikel umleiten und alles andere was nicht passt, auf die Hauptseite oder die berüchtigte WordPress-401-Seite.
Ich hab noch kein besseres Plugin für speziell diese Aufgabe gefunden.