Kanonische Adressen

In der Theorie ist es ganz einfach: Jede Seite hat exakt eine URL, unter der sie erreichbar ist. In der Praxis sieht es leider häufig anders aus. So sind Startseite von Webprojekten meist sowohl unter http://example.org/ als auch http://example.org/index.html und häufig auch noch unter verschiedenen Hostnamen erreichbar. Suchmaschinen wie Google wissen natürlich um dieses Problem und versuchen, diese verschiedenen URLs möglichst gut zu einer zusammenzufassen.

Wieso erzählt der Onkel mir das jetzt, ist doch nichts Neues? Auch, wenn die Qualität der Produkte von Google überdurchschnittlich gut sind, so passieren auch dort ab und an Fehler. Und manchmal lassen die Fehler interessante Schlussfolgerungen zu. So ist bei den PageRank-Abwertungen, die vergangenen Oktober begannen, ja bereits häufig gemutmaßt worden, dass lediglich der angezeigte PageRank der Google-Toolbar herabgesetzt wurde, Google intern allerdings weiterhin mit dem „richtigen“ PageRank arbeite. Diese Überlegung wurde dadurch gestützt, dass es im Ranking und weiteren Hinweisen, die bei einem deutlichen Abfall des PageRanks eigentlich hätten leiden müssen, keine Veränderung gab. Ganz vorne mit dabei bei den abgewerten Seiten war das Blog von Robert Basic, erreichbar unter www.basicthinking.de/blog/. Die Server, die den PageRank für die Toolbar ausliefern zeigen hier nur noch einen PR3 statt des ursprünglichen PR6 an. Wenn man allerdings den letzten Slash in der URL weglässt und den PageRank für diese URL anzeigen lässt, sieht man noch immer den eigentlichen PageRank von 6. Das funktioniert übrigens auch beim von PR7 auf PR5 herabgesetzten Telepolis von Heise. Da scheint es noch Abstimmungsbedarf über den „korrekten“ PageRank zu geben …
Eintrag geschrieben am 27.02.2008 um 11:35 Uhr - Trackback-URL - Tags: Google Linkkauf Linkverkauf Meinung Pagerank Quality Seo

Kommentare & Trackbacks

Markus - 27.02.2008 14:08
Okay, du hast recht: Bei einigen Seiten funktioniert es wirklich. Bei einem bekannten System zum Usertracking stimmt dies nicht. Jetzt ist die Frage, ob die im Gegensatz zu Robert Basic etc. im Ranking Einbußen hinnehmen mussten.

Johannes Johannes - 27.02.2008 14:11
Markus, meinst du Etracker? Wo hast du es da denn ausprobiert? Letztendlich funktioniert dieser "Trick" ja nur, wenn die abgewertete Seite in einem Unterordner lag. Der Google PageRank-Alo verschafft der Version ohne Slash dann den gleichen PR wie der mit, bei der Anzeige des runtergsetzten PageRanks scheint man diesen Teil allerdings vergessen zu haben.

Emanuel - 27.02.2008 16:51
Das verstehe ich jetzt nicht ganz!? Die Startseite ist doch eine Datei die im www-Verzeichnis steht und es lässt sich doch nunmal nicht verhindern, dass diese dann mit 2 URLs aufgerufen werden kann!?
Habe ich da was verpasst oder war das nur ein abstraktes Beispiel?

Olaf - 27.02.2008 19:31
Ich würde mal sagen dass damit klar ist, dass es scheinbar einmal eine automatische Datenbank gibt mit den berechneten Pagerank-Werten und zusätzlich eine Form von Overlay-Datenbank, die für entsprechende Urls den berechneten Pagerank beeinflusst (z.B. -2) oder direkt überschreibt. Scheinbar matched diese zweite, manuelle Datenbank exakt auf die Url, wodurch bei http://www.heise.de/tp/ der Abwertungseintrag greift, bei http://www.heise.de/tp jedoch der berechnete Pagerank greift. Da /tp ein 301 auf /tp/ ist, spart man sich damit alle Urls quasi doppelt in der manuellen Datenbank aufzunehmen.

Stefan - 28.02.2008 16:01
Emanuel,
es nicht primär darum, dass ein Inhalt mit verschiedenen URLs abrufbar ist, sondern vielmehr darum, dass die Website selbst auf beide Versionen verlinkt. Wenn du konsequent immer nur auf example.org verlinkst und nie auf example.org/index.html, wird Google letzteres auch nie aufnehmen - denn dann müsste Google raten, wie die Datei heißen könnte. index.html ist ja kein muss, es könnte ja auch default.aspx heißen. Und wenn wir gar an CMS und/oder mod_rewrite denken, ist sowieso alles nochmals ganz anders ...

Ralph - 26.03.2008 13:45
@Stefan: Danke für die Antwort auf die Frage von Emanuel. Ich habe die selbe Frage gehabt wie er und auf Grund Deiner Antwort habe ich den Unterschied verstanden.

Ich werde also in Zukunft genauer acht geben, wohin ich verlinke innerhalb einer Website ;)

Aus dem sonnigen Dresden grüssend

Ralph


Kommentieren?Kommentieren?
Dieser Blogbeitrag ist älter als 30 Tage. Leider mussten wir die Kommentarmöglichkeit für alte Beiträge deaktivieren, da sie regelmäßig von Spammern zum Abladen ihrer Links mißbraucht wurde. Angemeldete Benutzer haben weiterhin die Möglichkeit, auch ältere Beiträge zu kommentieren. Jetzt kostenlos anmelden.
SucheSuche