Einfluss ausgehender Links auf den PageRank
Grundlagen des PageRank-Verfahrens
Nach Lawrence Page und Sergey Brin (Titel der Veröffentlichung von 1998: The anatomy of a large-scale hypertextual web search engine) schaden ausgehende Links dem PageRank (PR) einer Website. Webkataloge oder Linklisten, die oft mehr ausgehende als eingehende Links haben, dürften kaum einen nennenswerten PR erreichen. Das kann z.B. mit dem Tool PageRank.xls (83 kB) nachvollzogen werden, wobei allerdings die Webgröße beschränkt ist und daher die Übertragbarkeit auf ein großes Netz nicht unproblematisch ist. Screenshot (zum Vergrößern anklicken):
Andererseits können nach J. Kleinberg (Authoritative sources in a hyperlinked environment, IBM Research Report RJ 10076, May 1997) ausgehende Links auf "gute" Webseiten einen positiven Einfluss auf den sogenannten "Hub" haben, der sich in etwa mit "Hinweisqualität" übersetzen lässt. Nach der ursprünglichen Idee von Kleinberg sollte der Hub erst bei einer konkreten Suchanfrage berechnet und nicht allgemeingültig (im Sinne vom PageRank) für eine Webseite sein. Denkbar ist nun, dass der Google PageRank nicht mehr klassisch berechnet wird, sondern ggf. auch den Hub der ausgehenden Links berücksichtigt. Ob ausgehende Links nun eher schädlich oder sogar nützlich sind, soll in einem Experiment untersucht werden (siehe übernächster Abschnitt).
Denkbar ist weiterhin, dass bei der Berechnung des PageRankTM für die Toolbar-Anzeige ein vereinfachter Algorithmus verwendet wird, da das im folgenden vorgestellte PageRank-Orakel bessere Ergebnisse liefert, als eigentlich zu erwarten wäre.
PageRank-Orakel
In SEO-Kreisen besteht Einigkeit darüber, dass der PageRank (PR) logarithmisch skaliert ist. Unstrittig ist auch, dass ein einzelner Link von einer Seite mit hohem PR wesentlich wertvoller ist, als viele Links von PR0- oder PR1-Seiten. Weiterhin kann häufig beobachtet werden, dass Unterseiten einen um 1 geringeren PR als die direkt darüber liegenden Seiten haben. Eine möglichst einfache Formel, die zu einem solchen Ergebnis führt, ist:
In dieser Gleichung ist A ein Skalierfaktor und B die Basis. Die Anzahl der Links von PR0 bis PR10 wird durch n0 bis n10 ausgedrückt.
Etwas problematisch ist die Bestimmung der Link-Anzahlen. Z.B. liefern einige Tools den PR der Startseite und nicht den PR der Seite, auf der sich der Link befindet. Auch greifen die Tools üblicherweise auf Suchmaschinen zurück, um die Links zu finden. Da aber wohl keine Suchmaschine alle Links liefert, besteht hier eine erhebliche Fehlerquelle. Zur Ermittlung der konstanten A und B in obiger Gleichung wurde LinkVendor mit der Einstellung "msn" verwendet. Abgefragt wurden am 10.10. bzw. 12.10.2005 die Links der unter Nr. 9, 13, 17, 36, 42 - 54, 57 und 58 im Linkverzeichnis aufgeführten Webseiten. Das Ergebnis und der zugehörige PR (vor dem Oktober-Update) sowie der PR vom 22.10.2005 (nach dem Oktober-Update) sind auch angegeben. Auf der Basis der PR-Werte vom 22.10 wurden die Konstanten bestimmt: A=0,44 und B=6. Obwohl die Gleichung eher trivial ist, wird der PR von 15 der 19 Seiten richtig berechnet.
Allerdings finden sich auch etliche Seiten, bei denen die Ergebnisse weniger gut sind. Dies ist zum Einen darauf zurückzuführen, dass in der Gleichung nicht berücksichtigt wird, wieviele ausgehende Links die Link-gebende Seite hat. Zum Anderen schlägt hier möglicherweise ein Filter zu, der Linknetzwerke aufdeckt und abwertet. Um solche Fälle mit obiger Gleichung zu erfassen, kann der Skalierfaktor A geändert werden. Zum Spielen gibt's die Formel hier in JavaScript:
Experiment zum PageRank
Wieder zurück zum Thema. Mit Hilfe dieser Webseite soll der Einfluss ausgehender Links auf den PageRank über einen längeren Zeitraum untersucht werden.
Da es praktisch unmöglich ist, zwei identische Webseiten zu gestalten, die von außerhalb identisch verlinkt sind und sich nur in der Art der ausgehenden Links unterscheiden (z.B. mit bzw. ohne rel="nofollow"), soll hier ein anderer Weg beschritten werden: Auf diese Webseite werden maximal 95 ausgehende Links gesetzt. Nach einem PageRank-Update wird das Link-Tag entfernt und die URL im Klartext ausgegeben. Beispiel:
Verlinkte Seite:
Physiker brauchen die optische Bank mit Zubehör.
URL im Klartext:
Physiker brauchen die [http://www.henschke-geraetebau.de/optische-bank.html] optische Bank mit Zubehör.
Nach einem weiteren PageRank-Update werden die Links wieder aktiviert. Durch dies Hin und Her zwischen Links und reinem Text sollte sich nach z.B. 4 bis 8 Umschaltvorgängen ein statistisch signifikanter Link-Einfluss feststellen lassen, auch wenn eine - hoffentlich nicht zu große - Veränderung in den Links von außen auftritt.
29. April 2006: Mittlerweile haben zwei PageRank-Updates relativ schnell hintereinander stattgefunden und diese Seite hat auf allen von Database-Search abgefragten Datencentern einen PR4. Im Google-Directory wird DR3 (16 Pixel) angezeigt. Die Unterseite ../pagerank-bild.html hat PR3 und die Excel-Tabelle ../PageRank.xls liegt auch bei PR3. Laut Backlink Spider verweisen 8 PR4, 13 PR3, 10 PR2, 7 PR1 und 21 PR0 Links auf diese Seite. Bei diesem Zwischenstand wurden heute die Links deaktiviert und es geht in die nächste Runde.
14. November 2006: Zwischenzeitlich haben wiederum zwei PageRank-Updates stattgefunden und diese Seite hat bei der Abfrage mit o. a. Tool weiterhin einen PR4 auf allen Datencentern. Unverändert sind auch der Google-Directory-Rank (DR3) und die PR's der Unterseiten (beide PR3). Der 'Backlink Spider' funktioniert zur Zeit leider nur mit Yahoo und liefert für diese Seite: 1 PR5, 10 PR4, 10 PR3, 6 PR2, 3 PR1 und 31 PR0 Links. Jetzt werden die Links wieder aktiviert und bleiben es auch, bis wiederum zwei Updates vorbei sind, da Google in letzter Zeit PR-Änderungen offenbar nur langsam umsetzt.
Aufruf zum Mitmachen! (24.1.2007: z. Z. ist das Linkverzeichnis gefüllt.)
Bis das Linkverzeichnis gefüllt ist, sind Mitspieler gesucht, die mir bitte einen Link in der Form
<li>Begleittext <a href="http://www.domain.tld/seite.html">Linktext</a> Begleittext</li>
an
senden. Dabei bitte
folgende Spielregeln beachten:
- Nur ein Text-Link pro IP-Adresse
- Linkziel hat mindestens einen PageRank von 3
- Begleittext zum Link mindestens genauso lang wie der Linktext
- Maximal 140 Zeichen Gesamtlänge incl. href-Ziel
- Damit diese Seite einen ansprechenden PageRank bekommt :-) ist ein PR-vererbender Link von einer Seite, die mindestens PR2 hat, auf diese Seite zu setzen. URL zum Link bitte in der Email angeben. Der Backlink kann auch erst nach dem Erscheinen des Links gesetzt werden.
- Links auf pornografische, rassistische oder sittenwidrige Seiten werden nicht angenommen. Die Entscheidung über die Aufnahme und die Verweildauer eines Links verbleibt beim Autor dieser Seite.
Kommentiertes Linkverzeichnis
Grüne Texte sind nur Platzhalter, die mit der Zeit durch Mitspieler-Links ersetzt werden (24.1.2007: alle Linkplätze besetzt).
- Validator zum Überprüfen der XHTML 1.1 Konformität dieser Seite.
- Hier zitierte Papers von Google-Mitarbeitern.
- Preiswert und große Auswahl: Bio-, Chemie- und Pasco-Physik-Lehrmittel bei der MODIS GmbH.
- Hier ist sinnvoller Text zu finden.
- Roboter - damit dürfen sogar 16-Jährige noch spielen.
- Erster Platz bei der Google-Suche nach failure (2005-10-05).
- Da hat der Fernsehsender Pro 7 wohl was verpennt.
- Brett und Kartenspiele gibts bei Brettspielecke.
- Deutschsprachiger Webkatalog - Informationsarchiv.com
54xPR0, 10xPR1, 33xPR2, 46xPR3, 41xPR4, 16xPR5, 9xPR6, PR=6, 6 - 'Massachusetts Institute of Technology' oder kurz MIT.
- Großhändler - Verzeichnis Kostenloses Link-Verzeichnis für den Großhandel.
- Mit Babelfish Texte in viele Sprachen übersetzen.
- Exklusives Glasdesign in einem ansprechend gestalteten Online-Shop.
- Flossfahrten auf der Isar sind das urbayrische Vergnügen.
- Virtuelle Roboter im Wettkampf.
- Die Einsteiger-Site für zukünftige Astronomen macht Lust auf eigene Beobachtungen.
- Webkatalog 80xPR0, 8xPR1, 27xPR2, 50xPR3, 28xPR4, 8xPR5, 1xPR6, PR=5, 5
- Encyclopædia Britannica, das klassische englische Lexikon.
- Und die moderne Variante Wikipedia (deutsche Version).
- Brauchbare Meta-Suchmaschine in Hannover.
- Und die neue Version: Metasuche ohne Müll.
- Mystisch? Der eigene Geburtstag in PI.
- Eine renomierte und umfangreiche Produktsuche finden Sie auf Industrystock.com.
- Grundkenntnisse der Sütterlinschrift machen alte Bücher lesbar.
- Kostenlose Designs und Styles für Deine Homepage jetzt Downloaden
- Wieviele Domains liegen auf einer IP-Adresse?
- Free Backlink Checker
- Noch ein PageRank prediction Tool.
- Hochwertige Website-Vorlagen für 'lau'.
- Hochwertige Fotos - auch für 'lau'.
- Historische PageRank-Update Daten
- C für Lego's RCX
- Verschiedene Routenplaner zur Auswahl
- Machen Webmastern das Leben leichter: Suchmaschinen Tools für lau!
- Wem Normen im Beruf noch nicht reichen: Normblätter für Modellbahner.
- Und ein Modellbahner Portal. 48xPR0, 51xPR1, 44xPR2, 40xPR3, 13xPR4, PR=4, 4
- Digitale Fotografie unter the-digiland.de aus dem Erzgebirge
- Was man mit php alles machen kann zeigt Knusperleicht im open source Scriptarchiv.
- Auch nicht schlecht: Spenden statt schenken.
- Weihnachtskrippen bei der Krippenwerkstatt aus Massivholz.
- Noch so eine 'mal eben' angemeldete Doktoren-Seite :-)
- fischertechnik 89xPR0, 23xPR1, 25xPR2, 29xPR3, 16xPR4, 12xPR5, PR=6, 5
- FH Merseburg 63xPR0, 16xPR1, 20xPR2, 38xPR3, 28xPR4, 14xPR5, 7xPR6, PR=6, 6
- Elektronik Lehrmittel 7xPR0, 0xPR1, 3xPR2, 6xPR3, 3xPR4, PR=4, 3
- Bier 57xPR0, 20xPR1, 33xPR2, 58xPR3, 49xPR4, 14xPR5, 3xPR6, PR=6, 6
- Biersuche 109xPR0, 10xPR1, 6xPR2, 6xPR3, 5xPR4, 3xPR5, PR=5, 5
- Weingut Reis 48xPR0, 5xPR1, 2xPR2, 4xPR3, 4xPR4, 3xPR5, PR=5, 4
- A. Baecker 8xPR0, 5xPR1, 2xPR2, 3xPR3, 2xPR4, PR=4, 4
- Heise-Verlag 23xPR0, 2xPR1, 18xPR2, 41xPR3, 69xPR4, 51xPR5, 13xPR6, 4xPR7, 2xPR8, 1xPR9, PR=8, 8
- Zur Forelle 15xPR0, 0xPR1, 1xPR2, 1xPR3, PR=3, 2
- MS-Forelle 16xPR0, 2xPR1, 2xPR2, PR=2, 2
- Gasthof Forelle 6xPR0, 1xPR1, 1xPR2, 2xPR3, PR=3, 3
- Leder Buchler 111xPR0, 2xPR1, 1xPR2, 1xPR3, 1xPR4, PR=3, 3
- Tierfurtter 23xPR0, 1xPR1, 11xPR2, 4xPR3, PR=3, 3
- Ein Counter mit PR10 (2005-09-29).
- So viele Science-Links und trotzdem PR5 (2005-10-05)
- GoHits 45xPR0, 3xPR1, 9xPR2, 12xPR3, 3xPR4, PR=3, 3
- Click-Explorer 21xPR0, 2xPR1, 10xPR2, 4xPR3, PR=2, 3
- Die Quelle schlechthin für Open Source Software und Anwendungen.
- Du bist erst ein wahrer Doktorand, wenn Du Dich hier anmeldest!
- Treppen Uzun in Herne - Große Auswahl und kompetente Beratung.
- Mit einer Greencard der USA kann man in Amerika arbeiten.
- Anbieter von Sprachreisen USA im Überblick. Tipps und Erfahrungsberichte.
- Der HTML-Guide ist ein Kurs für die Websprache.
- Schwimmbadtechnik | AS-DirektShop für Schwimmbad- und Gastronomiebedarf | Gastronomiebedarf
- Nettes Tool zur Abfrage der verschiedenen Datencenter von Google.
- Die Wetterstationen und das Wetter in Deutschland mit Webcams
- Infos zur Freepay Aktion | iPod kostenlos! Klappt es wirklich? | Xbox360, PSP, Laptop gratis
- So sieht die Seite eines Internet-Freaks und Studienkumpels aus.
- Finden Sie hier kostenlose Businessplan-Vorlagen.
- Webseite mit dem Lebenslauf Martin Grellmann Ambient DJ mit ein wenig Poesie und Fotos.
- Ein Rezept ist nicht nur eine Anleitung.
- Ein zip-Tool unter der GNU LGPL.
- Mit Gefahrgutinfos von ADR IMDG SPIEGEL einfacher durch das Recht.
- Webmastermarkt: Infopool und Linksammlung.
- Postkarten mit Postvermerken.
- Noch Zeit vor dem Büroschlaf, dann lustige Bilder anschauen.
- Auch im Flachland gibt's professionellen Ski-Service.
- Manches hat ein Ende,
- doch das Internet hat viele.
- In Form einer Fehlermeldung,
- eines Gästebuches oder
- auch einer Landkarte, die
- sich auch noch öfter findet.
- Richtig kreativ und
- bunt in flash oder
- galaktisch bis hin zum
- Abschalten des Internet (mit Alt-F4 beenden)
- oder gar der Erde (mit Alt-F4 beenden).
- Hauptsache das Sichern wurde nicht vergessen.
Disclaimer
Auf den Inhalt und die Gestaltung der verlinkten Seiten habe ich keinen Einfluss.
Benachrichtigen Sie mich bitte, falls Sie über Links zu Seiten gelangen, deren
Inhalte Ihnen bedenklich erscheinen.
Martin Henschke, Dieselstr. 8, 50374 Erftstadt, Tel. 02235 / 75355, E-mail: 
