Einfluss ausgehender Links auf den PageRank

Grundlagen des PageRank-Verfahrens

Nach Lawrence Page und Sergey Brin (Titel der Veröffentlichung von 1998: The anatomy of a large-scale hypertextual web search engine) schaden ausgehende Links dem PageRank (PR) einer Website. Webkataloge oder Linklisten, die oft mehr ausgehende als eingehende Links haben, dürften kaum einen nennenswerten PR erreichen. Das kann z.B. mit dem Tool PageRank.xls (83 kB) nachvollzogen werden, wobei allerdings die Webgröße beschränkt ist und daher die Übertragbarkeit auf ein großes Netz nicht unproblematisch ist. Screenshot (zum Vergrößern anklicken):

PageRank-Berechnung

Andererseits können nach J. Kleinberg (Authoritative sources in a hyperlinked environment, IBM Research Report RJ 10076, May 1997) ausgehende Links auf "gute" Webseiten einen positiven Einfluss auf den sogenannten "Hub" haben, der sich in etwa mit "Hinweisqualität" übersetzen lässt. Nach der ursprünglichen Idee von Kleinberg sollte der Hub erst bei einer konkreten Suchanfrage berechnet und nicht allgemeingültig (im Sinne vom PageRank) für eine Webseite sein. Denkbar ist nun, dass der Google PageRank nicht mehr klassisch berechnet wird, sondern ggf. auch den Hub der ausgehenden Links berücksichtigt. Ob ausgehende Links nun eher schädlich oder sogar nützlich sind, soll in einem Experiment untersucht werden (siehe übernächster Abschnitt).

Denkbar ist weiterhin, dass bei der Berechnung des PageRankTM für die Toolbar-Anzeige ein vereinfachter Algorithmus verwendet wird, da das im folgenden vorgestellte PageRank-Orakel bessere Ergebnisse liefert, als eigentlich zu erwarten wäre.

PageRank-Orakel

In SEO-Kreisen besteht Einigkeit darüber, dass der PageRank (PR) logarithmisch skaliert ist. Unstrittig ist auch, dass ein einzelner Link von einer Seite mit hohem PR wesentlich wertvoller ist, als viele Links von PR0- oder PR1-Seiten. Weiterhin kann häufig beobachtet werden, dass Unterseiten einen um 1 geringeren PR als die direkt darüber liegenden Seiten haben. Eine möglichst einfache Formel, die zu einem solchen Ergebnis führt, ist:

Ranking-Gleichung

In dieser Gleichung ist A ein Skalierfaktor und B die Basis. Die Anzahl der Links von PR0 bis PR10 wird durch n0 bis n10 ausgedrückt.

Etwas problematisch ist die Bestimmung der Link-Anzahlen. Z.B. liefern einige Tools den PR der Startseite und nicht den PR der Seite, auf der sich der Link befindet. Auch greifen die Tools üblicherweise auf Suchmaschinen zurück, um die Links zu finden. Da aber wohl keine Suchmaschine alle Links liefert, besteht hier eine erhebliche Fehlerquelle. Zur Ermittlung der konstanten A und B in obiger Gleichung wurde LinkVendor mit der Einstellung "msn" verwendet. Abgefragt wurden am 10.10. bzw. 12.10.2005 die Links der unter Nr. 9, 13, 17, 36, 42 - 54, 57 und 58 im Linkverzeichnis aufgeführten Webseiten. Das Ergebnis und der zugehörige PR (vor dem Oktober-Update) sowie der PR vom 22.10.2005 (nach dem Oktober-Update) sind auch angegeben. Auf der Basis der PR-Werte vom 22.10 wurden die Konstanten bestimmt: A=0,44 und B=6. Obwohl die Gleichung eher trivial ist, wird der PR von 15 der 19 Seiten richtig berechnet.

Allerdings finden sich auch etliche Seiten, bei denen die Ergebnisse weniger gut sind. Dies ist zum Einen darauf zurückzuführen, dass in der Gleichung nicht berücksichtigt wird, wieviele ausgehende Links die Link-gebende Seite hat. Zum Anderen schlägt hier möglicherweise ein Filter zu, der Linknetzwerke aufdeckt und abwertet. Um solche Fälle mit obiger Gleichung zu erfassen, kann der Skalierfaktor A geändert werden. Zum Spielen gibt's die Formel hier in JavaScript:

PR0 PR1 PR2 PR3 PR4 PR5 PR6 PR7 PR8 PR9 PR10

Wie 'optimiert' ist die Site? hä?, A=0,44 Hobby-SEO, A=0,22 in Linknetztwerken, A=0,11

PageRank= gerundet=

Experiment zum PageRank

Wieder zurück zum Thema. Mit Hilfe dieser Webseite soll der Einfluss ausgehender Links auf den PageRank über einen längeren Zeitraum untersucht werden.

Da es praktisch unmöglich ist, zwei identische Webseiten zu gestalten, die von außerhalb identisch verlinkt sind und sich nur in der Art der ausgehenden Links unterscheiden (z.B. mit bzw. ohne rel="nofollow"), soll hier ein anderer Weg beschritten werden: Auf diese Webseite werden maximal 95 ausgehende Links gesetzt. Nach einem PageRank-Update wird das Link-Tag entfernt und die URL im Klartext ausgegeben. Beispiel:

Verlinkte Seite:
Physiker brauchen die optische Bank mit Zubehör.
URL im Klartext:
Physiker brauchen die [http://www.henschke-geraetebau.de/optische-bank.html] optische Bank mit Zubehör.

Nach einem weiteren PageRank-Update werden die Links wieder aktiviert. Durch dies Hin und Her zwischen Links und reinem Text sollte sich nach z.B. 4 bis 8 Umschaltvorgängen ein statistisch signifikanter Link-Einfluss feststellen lassen, auch wenn eine - hoffentlich nicht zu große - Veränderung in den Links von außen auftritt.

29. April 2006: Mittlerweile haben zwei PageRank-Updates relativ schnell hintereinander stattgefunden und diese Seite hat auf allen von Database-Search abgefragten Datencentern einen PR4. Im Google-Directory wird DR3 (16 Pixel) angezeigt. Die Unterseite ../pagerank-bild.html hat PR3 und die Excel-Tabelle ../PageRank.xls liegt auch bei PR3. Laut Backlink Spider verweisen 8 PR4, 13 PR3, 10 PR2, 7 PR1 und 21 PR0 Links auf diese Seite. Bei diesem Zwischenstand wurden heute die Links deaktiviert und es geht in die nächste Runde.

14. November 2006: Zwischenzeitlich haben wiederum zwei PageRank-Updates stattgefunden und diese Seite hat bei der Abfrage mit o. a. Tool weiterhin einen PR4 auf allen Datencentern. Unverändert sind auch der Google-Directory-Rank (DR3) und die PR's der Unterseiten (beide PR3). Der 'Backlink Spider' funktioniert zur Zeit leider nur mit Yahoo und liefert für diese Seite: 1 PR5, 10 PR4, 10 PR3, 6 PR2, 3 PR1 und 31 PR0 Links. Jetzt werden die Links wieder aktiviert und bleiben es auch, bis wiederum zwei Updates vorbei sind, da Google in letzter Zeit PR-Änderungen offenbar nur langsam umsetzt.

Aufruf zum Mitmachen! (24.1.2007: z. Z. ist das Linkverzeichnis gefüllt.)

Bis das Linkverzeichnis gefüllt ist, sind Mitspieler gesucht, die mir bitte einen Link in der Form

  <li>Begleittext <a href="http://www.domain.tld/seite.html">Linktext</a> Begleittext</li>

an Text-Ersatz senden. Dabei bitte folgende Spielregeln beachten:

Kommentiertes Linkverzeichnis

Grüne Texte sind nur Platzhalter, die mit der Zeit durch Mitspieler-Links ersetzt werden (24.1.2007: alle Linkplätze besetzt).

  1. Validator zum Überprüfen der XHTML 1.1 Konformität dieser Seite.
  2. Hier zitierte Papers von Google-Mitarbeitern.
  3. Preiswert und große Auswahl: Bio-, Chemie- und Pasco-Physik-Lehrmittel bei der MODIS GmbH.
  4. Hier ist sinnvoller Text zu finden.
  5. Roboter - damit dürfen sogar 16-Jährige noch spielen.
  6. Erster Platz bei der Google-Suche nach failure (2005-10-05).
  7. Da hat der Fernsehsender Pro 7 wohl was verpennt.
  8. Brett und Kartenspiele gibts bei Brettspielecke.
  9. Deutschsprachiger Webkatalog - Informationsarchiv.com
    54xPR0, 10xPR1, 33xPR2, 46xPR3, 41xPR4, 16xPR5, 9xPR6, PR=6, 6
  10. 'Massachusetts Institute of Technology' oder kurz MIT.
  11. Großhändler - Verzeichnis Kostenloses Link-Verzeichnis für den Großhandel.
  12. Mit Babelfish Texte in viele Sprachen übersetzen.
  13. Exklusives Glasdesign in einem ansprechend gestalteten Online-Shop.
  14. Flossfahrten auf der Isar sind das urbayrische Vergnügen.
  15. Virtuelle Roboter im Wettkampf.
  16. Die Einsteiger-Site für zukünftige Astronomen macht Lust auf eigene Beobachtungen.
  17. Webkatalog 80xPR0, 8xPR1, 27xPR2, 50xPR3, 28xPR4, 8xPR5, 1xPR6, PR=5, 5
  18. Encyclopædia Britannica, das klassische englische Lexikon.
  19. Und die moderne Variante Wikipedia (deutsche Version).
  20. Brauchbare Meta-Suchmaschine in Hannover.
  21. Und die neue Version: Metasuche ohne Müll.
  22. Mystisch? Der eigene Geburtstag in PI.
  23. Eine renomierte und umfangreiche Produktsuche finden Sie auf Industrystock.com.
  24. Grundkenntnisse der Sütterlinschrift machen alte Bücher lesbar.
  25. Kostenlose Designs und Styles für Deine Homepage jetzt Downloaden
  26. Wieviele Domains liegen auf einer IP-Adresse?
  27. Free Backlink Checker
  28. Noch ein PageRank prediction Tool.
  29. Hochwertige Website-Vorlagen für 'lau'.
  30. Hochwertige Fotos - auch für 'lau'.
  31. Historische PageRank-Update Daten
  32. C für Lego's RCX
  33. Verschiedene Routenplaner zur Auswahl
  34. Machen Webmastern das Leben leichter: Suchmaschinen Tools für lau!
  35. Wem Normen im Beruf noch nicht reichen: Normblätter für Modellbahner.
  36. Und ein Modellbahner Portal. 48xPR0, 51xPR1, 44xPR2, 40xPR3, 13xPR4, PR=4, 4
  37. Digitale Fotografie unter the-digiland.de aus dem Erzgebirge
  38. Was man mit php alles machen kann zeigt Knusperleicht im open source Scriptarchiv.
  39. Auch nicht schlecht: Spenden statt schenken.
  40. Weihnachtskrippen bei der Krippenwerkstatt aus Massivholz.
  41. Noch so eine 'mal eben' angemeldete Doktoren-Seite :-)
  42. fischertechnik 89xPR0, 23xPR1, 25xPR2, 29xPR3, 16xPR4, 12xPR5, PR=6, 5
  43. FH Merseburg 63xPR0, 16xPR1, 20xPR2, 38xPR3, 28xPR4, 14xPR5, 7xPR6, PR=6, 6
  44. Elektronik Lehrmittel 7xPR0, 0xPR1, 3xPR2, 6xPR3, 3xPR4, PR=4, 3
  45. Bier 57xPR0, 20xPR1, 33xPR2, 58xPR3, 49xPR4, 14xPR5, 3xPR6, PR=6, 6
  46. Biersuche 109xPR0, 10xPR1, 6xPR2, 6xPR3, 5xPR4, 3xPR5, PR=5, 5
  47. Weingut Reis 48xPR0, 5xPR1, 2xPR2, 4xPR3, 4xPR4, 3xPR5, PR=5, 4
  48. A. Baecker 8xPR0, 5xPR1, 2xPR2, 3xPR3, 2xPR4, PR=4, 4
  49. Heise-Verlag 23xPR0, 2xPR1, 18xPR2, 41xPR3, 69xPR4, 51xPR5, 13xPR6, 4xPR7, 2xPR8, 1xPR9, PR=8, 8
  50. Zur Forelle 15xPR0, 0xPR1, 1xPR2, 1xPR3, PR=3, 2
  51. MS-Forelle 16xPR0, 2xPR1, 2xPR2, PR=2, 2
  52. Gasthof Forelle 6xPR0, 1xPR1, 1xPR2, 2xPR3, PR=3, 3
  53. Leder Buchler 111xPR0, 2xPR1, 1xPR2, 1xPR3, 1xPR4, PR=3, 3
  54. Tierfurtter 23xPR0, 1xPR1, 11xPR2, 4xPR3, PR=3, 3
  55. Ein Counter mit PR10 (2005-09-29).
  56. So viele Science-Links und trotzdem PR5 (2005-10-05)
  57. GoHits 45xPR0, 3xPR1, 9xPR2, 12xPR3, 3xPR4, PR=3, 3
  58. Click-Explorer 21xPR0, 2xPR1, 10xPR2, 4xPR3, PR=2, 3
  59. Die Quelle schlechthin für Open Source Software und Anwendungen.
  60. Du bist erst ein wahrer Doktorand, wenn Du Dich hier anmeldest!
  61. Treppen Uzun in Herne - Große Auswahl und kompetente Beratung.
  62. Mit einer Greencard der USA kann man in Amerika arbeiten.
  63. Anbieter von Sprachreisen USA im Überblick. Tipps und Erfahrungsberichte.
  64. Der HTML-Guide ist ein Kurs für die Websprache.
  65. Schwimmbadtechnik | AS-DirektShop für Schwimmbad- und Gastronomiebedarf | Gastronomiebedarf
  66. Nettes Tool zur Abfrage der verschiedenen Datencenter von Google.
  67. Die Wetterstationen und das Wetter in Deutschland mit Webcams
  68. Infos zur Freepay Aktion | iPod kostenlos! Klappt es wirklich? | Xbox360, PSP, Laptop gratis
  69. So sieht die Seite eines Internet-Freaks und Studienkumpels aus.
  70. Finden Sie hier kostenlose Businessplan-Vorlagen.
  71. Webseite mit dem Lebenslauf Martin Grellmann Ambient DJ mit ein wenig Poesie und Fotos.
  72. Ein Rezept ist nicht nur eine Anleitung.
  73. Ein zip-Tool unter der GNU LGPL.
  74. Mit Gefahrgutinfos von ADR IMDG SPIEGEL einfacher durch das Recht.
  75. Webmastermarkt: Infopool und Linksammlung.
  76. Postkarten mit Postvermerken.
  77. Noch Zeit vor dem Büroschlaf, dann lustige Bilder anschauen.
  78. Auch im Flachland gibt's professionellen Ski-Service.
  79. Manches hat ein Ende,
  80. doch das Internet hat viele.
  81. In Form einer Fehlermeldung,
  82. eines Gästebuches oder
  83. auch einer Landkarte, die
  84. sich auch noch öfter findet.
  85. Richtig kreativ und
  86. bunt in flash oder
  87. galaktisch bis hin zum
  88. Abschalten des Internet (mit Alt-F4 beenden)
  89. oder gar der Erde (mit Alt-F4 beenden).
  90. Hauptsache das Sichern wurde nicht vergessen.

Disclaimer

Auf den Inhalt und die Gestaltung der verlinkten Seiten habe ich keinen Einfluss. Benachrichtigen Sie mich bitte, falls Sie über Links zu Seiten gelangen, deren Inhalte Ihnen bedenklich erscheinen.
Martin Henschke, Dieselstr. 8, 50374 Erftstadt, Tel. 02235 / 75355, E-mail: Text-Ersatz