Googles PageRank hat also seinen Ursprung in der empirischen Sozialforschung, genauer gesagt in der Soziometrie. Aber wie funktioniert er? Um das besser zu verstehen hilft es, zunächst bei dem Beispiel einer Gruppe von Menschen zu bleiben.

Wer gut vernetzt ist, hat dort Vorteile. Das ist die Annahme, von der der Soziologe John Seeley ausging und die der Statistiker Leo Katz 1953 in ein ausgefeiltes Modell übersetzte. Allerdings ist Bekanntschaft nicht gleich Bekanntschaft. Wer mit wichtigen Leuten befreundet ist, profitiert davon stärker und wer nur einer unter 100 „Kumpels“ ist weniger als der, der der einer von wenigen guten Freunden ist.

Das Beispiel zeigt auch gleich die Grenzen. Denn es gibt gute Freundschaften und flüchtige Bekanntschaften, so wie es auf meiner Seite Links gibt, die mir sehr wichtig sind und solche, die ich für zweitranging halte. Und natürlich ist die Position in einer Gruppe auch von meinem Charakter und meinen Fähigkeiten abhängig und die Qualität einer Seite von ihrem Inhalt.

Funktion des PageRank anhand eines Beispiel-Internets. Neben der Zahl der eingehenden Links spielt auch die Bedeutung der verlinkenden Seiten eine Rolle sowie die Exklusivität der Links (also ob die verlinkende Seite auch auf andere Seiten verweist). Seiten, auf die nicht verlinkt wird, haben ebenfalls ein Gewicht, in der Praxis ist aber fraglich, ob die Seiten überhaupt gefunden und einbezogen werden. Quelle: Wikipedia

Die Grundidee war die, dass jede Person ein bestimmtes Gewicht hat. Von dem profitieren auch ihre Kontakte, denn dieses wird an sie weitergegeben. Allerdings nicht vollständig an jeden Kontakt, sondern nur anteilig. Bei zehn Kontakten bekommt jeder ein Zehntel des Gewichts weitergegeben.

1965 wurde von Charles Hubbell ein Dämpfungsterm eingeführt. Das bedeutet, dass nur noch ein Teil weitergegeben wird und hat den Vorteil, dass es eine eindeutige Lösung gibt. Ein Beispiel: Nehmen wir an, eine Person hat ein Gewicht von 100. Ist der Dämpfungsterm 85 Prozent, so werden 85 Punkte weitergeben. Bei zehn Kontakten erhält jeder also 8,5 Punkte.

Im dritten Teil wird es darum gehen, was das konkret für Googles Suche bedeutet.

One thought on “PageRank – Teil 2”

Comments are closed.