Ich habe ja in der Vergangenheit schon mal darüber geschrieben, wo überall Statistik drin steckt, ohne dass man es vermutet. Beispielsweise warum die Straßenbahn Statistik braucht. Fast noch präsenter ist allerdings ein anderes Einsatzfeld, das sich fast jeder Leser jeden Tag nutzt, nämlich in Suchmaschinen.
Die dahinter stehende Statistik ist im Prinzip die Zahl der Links, die auf jede Seite verweisen oder von ihr ausgehen. Es gibt viele schönes Seiten mit vielen schönen Formeln. Wie im Statistiker-Blog üblich werde ich allerdings vesuchen, das System mit Worten verständlich zu erklären. Im ersten Teil gibt es alledings nur ein bisschen Hintergrund, die Erklärung folgt in den nächsten Beiträgen.
Natürlich geht es nicht um irgendeine Suchmaschine, sondern um den Page Rank von Google. Das dahinter stehende System ist allerdings weit älter als das Internet. Es wurde im Prinzip bereits 1949 vom Soziologen John Seeley eingeführt und wenig später vom Statistiker Leo Katz in ein dem heutigen Page Rank schon sehr ähnliches Format gebracht. Während die Google Gründer Milliardäre wurden, ist Seeley in Wikipedia unbekannt, über Leo Katz findet man nur auf englisch ein paar Zeilen, in denen nicht viel mehr steht als dass er ein amerikanischer Statistiker war. Die Tatsache, dass die Grundidee zu dem Algorithmus recht alt war, hinderte das amerikanische Patentamt auch nicht daran, darauf ein Patent zu vergeben. Allerdings nicht an Google, sondern an die Stanford University. Google übertrug ihr für die exklusiven Nutzungsrechte Aktien, die 2005 für 335 Millionen US-Dollar verkauft wurden.
Den grundlegenden Text von Leo Katz kann man sogar online abrufen, leider nur gegen Bezahlung.
Gedacht wer er ursprünglich, um damit die Stellung von Personen in Gruppen beschreiben zu können. Mit Hilfe des Verfahrens sollte die Vernetzung der Akteuer auch quantitativ beschreiben zu können.
[…] var addthis_config = {"data_track_clickback":true};Nun bin ich ja bekanntlich bekennender Google-Kritiker. Ich habe nichts gegen den Konzern an sich, aber mir missfällt die Vorstellung, dass das Internet […]
[…] Webkatalog – eine Liste von Suchmaschinen. Ja, es gibt mehr Suchmaschinen auf der Welt als Google, auch wenn die Kalifornier vor allem in Deutschland nahezu ein Monopol auf die Online-Suche […]
[…] Tatsache, dass Googles Eintreten für eine "freies" Internet nicht besonders ehrlich ist. Denn der Page Rank, Googles Kern, ist bis heute patentgeschützt, obwohl er auf einem statistischen Modell aus der […]
[…] Was suchen var addthis_product = 'wpp-261'; var addthis_config = {"data_track_clickback":true};Was suchen Internetnutzer, wenn Sie wissenschaftliche Themen im Netz suchen? Dazu wäre natürlich eine Auswertung der Suchbegriffe in den großen Suchmaschinen interessant. […]
[…] zweiten Teil haben wir nun also gesehen, wie das Grundgerüst des Google Algorithmus funktioniert. Wie gesagt ist die Formel prinzipell sehr alt und stamm aus den 1950er Jahren. Google ist in Deutschland […]