Es ist jetzt ganz genau zwei Jahre her, dass ich mit dieser Maxiserie anfing. Aber nun ist das Ende abzusehen (wenn auch noch nicht unbedingt nah), denn ich komme endlich zur letzten groszen Sache die ich noch gemessen, mir aber bisher nicht angeschaut habe: die Linkfrequenz.
Zur Auffrischung ganz kurz nochmal: Mich interessiert, ob Seite X von anderen Seiten zitiert wird und auf welchem Linklevel das passiert.
ACHTUNG: Mich interessiert NICHT _wie oft_ Seite X auf einem gegebenen Linklevel (einer anderen Seite) zitiert wird, sondern nur _ob_ Seite X ueberhaupt zitiert wurde.
Ein (stark vereinfachtes) Beispiel in zwei Schritten.
Auf LL5 von Seite A wird Seite X ein Mal zitiert und auf LL6 zwei Mal. In beiden Faellen zaehlt fuer Seite X die Linkfrequenz nur ein Mal fuer das jeweilige Linklevel hoch.
Auf LL5 von Seite B wird Seite X dreiundzwanzig Mal zitiert (und dann nie wieder). Die Linkfrequenz von Seite X fuer LL5 zaehlt nochmal eins hoch und liegt dann insgesamt bei zwei.
Das soll als Zusammenfassung reichen, eine detailliertere Erklaerung findet sich hinter dem oben verlinkten Beitrag. Als erstes schaue ich mir wie immer die Summe aller Linkfrequenzen per Linklevel fuer alle Seiten an:
Zum Vergleich habe ich im linken Diagramm wieder die Summe der totalen Links pro Linklevel reingelegt und da sieht man gleich die erste Ueberraschung: ab ungefaehr Linklevel … ich sag jetzt Mal Linklevel 20 ohne das genau zu pruefen, sind die beiden Kurven beinahe deckungsgleich. Das ist auch keine „logarithmische Komprimierung“, denn bei linearer Darstellung (auszugsweise im rechten Diagramm) sieht das genauso aus.
Na da habe ich doch gleich mal ein Raetsel was es zu løsen gilt. Ich habe so ’ne Vermutung, dass das mit dem bereits (vor allem hier aber auch an anderen Stellen) detailliert besprochenen „São Paulo FC“-Artefakt zu tun hat.
Darauf hin fuehrt das Diagramm welches ich ueblichweise im Anschluss an das Obige zeigte — die Verteilung der Position der Maxima der einzelnen Verteilungen:
AHA! Im Vergleich mit den oben verlinkten Verteilungen der gleichen Grøsze bei den anderen drei Messgrøszen geht das viel weiter. Und wenn wir uns den „Schwanz mal anschauen so sehe ich dort das Folgende (JA, die Links sind alle klickbar und man kann ruhig fragen, wieviel Zeit ich damit verbracht habe):
Nochmal AHA! Denn als ich das „São Paulo FC“-Artefakt zum ersten Mal untersuchte (siehe der Link oben), vermutete (!) ich nur, dass die jeweiligen Jahre am Ende der Linkkette ALLER Seiten stehen. Dafuer hatte ich aber keinen direkten Beweis, auch wenn die indirekten Hinweise sehr schluessig und ueberzeugend waren (bzw. immer noch sind).
Hier nun aber sehe ich direkt, dass die jeweiligen Saisons des São Paulo FC tatsaechlich am haeufigsten (und absteigender Reihenfolge) bei ganz hohen Linkleveln zitiert werden. Cool wa! Ist voll schøn wenn eine (eigene) Theorie direkt bestaetigt wird.
Aber in der Tabelle sehe ich in den entsprechenden Zeilen auch noch viele andere Seiten! Was ist denn mit denen und wieso stehen die da, waren aber nicht zu sehen als das „São Paulo FC“-Artefakt untersucht wurde?
Um das zu erklaeren muss ich etwas weiter ausholen, aber dieser Artikel ist ohnehin schon so lang. Deswegen verschiebe ich das auf das naechste Mal. Und alles zusammen (und noch ein bisschen mehr) fuehrt letztlich zur Entraetselung des obigen Mysteriums.