Zur Erinnerung: im allerersten Balken in der hier gezeigten Verteilung stecken 474.653 Seiten. Davon sind nur 7649 von der Sorte, die sich auf LL0 selbst zitieren und entweder keine oder niemals mehr als eine Selbstreferenz auf høheren Linkleveln haben. Damit muss ich nur noch erklaeren wo die restlichen 467.004 Seiten die dieses Signal ausmachen herkommen.

Natuerliche Kandidaten sind uns bereits vor fast genau einem Jahr begegnet. Es sind Seiten die niemals nicht zitiert werden (und damit in dem zweiten Grafen den schwarzen Streifen auf der linken Seite verursachen), aber selber andere Seiten zitieren. Damals waren die nur im grøszeren Zusammenhang von Interesse aber im Speziellen nicht weiter relevant. Aber im Zusammenhang mit dem Mysterium des hohen ersten Balkens der Verteilung der Maxima der Selbstreferenzen muss ich eben diese nun etwas genauer betrachten.

Solange eine Seite Links hat, hat diese prinzipiell Zugriff auf das gesamte Wikipedialinknetzwerk. Wenn diese Seite nun niemals woanders verlinkt wird, so fuehrt dies zu null Selbstreferenzen, trotzdem ich von der Seite den Rest des Linknetzwerkes abschreiten kann. So weit so klar und ich kann relativ einfach schauen, welche Seiten niemals nicht zitiert werden. Derer gibt es 320.089 … wow!
Es gibt sozusagen eine „isolierte Insel“ auf der ca. 5 % aller Wikipediaseiten „wohnen“. Von dieser Insel kommt man zwar weg (Links zu anderen Seiten) aber wenn man einmal weg ist, dann kommt man niemals zurueck (weil ja kein Inselbewohner zitiert wird).
Auch wenn mich die Menge etwas ueberrascht so ist das natuerlich gut mit Hinblick auf obiges Mysterium. Denn pløtzlich muss ich nur noch eine Erklaerung finden fuer 146.915 Seiten die zitiert werden, aber trotzdem keine Selbstreferenzen erhalten. Hier greift die obige, einfache Erklaerung nicht.

Nun denke man sich aber eine Seite, die zwar KEIN „Einwohner“ der (isolierten) „Insel der Verdammten Unzitierten“ ist. Diese  Seite wird dann sehr wohl zitiert, aber weiter denke man sich, dass diese(s) Zitat(e) NUR von besagter Insel kommen.
In dem Fall hat man auch null Selbstreferenzen, denn von der Seite komme ich ja niemals auf die Insel und somit kann das Selbstzitat auch niemals aktiviert werden.

So weit so gut. Ich schaute mal und tatsaechlich, ich habe 124.139 Seiten die zwar nicht Teil der „isolierten Insel“ sind, aber NUR von dort Zitate erhalten.
Cool wa! Damit bleiben nur 22.776 Seiten uebrig. Prinzipiell kønnte ich hier aufhøren und sagen, dass alles uebriggebliebene Unerklaerte nun so wenig ist, dass ich das getrost in den beruehmten Fehler druecken kann. Aber ich bin mit meinen Ideen noch nicht am Ende und das Prinzip der „Insel der Unzitierten“ haelt noch mehr in petto (was uebrigens nicht Latein sondern italienisch ist, obgleich auch aus dem Lateinischen abgeleitet) was auch so einiges ueber die Struktur des Linknetzwerkes beleuchtet. Dafuer muessen wir das Konzept aber von einer Insel zu einem Archipel erweitern. … Ich habe da mal was vorbereitet:

Die grosze Ellipse mit dem groszen Alpha drin soll die „isolierte Insel der Unzitierten“ darstellen. Die duennen, grauen Pfeile gehen zu Seiten die mit dem gesamten (restlichen) Linknetzwerk verbunden sind (aber natuerlich NICHT mit dieser Insel).
„Einwohner“ auf Alpha zitieren Einwohner auf den Beta und Gamma Inseln. Das ist durch die dicken, blauen Pfeile gekennzeichnet. Dies beruht aber nicht auf Gegenseitigkeit, denn von dort geht kein dicker, blauer Pfeil (und somit kein Zitat) zurueck. Damit kønnen Beta und Gamma NICHT Teil von Alpha sein, denn die werden ja zitiert (von Alpha) waehrend das Erkennungsmerkmal von Alpha gerade ist, dass die Seiten dort nicht zitiert werden. Gamma zitiert nun Delta und Delta zitiert Epsilon und von Epsilon komm ich nur zu Seiten im groszen Linknetzwerk.

Es bildet sich also eine Art Inselkette und das wichtige Merkmal dieser Kette ist, dass die Zitate immer nur in eine Richtung gehen und niemals zurueck! Sobald ich eine Insel verlassen habe, komme ich nie wieder auf diese zurueck.
Nun ist es aber keine Kette sondern vielmehr eben ein Archipel. Dies versuche ich mit den zwei Pfeilen zur Insel Gamma darzustellen. Oder anders: das Prinzip auf das ich hinaus will bleibt erhalten, auch wenn man Zitate von verschiedenen Inseln zulaeszt.

Was hat das nun mit unseren 22.776 Seiten zu tun, die oben noch uebrig geblieben sind? Zur Klaerung dieser Frage stelle man sich Folgendes vor: alle Einwohner von Insel Gamma gehøren zu diesen 22.776 Seiten (denn die werden ja zitiert (von Alpha und Beta)). Wenn ich mit einer Seite auf Insel Gamma starte, dann habe ich Zugriff auf das gesamte Linknetzwerk (via den duennen, grauen Pfeilen), aber von dort kommt ja niemals ein Zitat zurueck (und somit keine Selbstreferenz zustande). Die einzige Selbstreferenz kønnte von den Inseln Alpha oder Beta stammen, aber weil niemand von auszerhalb Alpha oder Beta zitiert und Insel Gamma dies auch nicht tut sind wir wieder bei obiger Situation, dass diese Selbstreferenzen niemals „aktiviert“ werden.

Aber Achtung! Waehrend die Existenz von Insel Alpha durchaus als plausibel von vornherein angenommen werden konnte, ist die Existenz eines solchen Archipels mitnichten zwangslaeufig!

Ich habe natuerlich mal geguckt und siehe da: es gibt ein solches no-way-home Archipel. Insgesamt besteht das Archipel aus 39 Inseln (inklusive der zuerst betrachteten „Insel der Unzitierten“), auf denen sich 451.792 Seiten tummeln. Die obigen 124.139 Seiten welche nicht Einwohner der „Insel der Unzitierten“ sind aber von dort zitiert werden, „wohnen“ also alle auf dem Archipel. Der Rest sind ebenso Bewohner des Archipels, die werden aber nicht von Insel Alpha zitiert.
Die weitaus meisten Inseln haben uebrigens drei oder weniger „Einwohner“; der allergrøszte Teil der „Einwohner“ treibt sich also auf nur drei Inseln rum.

Cool wa! Pløtzlich bleibt von den 474.653 Seiten im ersten Balken der Ursprung von nur noch 15.212 Seiten unerklaert. Das nenn ich mal einen riesigen Erfolg.
Ganz am Ende bin ich damit noch nicht. Denn das obige Konzept kann nochmals erweitert werden. Aber das mache ich beim naechsten Mal.

Leave a Reply