{"id":12242,"date":"2022-12-07T13:37:56","date_gmt":"2022-12-07T11:37:56","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=12242"},"modified":"2022-09-20T15:29:16","modified_gmt":"2022-09-20T13:29:16","slug":"kevin-bacon-xxxi-archipele-alles-erklaert","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/12\/kevin-bacon-xxxi-archipele-alles-erklaert\/","title":{"rendered":"Kevin Bacon \u2013 XXXI \u2013 Archipele &#8211; alles erklaert"},"content":{"rendered":"<p>Nach der <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=12211\" target=\"_blank\" rel=\"noopener\">vielen Theorie<\/a> die <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=12223\" target=\"_blank\" rel=\"noopener\">letzten beiden<\/a> Male heute nun Messwerte :) \u2026 aber der Reihe nach.<\/p>\n<p>Das Ende des letzten Beitrages aufgreifend: waehrend es (beinahe) unvermeidlich schien, dass es eine &#8222;Insel der Unzitierten&#8220; geben muss, so galt dies nicht fuer die Existenz des No-way-home-Archipels. In den Daten konnte ich Letzteres aber direkt <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=12181\" target=\"_blank\" rel=\"noopener\">nachweisen<\/a>. Kann ich dies auch bzgl. der Archipele der erweiterten Form?<\/p>\n<p>Wie erwaehnt, musste ich zur Klaerung dieser Frage\u00a0 eine sch\u00f8ne rekursive Funktion schreiben. Ich wuerde diese gerne im Detail diskutieren, denn ich finde rekursive Funktionen voll toll und es ist total schade, dass ich die nicht \u00f8fter brauche. Ich befuerchte allerdings, dass dies kontrapodutkiv waere. Deswegen muss ich die Diskussion anders aufziehen.<\/p>\n<p>Bisher arbeitete ich derart, dass ich fuer jede Seite wusste, welche anderen Seiten diese zitiert und folgte dem Linknetzwerk einen Schritt nach dem anderen. Hier nun muss ich zunaechst das &#8222;Spiegelbild&#8220; zu diesen Daten nehmen, ich musste also fuer jede Seite bestimmen, von welchen anderen Seiten diese zitiert wird. Dann folgte ich dem Linknetzwerk rueckwaerts. Ich schaute also fuer eine Seite von wem diese zitiert wurde und bei den zitierenden Seite schaute ich wer diese zitierte und so weiter. Das ist die Rekursion und die fuehrte ich so lange fort, bis keine neuen zitierenden Seiten mehr auftauchten.<\/p>\n<p>Wieauchimmer, rekursive Funktionen haben einen Nachteil: rein praktisch kann ein Computer eine Rekursion nicht beliebig tief folgen. Jedes Rekursionslevel ben\u00f8tigt eigene Ressourcen und davon habe ich nicht unendlich viele in meinem Rechner verbaut.<\/p>\n<p>Deswegen schraenkte ich einen Parameter fuer die Analyse folgendermaszen ein: wenn eine Seite von mehr als 69 anderen Seiten zitiert wurde, so wird die Rekursion abgebrochen. Das ist nicht die ganze Wahrheit, 69 ist das Limit fuer zitierende Seiten die ich auf einem gegebenen Rekursionslevel noch nicht &#8222;gesehen&#8220; habe. Die Anzahl aller zitierenden Seiten k\u00f8nnte also betraechtlich h\u00f8her sein.<br \/>\nIch denke, dass dies Limitierung plausibel ist, denn wenn eine Seite von mehr als 69 Seiten zitiert wird, so ist es sehr unwahrscheinlich, dass alle diese _nicht_ irgendwie eine Verbindung zum &#8222;groszen Auszerhalb&#8220; haben. Letzteres wuerde dann auch die urspruengliche Seite mit der ich startete mit diesem verbinden und damit k\u00f8nnte die Startseite nicht Teil eines Archipels sein.<br \/>\nIch testete bis zum Wert 1500 (ab 2000 wird die Rekursionstiefe so grosz, dass ich in oben erwaehnte Ressourcenlimitierung laufe, bzw. laeszt Python das nicht mehr zu um eben dies zu vermeiden). Der &#8222;Umschlagpunkt&#8220; ab dem keine weiteren Archipele mehr dazu kamen lag bei 68. Der Wert 69 kommt durch das Abfaerben des juvenilen Humors, des jungen Mannes der bei mir wohnt, auf mich zustande.<\/p>\n<p>Desweiteren liesz ich das No-way-home-Archipel auszen vor. OKOK, das stimmt nicht ganz. Ich nahm es einmal mit in die Analyse rein. Dann dauerte Selbige aber ca. 10 Stunden, anstatt ein paar Minuten. Deswegen habe ich das nur ein Mal gemacht. Ich bespreche die Unterschiede bei den Ergebnissen an anderer Stelle, weil ich denke, dass dies durchaus lehhreich sein kann.<\/p>\n<p>Aber genug der Vorrede und Vorhang auf fuer die Ergebnisse; zunaechst das bereits Bekannte.<br \/>\nZum ersten Balken der <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=12170\" target=\"_blank\" rel=\"noopener\">Verteilung der Maxima<\/a> der individuellen Verteilungen der Selbstreferenzen tragen 474.653 Seiten bei. Davon geh\u00f8rten 7649 zu Seiten die sich auf LL<sub>0<\/sub> selbst zitieren (von insgesamt 83.435 Seiten mit dieser Eigenschaft) und auf keinem Linklevel mehr als eine Selbstreferenz haben. Somit blieben 467.004 uebrig, die erklaert werden mussten.<br \/>\nDaraufhin unternahm ich Untersuchungen, die zur Entdeckung des <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=12181\" target=\"_blank\" rel=\"noopener\">No-way-home-Archipels<\/a> fuehrten. Die gr\u00f8szte &#8222;Insel&#8220; dieses Archipels ist die &#8222;Insel der Unzitierten&#8220; mit 320.089 Seiten und insgesamt &#8222;wohnen&#8220; auf dem gesamten Archipel 451.792 Seiten.<br \/>\nDamit blieb fuer nur noch 15.212 Seiten ungeklaert, warum diese zum Signal in besagtem ersten Balken beitragen. Dies fuehrte zu den Ueberlegungen bzgl. der Erweiterung\/Verallgemeinerung des Archipelkonzepts. Hier kommen dann endlich die neuen Ergebnisse.<\/p>\n<p>Ohne jeglichen Einfluss des No-way-home-Archipels finde ich fast 30-tausend Untergruppen. Wenn diese zu den gr\u00f8sztm\u00f8glichen, zusammenhaengenden (Ueber?)Gruppen zusammen gezogen werden, bleiben noch 8.258 Archipele. Hurra! Die Existenz von (konzeptuell erweiterten\/verallgemeinerten) Archipelen ist bewiesen. Nun wird es spannend, ob ich damit auch das erklaeren kann, was ich erklaeren will.<\/p>\n<p>Von den 15.212 Seiten die zitiert werden, aber keine Selbstreferenzen haben, befinden sich 9995 auf diesen Archipelen. Streng genommen muesste ich noch schauen, ob die Zitierungen auch wirklich von niedrigeren &#8222;Stufen&#8220; kommen. Aber rein logisch muss das ja so sein, denn wenn sie von h\u00f8heren Stufen kommen wuerden, dann muessten diese Seiten ja Selbstreferenzen haben. Deswegen spare ich mir das Schauen an dieser Stelle mal ausnahmsweise.<\/p>\n<p>Das ist alles was ich aus den ganzen langen Ueberlegungen und den vielen Stunden die ich mit der Analyse dazu zubrachte herauskam \u2026 so viel geschrieben (nicht nur in diesem Beitrag), fuer nur eine einzige Zahl \u2026 das k\u00f8nnte man als eher mickrige Ausbeute sehen, wenn da nicht die Freude am Erkenntnisgewinn und jede Menge neues, konzeptuelles Wissen ueber das Linknetzwerk an sich waeren \u2026 aber dazu mehr an anderer Stelle (wie es z.Z. aus sieht als Weihnachtsbeitrag).<\/p>\n<p>Und selbst mit dieser Zahl bleiben 5217 Seiten uebrig \u2026 da dachte ich zunaechst .oO(verdammt) \u2026 um dann erleichtert fest zu stellen, dass ich ja noch gar nicht solche Seiten in Betracht gezogen hatte, die keine Links haben, aber zitiert werden.<br \/>\nSeiten ohne Links kennen wir schon von den &#8222;<a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/06\/kevin-bacon-xxiii-aussteiger\/\" target=\"_blank\" rel=\"noopener\">ganz fruehen Aussteigern<\/a>&#8220; aber nicht alle von denen werden zitiert, weswegen ich nicht einfach die Zahl von dort nehmen kann. Ist letzteres der Fall, dann sind die schon bei den &#8222;Bewohnern&#8220; der &#8222;Insel der Unzitierten&#8220; gezaehlt worden. Aber siehe da, 5202 Seiten werden zitiert, haben aber keine Links \u2026 hurrah \u2026 oder eher: AAARGHAGAHGRHG \u2026 da bleiben naemlich immer noch 15 Seiten uebrig.<\/p>\n<p>An dieser Stelle dachte ich zunaechst: .oO(15 von fast 500k \u2026 da ist der erste Balken ja (fast) komplett erklaert und das &#8222;fast&#8220; ist ein sehr sehr sehr kleines &#8222;fast&#8220; \u2026 das kann ich getrost alles in den Fehler schieben \u2026 auszerdem habe ich mit den Archipelen so viel gelernt, eigentlich k\u00f8nnte ich hier auch aufh\u00f8ren).<br \/>\nAber ein Teil meines Wesens ist, dass ich erst &#8222;aufgebe&#8220;, wenn ich wirklich nicht mehr weiter weisz. Und hier hatte ich zwar zunaechst keine Idee, aber das Beduerfniss, da noch laenger drueber nachzudenken, auch wenn es nur noch 15 Seiten waren, die einer Erklaerung bedurften.<\/p>\n<p>Und ich gruebelte und gruebelte und kam einfach auf keinen plausiblen Mechanismus fuer diese 15 Seiten.<br \/>\nDann ging ich auf einen Spaziergang \u2026 und wie so oft auf Spaziergaengen scheint die Bewegung auch mein Gehirn in Gang zu bringen, denn pl\u00f8tzlich hatte ich eine Erklaerung parat.<br \/>\nBei diesen 15 k\u00f8nnte es sich um Seiten handeln, die von &#8222;Auszen&#8220; zitiert werden (also zu keinem Archipel geh\u00f8ren), die mindestens einen weiterfuehrenden Link haben (also nicht unter die obigen 5202 Seiten fallen, fuer die das nicht gilt) aber wo die Linkkette dann schnell ins Leere fuehrt. Also weitere &#8222;fruehe Aussteiger&#8220; aber nicht auf LL<sub>0<\/sub> wie oben, sondern auf LL<sub>1-3<\/sub>.<\/p>\n<p>Und tatsaechlich! Diese 15 Seiten werden alle aus dem groszen Wikipedialinknetzwerk (und auch von Archipelen, aber nur Ersteres ist relevant) zitiert. Manche sogar mehrfach. Desweiteren haben alle nur einen Link und alle diese Links fuehren zu Seiten die keine weitern Links haben. \u2026 YEEEEEEEES!!! \u2026 I AM AWESOME!<\/p>\n<p>Tja, und damit ist das Signal im ersten Balken komplett erklaert und das Mysterium ist keins mehr! Toll wa!<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Nach der vielen Theorie die letzten beiden Male heute nun Messwerte :) \u2026 aber der Reihe nach. Das Ende des letzten Beitrages aufgreifend: waehrend es (beinahe) unvermeidlich schien, dass es eine &#8222;Insel der Unzitierten&#8220; geben muss, so galt dies nicht fuer die Existenz des No-way-home-Archipels. In den Daten konnte ich Letzteres aber direkt nachweisen. Kann [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/12242"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=12242"}],"version-history":[{"count":6,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/12242\/revisions"}],"predecessor-version":[{"id":12260,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/12242\/revisions\/12260"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=12242"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=12242"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=12242"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}