{"id":14406,"date":"2025-07-29T13:37:10","date_gmt":"2025-07-29T11:37:10","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=14406"},"modified":"2025-04-22T02:33:25","modified_gmt":"2025-04-22T00:33:25","slug":"kevin-bacon-anhang-a2-reproduzierbarkeit-10-da-ist-die-tuer","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2025\/07\/kevin-bacon-anhang-a2-reproduzierbarkeit-10-da-ist-die-tuer\/","title":{"rendered":"Kevin Bacon &#8211; Anhang A2 &#8211; Reproduzierbarkeit 10: da ist die Tuer"},"content":{"rendered":"<p>Ich schreibe diesen Beitrag etliche Wochen vor meiner Reise in den fernen Osten. In der Woche bevor dieser Artikel hier erscheint bin ich nach Plan schon zurueck. Von eurer Warte, meine lieben Leserinnen und Leser, dehnte die Sommerpause sich um eben diese Woche aus weil \u2026 \u00f8hm \u2026 ich nehme an, dass ich da noch halb im Jetlag bin (auch wenn der eigtl. in die richtige Richtung geht beim Rueckflug) \u2026 und auszerdem ist&#8217;s im Sommer warm und bei h\u00f8herer Temperatur dehnt sich i.A. alles aus (also auch die Sommerpause).<\/p>\n<p>Aber nun geht&#8217;s weiter und zwar mit dem was ich <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/06\/kevin-bacon-xxiii-aussteiger\/\" target=\"_blank\" rel=\"noopener\">damals als Aussteiger bezeichnete<\/a>. Oder anders: ich schaute (damals) wieviele Seiten ab welchem Linklevel keine totalen Links mehr haben. Konzeptionell ist diese Herangehsensweise etwas &#8222;haarig&#8220;, denn bei den Selbstreferenzen k\u00f8nnen Seiten &#8222;mittendrin&#8220; keine Selbstreferenzen mehr haben, aber zu einem spaeteren Linklevel dann doch wieder. Das habe ich in einem <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2023\/03\/kevin-bacon-xxxviii-ill-be-back\/\" target=\"_blank\" rel=\"noopener\">anderen Zusammenhang als &#8222;Reaktivierungen&#8220;<\/a> bezeichnet und diesen Aspekt lasse ich heute zunaechst auszen vor.<br \/>\nUm dieser &#8222;Haarigkeit&#8220; zu entkommen, drehte ich bei der Neuprogrammierung des hierzu geh\u00f8rigen Analyseprogramms den Ansatz einfach um: ich schaue von hinten, ab welchen Linklevel eine Gr\u00f8sze von Interesse einen Wert UNGLEICH Null hat. Das ist im Wesentlichen das Gleiche, mit dem kleinen Unterschied, dass alle Grafen hier um eins nach Links verschoben sind, denn der letzte Wert ungleich Null kommt ja genau ein Linklevel vor dem ersten Nullwert (mit der Ausnahme der Selbstreferenzen).<\/p>\n<p>Das war alles was ich damals machte. Aber schon bei den <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=14359\" target=\"_blank\" rel=\"noopener\">Maximumspositionen<\/a>, &#8222;sehe&#8220; ich auch hier nicht mehr nur die Position des Ausgangs, sondern auch den Wert (einer gegebenen Gr\u00f8sze von Interesse), den die Seiten am Ausgang haben. Anders als beim letzten Mal (wo ich diese neue Sache erst einfuehrte), mache ich da nicht mehrere Artikel draus, sondern handle das heute alles auf einmal ab.<\/p>\n<p>Und jetzt geht&#8217;s los, wie so oft, zunaechst mit den totalen Links:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/222_reproduced_position_and_value_of_exit_total_links.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14438 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/222_reproduced_position_and_value_of_exit_total_links-800x327.png\" alt=\"\" width=\"800\" height=\"327\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/222_reproduced_position_and_value_of_exit_total_links-800x327.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/222_reproduced_position_and_value_of_exit_total_links-1024x418.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/222_reproduced_position_and_value_of_exit_total_links-768x314.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/222_reproduced_position_and_value_of_exit_total_links.png 1136w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>Aha! Bzgl. der Position des Ausgangs (linkes Diagramm), reproduzieren die 2023 Daten die Form der Verteilung der 2020 Daten. Ein paar Balken am Anfang mit ungefaehr gleicher H\u00f8he, dann erstmal nix, dann ein &#8222;Wald&#8220; mit kurzen Balken und am Ende ein hoher &#8222;Berg&#8220; (auch mit ungefaehr gleich hohen Balken). Letzteres bedeutet, dass alle Seiten ungefaehr zum gleichen Zeitpunkt aussteigen und war der erste Hinweis auf <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?s=Kevin+Bacon+Jaeger+der+verlorenen+Artefakte\" target=\"_blank\" rel=\"noopener\">Ketten (oder &#8222;Familien&#8220;) von Seiten<\/a> (damals dauerte es noch eine Weile, bis ich das in einem anderen Zusammenhang erkannte). Oder anders: Reproduktion gelungen.<br \/>\nIn den 2023 Daten scheint es mindestens eine Kette zu geben, die 10 Linklevel laenger ist, als die laengste Kette in den 2020 Daten. Da dies aber keine &#8222;kollektive Eigenschaft&#8220; ist, die man ueber alle Seiten &#8222;mitteln&#8220; kann, sondern aus dem Verhalten individueller Seiten folgt ist das jetzt nicht verwunderlich, dass das nicht reproduziert wird. Ich komme da vllt. spaeter nochmal drauf zurueck, falls ich mir die Ketten nochmal anschaue\u00a0 \u2026 weisz ich jetzt aber noch nicht.<\/p>\n<p>Ach ja Mensch! Jetzt hab ich vergessen zu sagen, dass bzgl. des am weitesten links liegenden Balkens (bei einem Wert auf der Ordinate von minus eins) das Selbe gilt wie bei den Maximapositionen: dieser Balken ist &#8222;flachen&#8220; Verteilungen zuzuordnen! Zu Details lese man den oben verlinkten entsprechenden Beitrag.<\/p>\n<p>Weiter nun mit dem Diagramm auf der rechten Seite &#8211; der Anzahl der totalen Links am Ausgang \u2026 also der Ausgangswert \u2026 was natuerlich nicht hinhaut, weil ein Ausgangswert eigtl. meist der allererste Wert ist, von dem alles aus geht. Wieauchimmer, das wird nun scheinbar (!) ueberhaupt nicht reproduziert und das wundert mich gar nicht. Das haette nur dann (mehr oder weniger) direkt (!) reproduziert werden k\u00f8nnen, wenn es keine laengere Kette als damals gaebe. Die Seiten der neuen Kette haben natuerlich eine ganz andere Anzahl an Links.<br \/>\nInteressant sind zwei Sachen in den 2023 Daten. Zum Einen hat die Verteilung mehr Balken. Es gibt also mehr Seiten die als Ausgang fungieren als bei den 2020 Daten. Wenn man drueber nachdenkt war das durchaus zu erwarten und die Anzahl der Balken ist jetzt zwar &#8217;ne halbe Gr\u00f8szenordnung mehr, aber das liegt vor allem daran, weil die 2020 Verteilung so wenige Balken hat. Waere letzte doppelt so grosz, dann haette man nur einen Unterschied von ca. einem Faktor 2 und das wuerde nicht verwundern.<br \/>\nDie zweite Sache ist da schon deutlich interessanter, denn es gibt in den 2023 Daten ZWEI sehr hohe Balken mit ca. 4 Millionen und ca. 2 Millionen Seiten die dort aussteigen. Das k\u00f8nnte ein Hinweis sein, dass es ZWEI Ketten mit \u2026 mhmmmm \u2026 ich denke der selben Laenge gibt (oder vielleicht plusminus eins) und ca. 1\/3 aller Seiten landen etwas frueher in Kette #1 (und sind mit der etwas frueher fertig), waehrend die anderen 2\/3 Kette #2 etwas frueher abarbeiten um dann zuletzt in Kette #1 zu sein und mit der abzuschlieszen.<br \/>\nDas k\u00f8nnte man mal naeher untersuchen \u2026 und wie oben erwaehnt, das mache in diesem Falle sogar ich, falls ich mich den Ketten nochmals zuwende.<\/p>\n<p>Festzuhalten bzgl. des rechten Diagramms ist das Folgende: in den den individuellen Eigenschaften wird der Wert am Ausgang NICHT reproduziert, aber bzgl. der _kollektiven_ Eigenschaften dann doch. Es gibt keine Seiten die massenhaft Links am Ausgang haben; alles tuemmelts sich um ca. den Wert 15 auf der Ordinate. Und auch wenn die Anzahl der Balken in den 2023 Daten signifikant gr\u00f8szer ist, so ist besagte Anzahl nicht mal eine Gr\u00f8szenordnung (oder gar mehr) gr\u00f8szer \u2026 aber das haengt direkt mit der ersten Aussage zusammen. Die letzte Eigenschaft, dass die allermeisten Seiten auf nur einer Seite am Ende landen wird zwar nicht direkt reproduziert, aber aus einer werden halt zwei und ich wuerde das dann doch als gelungene Reproduktion anerkennen (selbst wenn die beiden zugeh\u00f8rigen Balken indviduell andere Werte auf der Ordinate haben \u2026 was ja aber eine individuelle Eigenschaft ist).<\/p>\n<p>Nun die neuen Links:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/223_reproduced_position_and_value_of_exit_new_links.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14439 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/223_reproduced_position_and_value_of_exit_new_links-800x327.png\" alt=\"\" width=\"800\" height=\"327\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/223_reproduced_position_and_value_of_exit_new_links-800x327.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/223_reproduced_position_and_value_of_exit_new_links-1024x418.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/223_reproduced_position_and_value_of_exit_new_links-768x314.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/223_reproduced_position_and_value_of_exit_new_links.png 1136w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>Bzgl. der Position des Ausgangs (linkes Diagramm) sieht das natuerlich so aus wie bei den totalen Links (selbstverstaendlich verschoben um eins nach links auf der Ordinate) \u2026 und das muss auch so sein.<br \/>\nDie Verteilung der Werte am Ausgang bestaetigt das oben Gesagte (zwei sehr hohe Balken, vermutlich durch zwei gleich lange laengste Ketten). Dass es hier deutlich weniger Balken insgesamt gibt ist dem Umstand geschuldet, dass alle Seiten am Ende einfach schon (fast) alle Seiten des Wikipdianetzwerkes gesehen haben und einfach nix Neues mehr uebrig ist.<br \/>\nOder anders: in beiden Faellen ist die Reproduktion auch hier gelungen (wenn man die zwei vermuteten, gleich langen laengste Ketten mit in Betracht zieht).<\/p>\n<p>Die Selbstreferenzen hatte ich <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2023\/03\/kevin-bacon-xxxvii-gesprengte-ketten-1\/\" target=\"_blank\" rel=\"noopener\">damals<\/a> untersucht, aber in einem anderen Zusammenhang und mit der oben beschriebenen &#8222;haarigen&#8220; Herangehensweise. Deswegen sind die roten Balken im linke Diagramm hier \u2026<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/224_reproduced_position_and_value_of_exit_self_references.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14442 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/224_reproduced_position_and_value_of_exit_self_references-800x328.png\" alt=\"\" width=\"800\" height=\"328\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/224_reproduced_position_and_value_of_exit_self_references-800x328.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/224_reproduced_position_and_value_of_exit_self_references-1024x420.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/224_reproduced_position_and_value_of_exit_self_references-768x315.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/224_reproduced_position_and_value_of_exit_self_references.png 1132w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>\u2026 nicht identisch zum damaligen Diagramm. Ansonsten ist die Interpretation beider Grafen unkompliziert, weswegen ich mir das spare. Damit bleibt nur zu sagen: Reproduktion in beiden Faellen gelungen.<\/p>\n<p>Und zum Abschluss die Linkfrequenz:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/225_reproduced_position_and_value_of_exit_linkfrequency.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14443 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/225_reproduced_position_and_value_of_exit_linkfrequency-800x329.png\" alt=\"\" width=\"800\" height=\"329\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/225_reproduced_position_and_value_of_exit_linkfrequency-800x329.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/225_reproduced_position_and_value_of_exit_linkfrequency-1024x421.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/225_reproduced_position_and_value_of_exit_linkfrequency-768x316.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/225_reproduced_position_and_value_of_exit_linkfrequency.png 1136w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>Zu meiner Ueberraschung hatte ich das damals gar nicht untersucht und sehe erst jetzt, dass hier ein paar interessante Dinge passieren. Zunaechst waere da die &#8222;Doppelspitze&#8220; im linken Diagramm. Eine &#8222;Spitze&#8220; nahe des Urpsrung hat man auch bei den totalen und neuen Links. Dort befinden sich dann aber weniger als 10-tausend Seiten, waehrend hier fast 500-tausend in dem Bereich zusammen kommen. Und &#8222;das dicke Ende&#8220; kommt dort dann auch erst ganz am Ende.<br \/>\nBei den Selbstreferenzen hat man zwar einen &#8222;dicken Berg&#8220; ziemlich am Anfang (aber nicht nahe des Urpsrungs), der ist aber nicht durch ein deutliches &#8222;Tal&#8220; von einer zweiten &#8222;Spitze&#8220; getrennt. Ich denke, dass das hier wieder die <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?s=Kevin+Bacon+XXXI+Archipele\" target=\"_blank\" rel=\"noopener\">Archipele<\/a> sind \u2026 das muesste aber mal wer anders genauer untersuchen.<br \/>\nAnderweitig reproduzieren die 2023 Daten aber die 2020 Daten.<\/p>\n<p>Das rechte Diagram ist auch sehr interessant. In den 2020 Daten scheint der Verlauf DREI klar zu unterscheidenden, maechtigen Gesetzen zu folgen. Und zwar mit ziemlich abrupten (anstatt &#8222;ruckelfreien&#8220;) Uebergaengen. Wenn man genau hinschaut, dann wird das auch in den 2023 Daten reproduziert. ABER dort kommt es zwei Mal zu einer Verschiebung der Punkte nach rechts. Ein Mal von ca. 20 zu ca. 30 und beim zweiten Mal von ca. 250 bis ca. 350 auf der Ordinate (die zwei leicht erkennbaren Stufen). Wobei das keine konstante Verschiebung nur um die angegebenen Werte ist, denn das ist &#8217;ne logarithmische Skala und die Verschiebung muss sich &#8222;logarithmisch proportional&#8220; (was immer das auch heiszen mag \u2026 ich hab mir den Begriff gerade erst ausgedacht) durchziehen, damit das so &#8222;parallelverschoben&#8220; aussieht.<br \/>\nWenn man die &#8222;Parallelverschiebung&#8220; in Gedanken rueckgaengig macht, dann scheinen die blauen Quadrate recht genau (so genau wie das Pi mal Daumen geht) wieder auf den roten Punkten zu landen; inklusive des Knicks um ca. 45 auf der Ordinate, bei dem der Uebergang von einem maechtigen Gesetz zum anderen stattfindet.<br \/>\nAlles in allem ist das schon eine kuriose Sache, die hier in den 2023 Daten passiert \u2026 aber wenn man die in Betracht zieht (und somit auszer Acht laeszt), dann wuerde ich sagen, dass die 2023 Daten die 2020 Daten reproduzieren.<\/p>\n<p>Das ist genug fuer heute \u2026 mal schauen ob ich mir noch den Spezialfall der &#8222;haarigen&#8220; Herangehensweise fuer die Selbstreferenzen anschaue und dann gleich die &#8222;Reaktivierungen&#8220; mit abhandle, oder ob ich naechstes Mal doch zu was ganz anderem uebergehe.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ich schreibe diesen Beitrag etliche Wochen vor meiner Reise in den fernen Osten. In der Woche bevor dieser Artikel hier erscheint bin ich nach Plan schon zurueck. Von eurer Warte, meine lieben Leserinnen und Leser, dehnte die Sommerpause sich um eben diese Woche aus weil \u2026 \u00f8hm \u2026 ich nehme an, dass ich da noch [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14406"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=14406"}],"version-history":[{"count":8,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14406\/revisions"}],"predecessor-version":[{"id":14485,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14406\/revisions\/14485"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=14406"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=14406"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=14406"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}