{"id":14359,"date":"2025-05-19T13:37:30","date_gmt":"2025-05-19T11:37:30","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=14359"},"modified":"2025-04-28T15:15:31","modified_gmt":"2025-04-28T13:15:31","slug":"kevin-bacon-anhang-a2-reproduzierbarkeit-9a-maximapositionen","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2025\/05\/kevin-bacon-anhang-a2-reproduzierbarkeit-9a-maximapositionen\/","title":{"rendered":"Kevin Bacon &#8211; Anhang A2 \u2013 Reproduzierbarkeit 9a: Maximapositionen"},"content":{"rendered":"<p>Via &#8222;<a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/06\/kevin-bacon-xxii-spaetzuender\/\" target=\"_blank\" rel=\"noopener\">Spaetzuender<\/a>&#8220; (auch als &#8222;grobe Abweichler&#8220; bezeichnet) bin ich damals auf die Idee gekommen, mir mal anzuschauen auf welchen Linkleveln eigentlich die meisten Seiten das Maximum in der Kurve einer gegebenen Gr\u00f8sze von Interesse haben.<\/p>\n<p>Fuer die Anzahl der totalen Links ist das hier reproduziert:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/213_reproduced_position_of_maximum_total_links.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14379 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/213_reproduced_position_of_maximum_total_links.png\" alt=\"\" width=\"558\" height=\"456\" \/><\/a><\/p>\n<p>Wie erwartet gibt es zwischen den 2020-Daten und den 2023-Daten keine wesentlichen Unterschiede; insb. veraendern sich die Gr\u00f8szenverhaeltnisse der Balken von Linklevel zu Linklevel nicht. Das ist also als reproduziert anzusehen.<br \/>\nDie blauen Balken bei LL<sub>1<\/sub> und LL<sub>9<\/sub> sehen zwar deutlich gr\u00f8szer \/ kleiner aus, aber man beachte die logarithmische Ordinate. Da sind im ersten Fall also nicht mal 10 Seiten dazu bzw. im zweiten Fall deutlich weniger als 10 Seiten &#8222;abhanden&#8220; gekommen \u2026 die viel kleinere Erh\u00f8hung bei LL<sub>4<\/sub> entspricht fast einer Million Seiten. Logarithmische Achsen sind schon was Feines, nicht wahr! Die halten irrelevante Information von einem weg \u2026 man muss aber auch aufpassen, dass andere irrelevante Information nicht ueberinterpretiert wird.<\/p>\n<p>Ansonsten gibt es nur eine Sache zu sagen und das ist ein wichtiger Unterschied im Vergleich zum damaligen Diagramm. Dort war naemlich der Balken bei LL<sub>0<\/sub> zu hoch und es stellte sich dann heraus, dass es ueber 5-tausend Seiten OHNE Links gibt die da drin mitgezaehlt wurden \u2026 und nur ca. 100 Seiten mit einem echten Maximum der totalen Links auf LL<sub>0<\/sub>. Erstere haben eine flache totale-Links-per-Linklevel Verteilung; ohne Links als Ausgangspunkt kommt man nicht auf andere Seiten mit mehr Links \u2026 es startet also alles bei Null und bleibt auch dabei. Das wurde von meinem Algorithmus faelschlicherweise als &#8222;Maximum&#8220; auf LL<sub>0<\/sub> interpretiert.<br \/>\nWieauchimmer, solche Seiten werden jetzt richtig erkannt und auf die &#8222;flach&#8220;-Position auf der Abzsisse gesondert dargestellt \u2026 und das gilt fuer alle Diagramme in diesem Beitrag.<\/p>\n<p>Nun zu den neuen Links. Die Verteilung der Maximaspositionen der entsprechenden Kurven hatte ich <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/09\/kevin-bacon-xxvi-details\/\" target=\"_blank\" rel=\"noopener\">damals<\/a> der gleichgearteten Verteilung der totalen Links gegenuebergestellt. Das wiederhole ich heute nicht, denn es ist nur von Interesse ob Erstere reproduziert werden. \u2026 Und ich wuerde mal sagen \u2026<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/214_reproduced_position_of_maximum_new_links.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14380 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/214_reproduced_position_of_maximum_new_links.png\" alt=\"\" width=\"558\" height=\"458\" \/><\/a><\/p>\n<p>\u2026 das man das so sehen kann. Ich muss das nicht weiter besprechen, denn ich wuerde nur das weiter oben Geschriebene wiederholen. Heraus sticht nur die eine (!) neue Seite mit dem Maximum auf LL<sub>1<\/sub>; aber auch das wurde oben schon behandelt.<\/p>\n<p>Nun zu den Selbstreferenzen. <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/11\/kevin-bacon-xxx-bei-selbstreferenzen-nichts-neues\/\" target=\"_blank\" rel=\"noopener\">Damals<\/a> wurde ich stutzig, denn der LL<sub>0<\/sub>-Balken war zu hoch. Nur durch diesen einen Balken entdeckte ich dann die <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?s=kevin+bacon+XXXI+archipele\" target=\"_blank\" rel=\"noopener\">Archipele<\/a>! Aber das dauert noch ein bisschen, bevor ich dort angelangt bin.<br \/>\nHier ist die Reproduktion (sagt man das so?) der Verteilung der Maximaspositionen der Selbstreferenzkurven aller Seiten:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/215_reproduced_position_of_maximum_self_references.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14382 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/215_reproduced_position_of_maximum_self_references.png\" alt=\"\" width=\"558\" height=\"457\" \/><\/a><\/p>\n<p>Uff! Der Balkenwald wird dichter. Aber wenn man genau hinschaut, dann sieht man, dass die roten und blauen Balken auch hier wieder im Wesentlichen uebereinstimmen. Mit m\u00f8glicherweise (!) einer kleinen, m\u00f8glicherweise (!) systematischen, Abweichung zwischen LL<sub>8<\/sub> und \u2026 mhm \u2026 schwer zu sagen \u2026 ich sag jetzt mal LL<sub>19<\/sub>. Bis auf einen Balken sind dort naemlich alle blauen Balken kleiner, es gibt also kein &#8222;rauschendes Auf und Ab&#8220; \u2026 das k\u00f8nnte was sein, das lohnt sich also mglw. mal naeher zu untersuchen (ich werde das aber nicht tun) \u2026 ich wuerde aber erstmal nicht unbedingt &#8217;ne Wette drauf abschlieszen, dass da wirklich ein echtes Phaenomen hinter ist. &#8222;Statistik&#8220; macht manchmal komische Sachen (ich <a href=\"https:\/\/en.wikipedia.org\/wiki\/Pentaquark#Mid-2000s\" target=\"_blank\" rel=\"noopener\">erinnere an dieser Stelle<\/a> an die wohlbekannte, 5\u03c3 sichere, &#8222;Entdeckung&#8220; des \u0398<sup>+<\/sup>-Pentaquarks in den Nullerjahren, die sich dann als falsch herausstellte).<br \/>\nAlles in allem gilt auch hier: Reproduktion (wenn man das so sagt) gelungen.<\/p>\n<p>Als Letztes bleibt die Verteilung der Maxima der Linkfrequenzkurven. <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2023\/04\/kevin-bacon-xiil-ein-ende-in-sicht-die-letzte-messgrosze\/\" target=\"_blank\" rel=\"noopener\">Damals<\/a> war es die erste konkrete Bestaetigung, dass da irgendwie mehr am &#8222;S\u00e3o Paulo FC&#8220;-Artefakt sein muss (und es war, aber so weit bin ich auch hier noch laengst nicht). Die Reproduktion (ich sag das jetzt einfach so) \u2026<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/216_reproduced_position_of_maximum_linkfrequency.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14383 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/216_reproduced_position_of_maximum_linkfrequency.png\" alt=\"\" width=\"558\" height=\"457\" \/><\/a><\/p>\n<p>\u2026 ist wieder als\u00a0 erfolgreich anzusehen \u2026 auch wenn dabei der Balkenwald zu dicht wurde um noch was zu erkennen, weswegen ich (wie so oft) auf ein <a href=\"https:\/\/en.wikipedia.org\/wiki\/Scatter_plot\" target=\"_blank\" rel=\"noopener\">Streudiagramm<\/a> fuer das Histogramm zurueckgriff.<\/p>\n<p>Im Wesentlichen hat man das gleiche Resultat wie bei allen anderen Verteilungen: die 2023-Daten reproduzieren die 2020-Daten. Es gibt m\u00f8glicherweise (!) eine kleine, m\u00f8glicherweise (!) systematische, Abweichung kurz nach LL<sub>40<\/sub>. Die 2020-Daten &#8222;beulen&#8220; sich da etwas aus. Aber insgesamt sprechen wir von nur sehr wenigen beteiligten Seiten und ich wuerde hier noch weniger drauf wetten, dass da was ist. Das sollte mal wer untersuchen \u2026 lohnt sich mglw.<\/p>\n<p>Puuuh \u2026 das war jetzt &#8217;n ganz sch\u00f8ner Ritt. Aber ich habe viel geschafft.<br \/>\nNun ist&#8217;s aber so, dass auch in diesem Fall die Auswerteprogramme neu von mir geschrieben und generalisiert wurden. Deswegen faellt jetzt bei der Analyse eine weitere Sache an, die mir bei den damaligen Betrachtungen ueberhaupt nicht in den Sinn kam: wenn ich die Position des Maximums kenne, dann kenne ich auch den WERT des Maximums und da kann man sich die Verteilungen doch auch mal anschauen. DAS, meine lieben Leserinnen und Leser, verschiebe ich aber auf&#8217;s naechste Mal.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Via &#8222;Spaetzuender&#8220; (auch als &#8222;grobe Abweichler&#8220; bezeichnet) bin ich damals auf die Idee gekommen, mir mal anzuschauen auf welchen Linkleveln eigentlich die meisten Seiten das Maximum in der Kurve einer gegebenen Gr\u00f8sze von Interesse haben. Fuer die Anzahl der totalen Links ist das hier reproduziert: Wie erwartet gibt es zwischen den 2020-Daten und den 2023-Daten [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14359"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=14359"}],"version-history":[{"count":8,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14359\/revisions"}],"predecessor-version":[{"id":14512,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14359\/revisions\/14512"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=14359"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=14359"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=14359"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}