{"id":14516,"date":"2025-10-05T13:37:44","date_gmt":"2025-10-05T11:37:44","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=14516"},"modified":"2025-05-23T13:05:14","modified_gmt":"2025-05-23T11:05:14","slug":"kevin-bacon-anhang-a2-reproduzierbarkeit-13-bunte-reaktivierungen","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2025\/10\/kevin-bacon-anhang-a2-reproduzierbarkeit-13-bunte-reaktivierungen\/","title":{"rendered":"Kevin Bacon &#8211; Anhang A2 &#8211; Reproduzierbarkeit 13: bunte Reaktivierungen"},"content":{"rendered":"<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=14493\" target=\"_blank\" rel=\"noopener\">Beim letzten Mal<\/a> verwies ich auf einen <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2023\/03\/kevin-bacon-xxxviii-ill-be-back\/\" target=\"_blank\" rel=\"noopener\">aelteren Beitrag<\/a>, der nicht nur die beim letzten Mal (mehr oder weniger) reproduzierten Reaktivierungen pro Linklevel zeigte, sondern auch zwei tolle bunte Bilder.<\/p>\n<p>Im ersten bunten Bild untersuchte ich wie lange (in &#8222;Linkleveleinheiten&#8220;) es dauert von einer Reaktivierung der Selbstreferenzen bis zum naechsten &#8222;Ausstieg&#8220;. Dabei ist zu beachten, dass<\/p>\n<blockquote><p>[e]ine Kette an Selbstreferenzen [\u2026] mehrfach abbrechen und reaktiviert werden [kann].<\/p><\/blockquote>\n<p>Ich nannte das damals &#8222;Selbstreferenzenketten&#8220; \u2026 und nenne das jetzt lieber &#8222;Reaktivierungslaenge&#8220;.<\/p>\n<p>Aber damit war es noch nicht genug, denn die bunten Bilder sind (wie so oft) (Pseudo) 3D-&#8222;Karten&#8220; \u2026 oder anders: Ich untersuchte eigentlich vielmehr die Haeufigkeit der Reaktivierungslaenge in Abhaengigkeit vom Linklevel \u2026 oder noch anders: ich erstellte fuer jedes Linkevel ein Histogramm der Reaktivierungslaengen. Damit ist hoffentlich (wieder) klar, was hier zu sehen ist:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/232_reproduction_reactivation_length_per_LL.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14522 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/232_reproduction_reactivation_length_per_LL.png\" alt=\"\" width=\"1376\" height=\"861\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/232_reproduction_reactivation_length_per_LL.png 1376w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/232_reproduction_reactivation_length_per_LL-800x501.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/232_reproduction_reactivation_length_per_LL-1024x641.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/232_reproduction_reactivation_length_per_LL-768x481.png 768w\" sizes=\"(max-width: 1376px) 100vw, 1376px\" \/><\/a><\/p>\n<p>Der wichtigste Unterschied zum damaligen bunten Bild (abgesehen davon, dass ich jetzt eine bessere Farbpalette benutze) ist, dass ich <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=14444\" target=\"_blank\" rel=\"noopener\">jetzt richtig<\/a> an <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=14491\" target=\"_blank\" rel=\"noopener\">die Sache<\/a> heran gehe. Deswegen sieht man jetzt auch bei LL<sub>1<\/sub> was (waehrend ich das damals einfach abgeschnitten hatte, denn da war ja nix).<\/p>\n<p>Ansonsten wuerde ich sagen, dass das im Groszen und Ganzen erfolgreich reproduziert ist. Im Detail wuerde ich aber sagen, dass in den 2023 Daten zwei Dinge anders sind. Es scheint weniger lange Reaktivierungslaengen zu geben. Das bezieht sich sowohl auf die Ordinate, als auch auf die Abszisse (deswegen zwei (!) Dinge die anders sind). Wobei &#8222;lang&#8220; relativ ist, ich meine aber, dass es deutlich weniger dunkle Punkte weg von den helleren Bereichen gibt. Also weiter nach rechts, wenn man es bezogen auf die Ordinate betrachtet, und weiter nach oben, bezogen auf die Abszisse.<br \/>\nMein Bauchgefuehl sagt mit, dass das &#8217;n echter Effekt ist; weil wir hier aber sowieso schon mit nur wenigen &#8222;Ereignissen&#8220; in den 2020 Daten anfangen, ist das vermutlich relativ schwer systematisch zu untersuchen. Allerdings k\u00f8nnte man sich das mglw. &#8222;Ereigniss&#8220; fuer &#8222;Ereigniss&#8220; anschauen, denn man hat es ja mit nur sehr wenigen davon zu tun. Ich belasse das an der Stelle so wie&#8217;s ist und das das soll mal wer anders machen.<\/p>\n<p>Das zweite bunte Bild damals zeigte die durchschnittlich hinzukommende Anzahl an Selbstreferenzen pro Reaktivierung. Dazu summierte ich zunaechst in jedem Datenpunkt die Summe aller in einer &#8222;Reaktivierungskette&#8220; hinzukommenden Selbstreferenzen auf. Ja das ist &#8217;ne doppelte Summe, zunaechst fuer jede Seite die Summer der hinzukommenden Selbstreferenzen (pro Reaktivierung) und dann die Summe ueber alle Seiten die zu einem gegebenen Datenpunkt beitragen. Wenn das fuer alle Seiten getan ist, wird Wert in jedem Datenpunkt durch die Anzahl der Seiten geteilt die beigetragen haben und das Resultat wurde nochmals durch die relevante Reaktivierungslaenge dividiert.<\/p>\n<p>Ein Beispiel macht hoffentlich deutlicher was ich meine. Man denke sich, dass Seite A auf LL<sub>5<\/sub> reaktiviert wird mit einer Reaktivierungslaenge von drei Linkleveln. Auf LL<sub>5<\/sub> erhaelt Seite A sieben Selbstreferenzen, auf LL<sub>6<\/sub> zwei und auf LL<sub>7<\/sub> eine. Im Datenpunkt (LL<sub>5<\/sub>, Reaktivierungslaenge 3) speichere ich die Summe (7 + 2 + 1 = 10).<br \/>\nSeite B wird nun auch auf LL<sub>5<\/sub> reaktiviert, aber mit einer Reaktivierungslaenge von nur einem Linklevel und Seite B erhaelt 23 zusaetzliche Selbstreferenzen durch die Reaktivierung. Im Datenpunkt (LL<sub>5<\/sub>, Reaktivierungslaenge 1) speichere ich diesen Werte (23).<br \/>\nAls Letztes dann Seite C, die auch auf LL<sub>5<\/sub> reaktiviert wird, auch mit einer Reaktivierungslaenge von 3 Linkleveln; Seite C traegt also zum selben Datenpunkt bei wie Seite A. Seite C erhaelt auf LL<sub>5<\/sub> dreizehn Selbstreferenzen, auf LL<sub>6<\/sub> sechs und auf LL<sub>7<\/sub> eine. Im Datenpunkt (LL<sub>5<\/sub>, Reaktivierungslaenge 3) befindet sich bereits die Zahl 10 und dazu wird jetzt die Summe der durch Seite C hinzukommenden Selbstreferenzen (13 + 6 + 1 = 20) addiert. Damit befindet sich danach in diesem Datenpunkt der Wert 10 + 20 = 30.<br \/>\nDas war der erste Schritt (der in Echt natuerlich fuer ca. 6 Millionen Seiten gemacht wurde).<\/p>\n<p>Nun zur Division. Im Datenpunkt (LL<sub>5<\/sub>, Reaktivierungslaenge 3) befindet sich der Wert 30 und der wird zunaechst durch zwei geteilt (weil Seite A und Seite B) beigetragen haben. Das ergibt 15. Diese 15 wird abschlieszend durch die Reaktivierungslaenge (also drei) geteilt. Die durchschnittliche Anzahl an hinzukommenden Selbstreferenzen fuer Seiten die auf LL<sub>5<\/sub> mit einer Reaktivierungslaenge von drei reaktiviert werden ist somit fuenf.<br \/>\nZum Wert 23 im Datenpunkt (LL<sub>5<\/sub>, Reaktivierungslaenge 1) hat nur eine Seite beigetragen und weil die Reaktivierungslaenge nur eins ist, ist die Division das Einfachste von der Welt. Oder anders: die durchschnittliche Anzahl an hinzukommenden Selbstreferenzen fuer Seiten die auf LL<sub>5<\/sub> mit einer Reaktivierungslaenge von eins reaktiviert werden ist dreiundzwanzig.<\/p>\n<p>Im dazugeh\u00f8rigen bunten Bild aenderte sich deswegen &#8222;nur&#8220; die Farbe der Punkte und die Bedeutung der Farbskala. Alles andere Dinge (Bedeutung der Abszisse und Ordinate und die Verteilung der Datenpunkte im Bild) blieb gleich.<\/p>\n<p>Ich hatte das damals gemacht, weil ich vermutete, dass bei &#8222;hohen&#8220; Reaktivierungen (bezogen sowohl auf das Linklevel, als auch auf die Reaktivierungslaenge \u2026 und &#8222;hoch&#8220; ist (mit Absicht) relativ &#8222;diffus&#8220; gemeint) die durchschnittliche Anzahl an hinzukommenden Selbstreferenzen (pro Reaktivierungslaenge) eins betraegt. Oder anders (an einem Beispiel): wenn eine Seite auf LL<sub>23<\/sub> reaktiviert wird und bis LL<sub>65<\/sub> die Selbstreferenzenkurve nicht wieder abgebrochen wird (das entspricht einer Reaktivierungslaenge von 42), dann vermutete ich, dass das eine zusammenhaenge &#8222;Kette&#8220; von 42 Einsen war.<\/p>\n<p>Diese Vermutung wurde damals im Wesentlichen bestaetigt und in den 2023 \u2026<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/233_reproduction_average_additional_SR_per_reactivation_length_per_LL.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14525 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/233_reproduction_average_additional_SR_per_reactivation_length_per_LL.png\" alt=\"\" width=\"1414\" height=\"861\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/233_reproduction_average_additional_SR_per_reactivation_length_per_LL.png 1414w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/233_reproduction_average_additional_SR_per_reactivation_length_per_LL-800x487.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/233_reproduction_average_additional_SR_per_reactivation_length_per_LL-1024x624.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/233_reproduction_average_additional_SR_per_reactivation_length_per_LL-768x468.png 768w\" sizes=\"(max-width: 1414px) 100vw, 1414px\" \/><\/a><\/p>\n<p>\u2026 aendert sich an dem Ergebnis nix.<\/p>\n<p>(Fast) alle Unterschiede zum damaligen bunten Bild kommen durch die selben Mechanismen zustande wie bereits oben diskutiert.<\/p>\n<p>Das &#8222;fast&#8220; bezieht sich darauf, dass die Farbskala dieses Mal auch logarithmisch ist (waehrend sie beim letzten Mal linear war). Der Grund liegt in Ausreiszern, also Seiten die viele Selbstreferenzen (und mglw. lange Reaktivierungslaengen) haben, wo aber nur wenige Seiten (mitunter nur eine Einzige) zum Datenpunkt beitragen. Da reduziert die Division den Wert also nicht so stark wie bei den meisten anderen Datenpunkten.<br \/>\nIn den 2023 Daten ist das Extrem die Seite &#8222;<a href=\"https:\/\/en.wikipedia.org\/wiki\/The\" target=\"_blank\" rel=\"noopener\">The<\/a>&#8220; (jup, nix weiter), die auf LL<sub>1<\/sub> mit einer (re)aktiviert wird, mit einer (Re)aktivierungslaenge von 34 Linkleveln und die dann 374,173 Selbstreferenzen ansammelt. Diesen Wert bringt eine Division durch 34 auch nur runter auf ca. 11-tausend \u2026 was natuerlich bei einer linearen Skala alle anderen Punkte in den (dann schwarzen) Hintergrund draengen wuerde.<\/p>\n<p>So \u2026 damit ist das Thema &#8222;Ausgaenge&#8220; abgeschlossen und ich kann beim naechsten Mal endlich mit den <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/06\/kevin-bacon-xxiv-zustandsdichte-a-viele-verteilungen\/\" target=\"_blank\" rel=\"noopener\">ganz vielen Verteilungen<\/a> weitermachen.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Beim letzten Mal verwies ich auf einen aelteren Beitrag, der nicht nur die beim letzten Mal (mehr oder weniger) reproduzierten Reaktivierungen pro Linklevel zeigte, sondern auch zwei tolle bunte Bilder. Im ersten bunten Bild untersuchte ich wie lange (in &#8222;Linkleveleinheiten&#8220;) es dauert von einer Reaktivierung der Selbstreferenzen bis zum naechsten &#8222;Ausstieg&#8220;. Dabei ist zu beachten, [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14516"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=14516"}],"version-history":[{"count":7,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14516\/revisions"}],"predecessor-version":[{"id":14530,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14516\/revisions\/14530"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=14516"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=14516"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=14516"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}