{"id":14318,"date":"2025-04-23T13:37:54","date_gmt":"2025-04-23T11:37:54","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=14318"},"modified":"2025-03-03T18:40:22","modified_gmt":"2025-03-03T16:40:22","slug":"kevin-bacon-anhang-a2-reproduzierbarkeit-7-durschnittliche-merkmalsanzahlen","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2025\/04\/kevin-bacon-anhang-a2-reproduzierbarkeit-7-durschnittliche-merkmalsanzahlen\/","title":{"rendered":"Kevin Bacon &#8211; Anhang A2 \u2013 Reproduzierbarkeit 7: Durschnittliche Merkmalsanzahlen"},"content":{"rendered":"<p>Die beim <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=14298\" target=\"_blank\" rel=\"noopener\">letzten Mal<\/a> reproduzierten Untersuchungen fuehrten mich <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/05\/kevin-bacon-xviii-groszvieh-macht-definitiv-mehr-mist-als-kleinvieh-zum-dritten\/\" target=\"_blank\" rel=\"noopener\">damals<\/a> zu einem der wichtigsten Kevin Bacon Resultate ueberhaupt: die durchschnittliche Anzahl der Zitate unterliegt einem maechtigen Gesetz. Oder anders: das ist bei doppellogarithmischen Achsen linear! Krass wa!<\/p>\n<p>Wichtig: bei diesen Untersuchungen wurde davon ausgegangen, dass die Anzahl der Zitate die UNabhaengige Gr\u00f8sze ist. Oder anders an einem Beispiel: alle Links einer Seite mit 5 Zitaten hab ich genommen und auf einen &#8222;Haufen&#8220; geworfen. Auf diesen Haufen kamen NUR die Links von Seiten mit 5 Zitaten (egal wieviele Links das waren). Auf einem anderen Haufen haeufte ich alle Links aller Seiten mit 6 Zitaten an; usw. Fuer den Durchschnitt teilte ich am Ende einfach die Anzahl aller Links in einem gegebenen Haufen mit der Anzahl aller Seiten die zu diesem Haufen beigetragen haben.<br \/>\nIch habe das nochmal so ausfuehrlich beschrieben, damit sichtbar wird, dass ich damals auch hier wieder NICHT die umgedrehte Konstellation betrachtet habe. Oder anders: wird das das Gleiche, wenn man die Anzahl der Zitate einer Seite durchschnittifiziert, wenn man die Anzahl der Links der besagten Seite als unabhaengige Gr\u00f8sze hernimmt?<\/p>\n<p>Tja \u2026 und hier sieht man nun beide Sachen:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/209_average_number_of_links_per_citation_and_vice_versa.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14327 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/209_average_number_of_links_per_citation_and_vice_versa-800x289.png\" alt=\"\" width=\"800\" height=\"289\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/209_average_number_of_links_per_citation_and_vice_versa-800x289.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/209_average_number_of_links_per_citation_and_vice_versa-1024x370.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/209_average_number_of_links_per_citation_and_vice_versa-768x277.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/209_average_number_of_links_per_citation_and_vice_versa.png 1276w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>Tada! Das ist auf den ersten Blick nicht das Gleiche \u2026 aber ich kann euch, meinen lieben Leserinnen und Lesern versichern, dass es sehr wohl das Gleiche ist.<\/p>\n<p>Am wichtigsten ist, dass die Anstiege der linearen Teile der Daten im Groszen und Ganzen uebereinstimmen. Aufgrund unterschiedlicher Skalen sieht man das nur nicht so gut. Aber wenn man das gleich skaliert dann ist&#8217;s im Wesentlichen das gleiche Ergebniss \u2026 ich hab das jetzt zwar nicht konkret ausgerechnet, aber ich hab &#8217;n Lineal an&#8217;n Monitor gehalten und parallel verschoben (bei richtiger Achsenskalierung) und das war im Wesentlichen das gleiche \u2026 OKOK \u2026 es war kein Lineal und Parallelverschiebung, sondern &#8217;n Blatt Papier an den Monitor gehalten, dann hab ich (MIT LINEAL) den einen Anstieg &#8222;durchgepaust&#8220;, das Papier an der Unterkante des Monitors zum naechsten Graphen (parallel)verschoben, dort den Anstieg abgepaust \u2026 und das hatte zwar kleine Abweichungen, aber innerhalb der Genauigkeit aller Untersuchungen (und insb. der &#8222;Pausmethode&#8220;) wuerd ich sagen, dass das alles gleich war.<br \/>\nUnd das SOLLTE auch so sein (was der Grund ist, warum das so wichtig ist), dass die Anstiege gleich sind. Auch wenn das in den beiden Faellen aus anderen Gegebenheiten so ist, denn die Anzahl der Seiten mit einem gegebenen Zitatewert ist unabhaengig von der Anzahl der Seiten mit dem selben LINKwert. Aber im Mittel ueber (sehr) viele Seiten, sollte das das Gleiche sein.<br \/>\nDass dem wirklich so ist fetzt und bestaetigt im Nachhinein, dass mein Ansatz mit dem Mittelwert gar nicht so falsch ist \u2026 das ist wichtig, denn darauf basierten ein paar Schlussfolgerungen und Erklaerungen im weiteren Verlauf des Kevin Bacon Projekts.<\/p>\n<p>Warum das auf den ersten Blick so ungleich aussieht, ist das unterschiedliche Verhalten des Verlaufs der beiden Durchschnitte bei hohen Werten auf der Abszisse. Was natuerlich nicht weiter verwunderlich ist, eben wg. besagter Unabhaengigkeit und weil wir hier in den Bereich kommen, wo oft nur sehr wenige, in vielen Faellen einzelne, Seiten einen ganzen Datenpunkt ausmachen \u2026 da kann man also mittels einer Durchschnittifizierung keine &#8222;versteckte&#8220; Information &#8222;rauskitzeln&#8220;.<\/p>\n<p>Ach ja, es ist eine reine Formalitaet (denn man sieht&#8217;s ja), aber ich sollte erwaehnen, dass die 2023 Daten die 2020 Daten reproduzieren.<\/p>\n<p>Sooo \u2026 das ging sch\u00f8n schnell heute.<\/p>\n<p>Damals hatte ich dann nur noch den <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/05\/kevin-bacon-xix-endlich-am-gipfel-angekommen\/\" target=\"_blank\" rel=\"noopener\">Rest der Verteilung der totalen Links<\/a> angeschaut und da war nix weiter zu holen und ich hatte die gesamten Verteilungen bereits reproduziert. Und dann folgte (wie so oft) eine <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/05\/kevin-bacon-xx-sauberes-groszvieh\/\" target=\"_blank\" rel=\"noopener\">kurze Betrachtung der &#8222;Ausreiszer&#8220;<\/a>, die ich hier auch nicht wiederholen werde. Dito, bzgl. <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/06\/kevin-bacon-xxi-fehlerbetrachtung-i\/\" target=\"_blank\" rel=\"noopener\">der daran<\/a> anschlieszenden <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/06\/kevin-bacon-xxi-fehlerbetrachtung-ii\/\" target=\"_blank\" rel=\"noopener\">Fehlerbetrachtungen<\/a>.<\/p>\n<p>Tjoa \u2026 jetzt muss ich ueberlegen ob ich mir erstmal die Linklevelverteilungen fuer die anderen drei Gr\u00f8szen von Interesse anschaue (und damit dem damaligen &#8222;Spielplan&#8220; vorgreife), oder &#8222;chronologisch&#8220; weitermache.<br \/>\nIch tendiere zu Ersterem, aber das muss ich nicht jetzt entscheiden.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Die beim letzten Mal reproduzierten Untersuchungen fuehrten mich damals zu einem der wichtigsten Kevin Bacon Resultate ueberhaupt: die durchschnittliche Anzahl der Zitate unterliegt einem maechtigen Gesetz. Oder anders: das ist bei doppellogarithmischen Achsen linear! Krass wa! Wichtig: bei diesen Untersuchungen wurde davon ausgegangen, dass die Anzahl der Zitate die UNabhaengige Gr\u00f8sze ist. Oder anders an [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14318"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=14318"}],"version-history":[{"count":4,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14318\/revisions"}],"predecessor-version":[{"id":14328,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14318\/revisions\/14328"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=14318"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=14318"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=14318"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}