{"id":14298,"date":"2025-04-11T13:37:40","date_gmt":"2025-04-11T11:37:40","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=14298"},"modified":"2025-02-26T15:20:48","modified_gmt":"2025-02-26T13:20:48","slug":"kevin-bacon-anhang-a2-reproduzierbarkeit-6-beitrag-zur-anzahl-links-auf-ll1","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2025\/04\/kevin-bacon-anhang-a2-reproduzierbarkeit-6-beitrag-zur-anzahl-links-auf-ll1\/","title":{"rendered":"Kevin Bacon &#8211; Anhang A2 \u2013 Reproduzierbarkeit 6: Beitrag zur Anzahl Links auf LL<sub>1<\/sub>"},"content":{"rendered":"<p>Die Sachen die ich beim <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=14280\" target=\"_blank\" rel=\"noopener\">letzten Mal<\/a> reproduzierte (und leicht erweiterte) <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/04\/kevin-bacon-xviii-groszvieh-macht-definitiv-mehr-mist-als-kleinvieh-zum-ersten\/\" target=\"_blank\" rel=\"noopener\">machten mich damals stutzig<\/a>, denn die Kurven hatten fuer meinen Geschmack einen viel zu starken Anstieg. <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/05\/kevin-bacon-xviii-groszvieh-macht-definitiv-mehr-mist-als-kleinvieh-zum-zweiten\/\" target=\"_blank\" rel=\"noopener\">Deswegen untersuchte ich (damals)<\/a> wie stark Seiten mit unterschiedlichen Anzahlen an Zitaten und Links auf Linklevel 0 zur Anzahl der totalen Links auf Linklevel 1 beitragen.<br \/>\nDas wollte ich jetzt natuerlich nochmal machen und die entsprechenden Programme hatte ich schon vor Monaten geschrieben. Leider habe ich diesmal nicht richtig hingeschaut und das als &#8222;Beitrag zur Anzahl der total Links auf LL<sub>0<\/sub>&#8220; (man beachte den Linklevelindex!) gelesen (anstatt &#8222;auf LL<sub>1<\/sub>&#8222;). Dadurch hab ich dann Zeit verschwendet, weil besagte Programme vermeintlich falsche Zahlen lieferten. Der Fehler klaerte sich nach ca. 2 Stunden auf.<\/p>\n<p>Aber der Reihe nach und als Erstes nochmal kurz worum es heute geht. Wenn ich an &#8217;ne Sache rangehe, mache ich oft erstmal &#8217;ne <a href=\"https:\/\/en.wikipedia.org\/wiki\/Fermi_problem\" target=\"_blank\" rel=\"noopener\">Fermi Abschaetzung<\/a>. Etwas genauer: ich schau mir Mittelwerte an und ueberlege mir wie diese Sache aussehen sollte, wenn man nur mit den Mittelwerten rechnet. Damals kam aber ganz schnell heraus, dass die durchschnittliche Anzahl der Links und Zitate, gemittelt ueber ALLE Seiten, einen VIEL kleineren Anstieg der totalen Links verursachen sollte. Ich hatte dann relativ schnell die Idee, dass mglw. Seiten die extrem oft zitiert werden einen ueberproportionalen Anteil an dem Anstieg haben k\u00f8nnten, der mitnichten mittels einer Mittelwertsueberschlagsrechnung erfasst werden kann.<br \/>\nOder anders (mit Zahlen): eine Seite die auf LL<sub>0<\/sub> fuenf mal zitiert wird und die fuenftausend Links hat, traegt auf LL<sub>1<\/sub> 25-tausend (totale) Links bei. Der Beitrag einer Seite mit nur einem Link, die aber 250-tausend Mal zitiert wird, ist hingegen zehn Mal so hoch.<\/p>\n<p>Das soll reichen zu dem was man hier (wieder) sieht; mehr Details gibt es in den entsprechenden Artikeln von damals.<br \/>\nAch ja, wenn ich schon dabei bin sollte ich auch auf einen Fehler hinweisen. Bei der Kurve bzgl. des kumulativen Beitrags habe ich damals die Werte fuer NULL mal zitierte Seiten mit dazugezaehlt. Die tragen aber NICHT bei, weil die ja nicht zitiert werden. Das fuehrt aber NICHT zu einer Aenderung des Anstiegs der Kurve, sondern nur zu einer konstanten Verschiebung von weniger als 1 Million \u2026 da die Ordinate bis fast 40 Milliarden geht, sieht man das gar nicht und HIER ist das jetzt alles richtig!<\/p>\n<p>Aber nun die Diagramme. Zunaechst das zur Reproduzierbarkeit \u2026<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/205_cumulative_contributions_to_links_on_LL1_over_citations.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14314 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/205_cumulative_contributions_to_links_on_LL1_over_citations-800x456.png\" alt=\"\" width=\"800\" height=\"456\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/205_cumulative_contributions_to_links_on_LL1_over_citations-800x456.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/205_cumulative_contributions_to_links_on_LL1_over_citations-768x438.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/205_cumulative_contributions_to_links_on_LL1_over_citations.png 803w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>\u2026 bei der (wie damals) als Unterscheidungsmerkmal der betrachteten Seiten die Anzahl der Zitierungen herangenommen wurde. Die schwarzen Punkte (linke Ordinate) repraesentieren die Summe aller Produkte von Anzahl Links und Anzahl Zitierungen aller Seiten mit einer gegebenen Anzahl Zitate auf LL<sub>0<\/sub>. Die Punkte der 2023 Daten sind im Wesentlichen die Gleiche wie die fuer die 2020 Daten.<br \/>\nIn den 2023 Daten gibt es aber mehr Seiten mit unterschiedlichen Anzahlen an Zitierungen. Wegen der logarithmischen Komprimierung sieht man die entsprechendne Punkte nicht. Die sind aber ein Grund, warum die kumulative Anzahl Links auf LL<sub>1<\/sub> (blaue Punkte, rechte Ordinate) der 2023 Daten schneller waechst als die der 2020 Daten. Desweiteren liegen die schwarzen Punkte ein bisschen ueber den grauen Punkten. Man muss genau hinschauen und sieht es vermutlich am besten am Anfang um 10 Zitate rum \u2026 der Unterschied ist gering, aber echt. Oder anders: es gibt in den 2023 Daten nicht nur mehr Seiten mit anderen \/ unterschiedlichen Zitaten als in den 2020 Daten, sondern auch mehr Seiten die bspw. 5 Zitate haben. Und das &#8222;haut dann rein&#8220; bei den kumulativen Kurven \u2026 denn das liegt ja schon in der Definition der kumulativen (!) Kurven.<br \/>\nAber alles &#8222;geht mit <del>rechten<\/del> linken Dingen zu&#8220;, denn die Form der Anstiege (im Wesentlichen linear) aendert sich nicht.<\/p>\n<p>Damals nicht betrachtet hatte ich, wie das Ganze aussieht, wenn man die Anzahl der Links herannimmt als Unterscheidungsmerkmal der betrachteten Seiten. Aber das ist ja das Sch\u00f8ne, wenn man die entsprechenden Programme nochmal neu schreibt und dabei allgemeiner fasst; es &#8222;fallen mehr Sachen raus&#8220;. Auf den ersten Blick das sieht das \u2026<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/206_cumulative_contributions_to_links_on_LL1_over_links.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14315 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/206_cumulative_contributions_to_links_on_LL1_over_links.png\" alt=\"\" width=\"798\" height=\"452\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/206_cumulative_contributions_to_links_on_LL1_over_links.png 798w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/206_cumulative_contributions_to_links_on_LL1_over_links-768x435.png 768w\" sizes=\"(max-width: 798px) 100vw, 798px\" \/><\/a><\/p>\n<p>\u2026 erstmal sehr aehnlich zum obersten Diagramm aus, sowohl qualitativ als auch quantitativ. Letzteres natuerlich nur bzgl. der Ordinate. Insb. verhalten sich die 2023 Daten nicht anders als die 2020 Daten (innerhalb der zu erwartenden Grenzen).<br \/>\nAuf den zweiten Blick sieht die Verteilung der schwarzen Punkte dann aber doch anders genug aus, sodass ich da mal &#8222;reingezoomt&#8220; habe:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/207_just_contributions_to_links_on_LL1.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14316 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/207_just_contributions_to_links_on_LL1-800x284.png\" alt=\"\" width=\"800\" height=\"284\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/207_just_contributions_to_links_on_LL1-800x284.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/207_just_contributions_to_links_on_LL1-1024x364.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/207_just_contributions_to_links_on_LL1-768x273.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/207_just_contributions_to_links_on_LL1.png 1290w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>Tatsaechlich! bei vielen Zitaten &#8222;gehen die Punkte hoch&#8220;, waehrend sie &#8222;runter&#8220; gehen bei vielen Links \u2026 da kann wer anders mglw. was mit machen, ich lasse das hier nur noch ohne weitere Kommentare stehen.<\/p>\n<p>An der Stelle liesz ich damals die durchschnittliche Anzahl Links (bei gegebener Anzahl an Zitaten) <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/05\/kevin-bacon-xviii-groszvieh-macht-definitiv-mehr-mist-als-kleinvieh-zum-dritten\/\" target=\"_blank\" rel=\"noopener\">folgen<\/a>. Das verschiebe ich auf den naechsten Beitrag, weil dies eines der wichtigsten Ergebnisse ueberhaupt war, welches oft zur Erklaerung anderer Phaenomene herangezogen wurde.<\/p>\n<p>Ich kam dann damals nochmals auf die <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/05\/kevin-bacon-xviii-groszvieh-macht-definitiv-mehr-mist-als-kleinvieh-zum-vierten\/\" target=\"_blank\" rel=\"noopener\">Beitraege der einzelnen Seiten (gruppiert nach der Anzahl der Zitate)<\/a> zurueck und schaute mir das in einem zweidimensionalen Grafen an, in dem Information ueber eine dritte Dimension (besagte Gruppierung) in den einzelnen Punkten &#8222;versteckt&#8220; war.<br \/>\nDas war wichtig, denn diese Kurve zeigte ungeheuer beeindruckend wie stark _ganz_ wenige Seiten mit vielen Zitaten die Dynamik der total Links insb. am Anfang beeinflussen \u2026 womit der Grund der oben erwaehnten Stutzigkeit gefunden war.<br \/>\nHier sind die entsprechenden Kurven:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/208_cumulative_links_over_cumulative_pages.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14317 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/208_cumulative_links_over_cumulative_pages.png\" alt=\"\" width=\"639\" height=\"453\" \/><\/a><\/p>\n<p>Bzgl. dessen wie dieses Diagramm zu lesen ist verweise ich auf den damaligen, verlinkten, Beitrag. Nur drei Sachen seien gesagt.<br \/>\nZum Einen schaue ich mir nicht nur die Gruppierung nach Anzahl der Zitate (rote Punkte) an, sondern auch nach Anzahl der Links (schwarze Punkte).<br \/>\nZum Zweiten unterscheiden sich die 2023 Daten nur insofern, dass sie sich weiter nach rechts &#8222;ausdehnen&#8220;. Das liegt natuerlich wieder daran, weil es in den 2023 Daten mehr Seiten gibt.<br \/>\nZum Dritten scheint die Dynamik der Kurven in denen die Seiten nach der Anzahl der Links gruppiert sind, etwas &#8222;ruhiger&#8220; zu sein als die der Kurven in denen die Seiten nach Anzahl der Zitate gruppiert sind. Oder anders: die roten Kurven verlaufen ab ungefaehr 5 Millionen auf der Abzsisse etwas &#8222;flacher&#8220; (nicht viel) als die schwarzen Kurven um dann zum Ende einen &#8222;Extraschub&#8220; hinzulegen und staerker zu &#8222;beschleunigen&#8220;. Am Endergebnis aendert das nix, k\u00f8nnte aber mglw. durchaus von Interesse sein sich mal naeher anzuschauen \u2026 fuer andere \u2026 nicht (mehr) fuer mich.<\/p>\n<p>Das soll genug sein fuer heute. Wie bereits erwaehnt: beim naechsten Mal dann die durchschnittlichen Links \/ Zitate bei gegebener Anzahl Zitate \/ Links.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Die Sachen die ich beim letzten Mal reproduzierte (und leicht erweiterte) machten mich damals stutzig, denn die Kurven hatten fuer meinen Geschmack einen viel zu starken Anstieg. Deswegen untersuchte ich (damals) wie stark Seiten mit unterschiedlichen Anzahlen an Zitaten und Links auf Linklevel 0 zur Anzahl der totalen Links auf Linklevel 1 beitragen. Das wollte [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14298"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=14298"}],"version-history":[{"count":11,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14298\/revisions"}],"predecessor-version":[{"id":14323,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14298\/revisions\/14323"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=14298"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=14298"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=14298"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}