{"id":11720,"date":"2022-05-23T13:37:51","date_gmt":"2022-05-23T11:37:51","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=11720"},"modified":"2022-02-10T12:02:08","modified_gmt":"2022-02-10T10:02:08","slug":"kevin-bacon-xix-endlich-am-gipfel-angekommen","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/05\/kevin-bacon-xix-endlich-am-gipfel-angekommen\/","title":{"rendered":"Kevin Bacon \u2013 XIX \u2013 Endlich am Gipfel angekommen"},"content":{"rendered":"<p>Hiermit m\u00f8chte ich die Diskussion bzgl. des Maximums der Gesamtverteilung der totalen Links per Linklevel abschlieszen. Dafuer zeige ich nochmal besagte Verteilung:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/54_total_links_again.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-11728 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/54_total_links_again-800x309.png\" alt=\"\" width=\"800\" height=\"309\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/54_total_links_again-800x309.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/54_total_links_again-1024x396.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/54_total_links_again-768x297.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/54_total_links_again.png 1183w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>In den vorhergehenden Artikeln hatte ich dargelegt, warum das viel staerker zum Maximum hin ansteigt als man zunaechst vermuten wuerde. Dabei habe ich mich auf den Anstieg von LL<sub>1<\/sub> zu LL<sub>2<\/sub> konzentriert.<br \/>\nMan beachte, dass das im Diagramm etwas anders zu lesen ist. Dort ist die Anzahl der totalen Links pro Linklevel angezeigt. Die Links sind die &#8222;Ausgaenge&#8220; (oder &#8222;Treppen&#8220;, wenn man im Bilde des Anstiegs bleiben will) zum naechsth\u00f8heren Level. Deswegen ist mit &#8222;Anstieg von LL<sub>1<\/sub> zu LL<sub>2<\/sub>&#8220; die H\u00f8he des Balkens bei Linklevel 1 gemeint.<\/p>\n<p>Wieauchimmer, der viel staerker als erwartete Anstieg kommt durch vielzitierte Seiten zustande. Nun ist es aber so, dass eine spezifische Startseite (deren Linknetzwerk individuell untersucht wird) auf LL<sub>1<\/sub> mitnichten alle vielzitierten Seiten gesehen hat. Mglw. hat diese spezifische Startseite auf LL<sub>1<\/sub> ueberhaupt keine vielzitierte Seite gesehen. Das bedeutet dann aber, dass in der Gesamtheit aller Wikipediaseiten auf LL<sub>2<\/sub> wieder (oder vielmehr immer noch) vielzitierte Seiten auftreten k\u00f8nnen. Das ist dann der Grund, warum auch der Anstieg von LL<sub>2<\/sub> zu LL<sub>3<\/sub> signifikant gr\u00f8szer ist, als ein einfaches durchschnittliche-Anzahl-Links-pro-Seite-Bild vermuten laeszt.<br \/>\nDito von LL<sub>3<\/sub> zu LL<sub>4<\/sub>, aber der Effekt wird von Linklevel zu Linklevel geringer. Der Grund ist, dass ich einmal besuchte Seiten zwar in die Anzahl der totalen Links mit einbeziehe, diesen aber nicht wieder folge.<\/p>\n<p>Zur Veranschaulichung denke man sich wieder die individuelle Seite und weiterhin nehmen wir der Einfachheit halber kurz an, dass es nur drei vielzitierte Seiten (mit jeweils 1000 Links) gibt. Diese individuelle Seite sieht nun auf LL<sub>0<\/sub> eine dieser drei vielzitierte Seiten. Diese traegt dann auf LL<sub>1<\/sub> 1000 Links bei. Nun sieht diese individuelle Seite auf LL<sub>1<\/sub> genau die selbe vielzitierte Seite nochmal. Dann zaehlt die zwar noch einmal zu den totalen Links auf LL<sub>1<\/sub> aber da ich nicht nochmal auf diese Seite gehe, ist der Beitrag auf LL<sub>2<\/sub> Null. Auf LL<sub>1<\/sub> sieht die individuelle Seite nun aber die zweite und auf LL<sub>2<\/sub> die dritte vielzitierte Seite. Jedes Mal beginnt das Spiel von vorn und auf LL<sub>3<\/sub> ist besagtes Spiel dann vorbei.<br \/>\nDer Grund fuer Letzters ist natuerlich, dass selbst wenn ich alle drei vielzitierten Seiten sehe, so tragen diese NICHT mehr zur Anzahl der totalen Links auf LL<sub>4<\/sub> bei, denn diesen drei vielzitierten Seiten folge ich ja nicht mehr.<br \/>\nIch hacke auf diesem Aspekt so rum, weil das ein ganz wichtiges, wenn auch eher &#8222;technisches&#8220; Detail ist. Das ist auch der Grund, warum ich die Anzahl neuer Links pro Linklevel &#8222;gemessen&#8220; habe.<\/p>\n<p>Wieauchimmer, im realen Netzwerk muss man natuerlich eher mit der Wahrscheinlichkeit, eine vielzitierte Seiten (von tausenden) pro Linklevel zu sehen, argumentieren.<br \/>\nAuf LL<sub>0<\/sub> hat eine individuelle Seite eine Chance von ca. 20 % eine Seite <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=11713\" target=\"_blank\" rel=\"noopener\">mit mehr 3433 Zitierungen<\/a> zu sehen. Dies obwohl die Anzahl der Links der meisten Seiten eher klein ist (15 Links war der Median). Auf LL<sub>1<\/sub> ist die Chance eine vielzitierte Seite zu sehen gr\u00f8szer als 20 %. Einfach weil ich auf LL<sub>1<\/sub> die Links aller beim Aufstieg von LL<sub>0<\/sub> zu LL<sub>1<\/sub> ge\u00f8ffneten Seiten zusammenzaehle. Aber weil ja nun schon so einige von den meistzitierten Seiten angeschaut wurden (insb. die am allermeisten zitierten Seiten), tragen diese (wie oben bereits erwaehnt) nicht mehr zu den Links beim naechsten Level bei. Dieser Wegfall des Beitrags vielzitierter Seiten (weil ich die schonmal gesehen habe) ist der Grund, dass der Anstieg etwas geringer ausfaellt, trotzdem es auf LL<sub>1<\/sub> eine h\u00f8here Wahrscheinlichkeit gibt eine vielzitierte Seite zu sehen.<br \/>\nDito bis zum Linklevel 3.<\/p>\n<p>Auf Linklevel 4 habe ich dann im Wesentlichen alle vielzitierten Seiten gesehen und die Anzahl der totalen Links zu LL<sub>5<\/sub> ist gleich der durchschnittlichen Anzahl Links pro Seite. Danach nimmt die Anzahl der totalen Links pro Linklevel ab, einfach weil ich immer mehr Seiten schon gesehen habe.<\/p>\n<p>Ich gebe zu, dass das mglw. ein bisschen langweilig ist oder zumindest ist das staendige Huepfen zwischen dem Bild der individuellen Seite und der Gesamtheit aller Seiten vllt. etwas schwer nachzuvollziehen. Aber das sagt eben so viel aus ueber die Vernetzung des Weltwissens. Deswegen ist es immer so wichtig auch fuer Details oder scheinbar offensichtliche Sachen eine Erklaerung zu haben, denn manchmal ist das gar nicht so offensichtlich. In kurz kann man das auch als &#8222;nach 3 Links komme ich von Trondheim zu Kevin Bacon&#8220; ausdruecken. Man kann dann noch &#8222;und der Grund sind vielzitierte Seiten&#8220; anfuegen. Aber der eigentliche (mglw. langweilige) Mechanismus ist das was oben steht. Zum Glueck finde ich sowas cool und voll interessant herauszufinden :) .<\/p>\n<p>Damit habe ich das Maximum dieser Gesamtverteilung genug diskutiert. Aber ich bin mitnichten fertig mit der Verteilung der totalen Links.<br \/>\nEin wichtiger Grund warum ich das so detailliert besprochen habe mit vielen Wiederholungen ist, dass uns die generelle Form dieser Verteilung auch bei anderen Messgr\u00f8szen begegnen wird. Dort sind dann im Wesentlichen die gleichen Mechanismen am Wirken und ich deswegen wollte ich das gleich zu Anfang geklaert haben.<\/p>\n<p>Ich bin aber noch nicht ganz fertig mit den totalen Links pro Linklevel. Ich habe noch ein Interesse an ein paar individuellen Verteilungen dieser Gr\u00f8sze, die als eine Art Anomalie gelten k\u00f8nnen \u2026 naja, es faellt wohl eher unter &#8222;statistische Fluktuationen im Verhalten individueller Seiten&#8220; aber interessant ist&#8217;s trotzdem und es sagt wieder was ueber die Vernetzung des Weltwissens aus :) .<br \/>\nInteressant ist auch der lange Schwanz der Verteilung und insbesondere, dass dieser so flach verlaeuft bei Linkleveln ueber ca. 50. Das ist ein weiteres kleines Detail, welches bei genauerer Betrachtung etwas merkwuerdig scheint. Auch dies muss ich an anderer Stelle diskutieren, u.a weil ich da dann die naechste Verteilung &#8212; Anzahl _neuer_ Links pro Linklevel &#8212; einfuehren muss.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Hiermit m\u00f8chte ich die Diskussion bzgl. des Maximums der Gesamtverteilung der totalen Links per Linklevel abschlieszen. Dafuer zeige ich nochmal besagte Verteilung: In den vorhergehenden Artikeln hatte ich dargelegt, warum das viel staerker zum Maximum hin ansteigt als man zunaechst vermuten wuerde. Dabei habe ich mich auf den Anstieg von LL1 zu LL2 konzentriert. Man [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/11720"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=11720"}],"version-history":[{"count":7,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/11720\/revisions"}],"predecessor-version":[{"id":11735,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/11720\/revisions\/11735"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=11720"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=11720"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=11720"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}