{"id":13191,"date":"2023-11-13T13:37:18","date_gmt":"2023-11-13T11:37:18","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13191"},"modified":"2023-05-26T23:36:30","modified_gmt":"2023-05-26T21:36:30","slug":"kevin-bacon-lix-kleinteilige-erklaerungen-zum-abschied","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2023\/11\/kevin-bacon-lix-kleinteilige-erklaerungen-zum-abschied\/","title":{"rendered":"Kevin Bacon &#8211; LIX &#8211; Kleinteilige Erklaerungen zum Abschied"},"content":{"rendered":"<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13126\" target=\"_blank\" rel=\"noopener\">Beim letzten Mal<\/a> zeigte ich dasVerhaeltnis der totalen Links zur Linkfrequenz (per Linklevel) und \u2026<\/p>\n<blockquote><p>[e]inzig von Interesse ist, dass das Maxium [\u2026] [dieses Verhaeltnisses] bei LL<sub>4<\/sub> liegt, waehrend die [Verhaeltnisse der totalen Links zu den neuen Links bzw. den Selbstreferenzen] den gr\u00f8szten Wert erst bei LL<sub>5<\/sub> erreichen [\u2026]<\/p><\/blockquote>\n<p>Zur Erklaerung erinnere ich an die <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/04\/kevin-bacon-xviii-groszvieh-macht-definitiv-mehr-mist-als-kleinvieh-zum-ersten\/\" target=\"_blank\" rel=\"noopener\">Entwicklung der totalen Links in Abhaengigkeit vom Linklevel<\/a>. Das Maximum der Verteilung liegt bei LL<sub>4<\/sub>. Der Unterschied zum Wert bei LL<sub>5<\/sub> ist aber eher klein (was wichtig ist).<br \/>\nIn diesem Diagramm \u2026<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/136_all_vs_total_links__.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13189 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/136_all_vs_total_links__.png\" alt=\"\" width=\"687\" height=\"449\" \/><\/a><\/p>\n<p>\u2026 sieht man nun, wie sich die drei anderen Gr\u00f8szen von Interesse in Abhaengigkeit von den totalen Links entwickeln. Ich gebe zu, es ist etwas unuebersichtlich, ich gehe da aber Schritt fuer Schritt durch.<\/p>\n<p>Das Folgende ist zu beachten (davon abgesehen, dass die Linien wieder nur der Visualisierung dienen, zwischen den Punkten gibt es keine Werte):<br \/>\n&#8211; Da die Anzahl der Selbstreferenzen (blau) so klein ist, brauchen die ihre eigene Ordinate (rechts) und die Zahlen der beiden Ordinaten unterscheiden sich um (ueber) 6 Gr\u00f8szenordnungen!<br \/>\n&#8211; Die Zahlen zur Anzahl der totalen Links auf der Abzsisse sind nochmal (mehr als) einen Faktor 10 gr\u00f8szer als die der Linkfrequenz (rot).<br \/>\n&#8211; Die Kurve der neuen Links (schwarz) und der Selbstreferenzen &#8222;geht&#8220; im Uhrzeigersinn, die der Linkfrequenz hingegen im mathematisch positiven Drehsinn.<\/p>\n<p>Im Allgemeinen gilt, dass die Anzahl der totalen Links immer gr\u00f8szer ist als die der anderen drei Gr\u00f8szen und fuer Letztere gilt, dass deren Zahlen &#8222;nach oben&#8220; gehen wenn ich mehr totale Links habe und nach unten wenn derer weniger werden. Fuer alle Gr\u00f8szen gelten aber unterschiedliche Limitierungen und deren &#8222;Dynamik&#8220; von einem Linklevel zum naechsten ist unterschiedlich \u2026 hier wird&#8217;s jetzt kleinteilig<\/p>\n<p>Die Selbstreferenzen sind am einfachsten zu erklaeren. <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2023\/01\/kevin-bacon-xxxv-beschleunigter-abstieg\/\" target=\"_blank\" rel=\"noopener\">Die Chance eine Selbstreferenz zu erhalten<\/a> ist umso gr\u00f8szer je naeher man am &#8222;Ursprung&#8220; (also bei kleinen Linkleveln) ist. Deswegen macht die blaue Kurve als Einzige auch gleich auf LL<sub>1<\/sub> einen solchen &#8222;Satz nach oben&#8220;. Die blaue Kurve steigt im Wesentlichen nur deswegen nach LL<sub>1<\/sub> noch weiter an, weil dann (zunaechst) immer urst krass mehr totale Links zur Verfuegung stehen und davon eben auch welche Selbstreferenzen sind. Aber nach LL<sub>3<\/sub> ist damit Schluss, die Chance eine Selbstreferenz zu erhalten ist zu klein und trotz weiter wachsender totaler Links nimmt der Wert der Selbstreferenzen nach LL<sub>3<\/sub> ab. Weil die totalen Links bis LL<sub>4<\/sub> weiter wachsen, nimmt auch das Verhaeltniss weiter zu.<br \/>\nDass Selbiges aber auch noch zu LL<sub>5<\/sub> waechst, trotz abnehmender totaler Links, liegt daran, weil die Selbstreferenzen schneller weniger werden. Die Anzahl Letzterer reduziert sich in diesem Schritt auf nur ca. 1\/3 (von ca. 29M auf ca. 9M) waehrend die Anzahl der totalen Links nur auf etwas mehr als 4\/5 reduziert wird (von ca. 390T auf ca. 330T).<br \/>\nNach dem Maximum geht die Kurve aber wieder runter, weil sich der eben erwaehnte Umstand umkehrt; die totalen Links nehmen schneller ab als die Anzahl der Selbstreferenzen. Ich gebe zu, das sieht man nur bedingt im Grafen.<br \/>\nSobald das Linknetzwerk sicher im Bereich der Zitierketten ist pegelt sich alles ein und beide Gr\u00f8szen vermindern sich gleich schnell (wenn auch mit unterschiedlichen absoluten Werten), woraus die (mehr oder weniger) gerade Linie bei h\u00f8heren und hohen Linkleveln folgt.<\/p>\n<p>Bei den neuen Links liegt im Wesentlichen die gleiche Situation vor. Bis LL<sub>4<\/sub> nimmt deren Anzahl zu, vor allem weil es einfach immer mehr totale Links gibt und davon sind halt etliche auch neu. Wenn man die Zahlen bis LL<sub>4<\/sub> aufsummiert und durch die Anzahl alle Seiten teilt sieht man, dass jede Ursprungsseite bis dorthin (im Durchschnitt) bereits ueber 4 Millionen neue Links gesehen hat. Von LL<sub>4<\/sub> zu LL<sub>5<\/sub> liegt die gleiche Situation wie bei den Selbstreferenzen vor (aber aus anderen Gruenden). Eine Ursprungsseite sieht zwar immer noch viele totale Links (deren Anzahl nimmt nur geringfuegig ab) aber bis LL<sub>4<\/sub> sind bereits 2\/3 aller m\u00f8glichen Links gesehen worden, es sind also nicht mehr viele ueber die als &#8222;neu&#8220; gelten k\u00f8nnen. Deswegen geht das Verhaeltniss der beiden Gr\u00f8szen weiter nach oben; wie bei den Selbstreferenzen, so nehmen auch die neuen Links auf LL<sub>5<\/sub> schneller ab als die totalen Links.<br \/>\nDann werden diese beiden Gr\u00f8szen bis ca. LL<sub>10<\/sub> &#8222;im Gleichschritt&#8220; weniger woraus das &#8222;Plateau&#8220; folgt (und was man im Grafen wieder nur bedingt sehen kann). Der &#8222;Absacker&#8220; im Verhaeltniss bei ungefaehr LL<sub>10<\/sub> liegt darin, weil dort das Ensemble aller Wikipediaseiten (relativ schnell) zu groszen Teilen <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13102\" target=\"_blank\" rel=\"noopener\">in die Zitierketten uebergegangen ist<\/a>. Und da gibt es dann nur noch ein paar weniger neue Links und deren Anzahl im Verhaeltniss zu den totalen Links ist immer gleich, weil im Durchschnitt alle Seiten gleich viele totale Links (ca. 10 bis 30) haben und in einer Zitierkette im Durchschnitt immer nur ein neuer Link zu sehen ist.<\/p>\n<p>Auf zur Linkfrequenz und dafuer muss man sich (wieder mal) erinnern, wie diese zustande kommt \u2026 das kann man <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/04\/kevin-bacon-xvii-groszen-von-interesse-b\/\" target=\"_blank\" rel=\"noopener\">hier nachlesen<\/a> und ich baue darauf auf \u2026 in kurz ist die Linkfrequenz die &#8222;gedeckelte&#8220; Anzahl der totalen Links \u2026 aber der Reihe nach.<br \/>\nAuf LL<sub>4<\/sub> gibt es in der Summe fast 400 Billiarden totale Links. Bei ca. 6 Millionen Ursprungsseiten bedeutet dies, dass jede Ursprungsseite auf LL<sub>4<\/sub> die Links zu ca. 65 Millionen Wikipediaseiten sieht. Von Ausnahmen (die bei diesen Zahlen aber nicht so schwerwiegend sind, dass sie die hier getaetigten Aussagen ungueltig machen wuerden) abgesehen, bedeutet das im Wesentlichen, dass jede Ursprungsseite auf LL<sub>4<\/sub> jede (!) andere Seite 10 Mal sieht. Fuer die Linkfrequenz wird die dann nur ein mal gezaehlt (deswegen gedeckelt). Der wirkliche Wert der (Summe der) Linkfrequenz (aller Seiten, per Linklevel) auf LL<sub>4<\/sub> liegt bei ca. 24 Billiarden was nahe genug dran ist an der eben durchgefuehrten Ueberschlagsrechnung (nicht mal ein Faktor 2 Unterschied \u2026 gut wa!).<br \/>\nOder anders: wenn hinreichend viele totale Links vorhanden sind, ist der Linkfrequenzzaehler fuer alle Seiten maximal, weil sie eben von jeder Ursprungsseite aus kommend &#8222;gesehen&#8220; werden.<\/p>\n<p>Das ist der wesentliche Unterschied zu den Selbstreferenzen und den neuen Links. Wie oben gesagt ist die Anzahl der Ersteren von den totalen Links abhaengig, besagte Anzahl wird aber dadurch (massiv) eingeschraenkt, weil die Wahrscheinlichkeit fuer eine Selbstreferenz mit zunehmendem Linklevel rapide (!) abnimmt. Der erste Teil dieser Aussage gilt auch fuer neue Links, deren Anzahl wird aber deswegen eingeschraenkt, weil jeder ein Mal gesehene Link beim zweiten Mal nicht mehr neu ist und deswegen nicht mehr gezaehlt wird.<\/p>\n<p>Fuer die Linkfrequenz gilt keine dieser Einschraenkungen. Und deshalb bleibt deren Zaehler auf LL<sub>5<\/sub> grosz, bei gleichzeitiger (hinreichend kleiner) Abhnahme der Anzahl der totalen Links, was zu einem kleineren Verhaeltnis dieser beiden Gr\u00f8szen fuehrt, anstatt zu einem weiter ansteigenden.<br \/>\nDanach geht&#8217;s dann ganz fix in die &#8222;Zitierkettenphase&#8220; mit dem Umstand, dass in den Zitierketten im Wesentlichen die totalen Links (fast) der Linkfrequenz entsprechen.<\/p>\n<p>Zum Abschluss dazu sei gesagt, dass das alles bekannt ist. Hier kommen aber einige der vorhergehenden Erkentnisse zusammen und alle werden gebraucht um so eine kleine Diskrepanz eines um ein Linklevel verschobenen Maximums zu verstehen.<\/p>\n<p>Schade, dass es so ein antiklimaktischer Ausstieg aus der Analyse der Daten zum Wikipedialinknetzwerk ist. Aber so ist das nun mal in der Wissenschaft. Das Allermeiste ist kleinteilig, muss genau betrachtet werden und ist fuer Auszenstehende oft eher langweilig \u2026 siehe auch <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2018\/02\/i-love-science\/\" target=\"_blank\" rel=\"noopener\">hier<\/a> und <a href=\"https:\/\/explosm.net\/comics\/kris-same\" target=\"_blank\" rel=\"noopener\">hier.<\/a> Und so war es ja eigentlich schon auf der ganzen &#8222;Reise&#8220; \u2026 viel &#8222;Routine&#8220;, gesprinkelt mit ein paar coolen Entdeckungen.<\/p>\n<p>Das ist aber noch nicht ganz das Ende von Kevin Bacon. Ich m\u00f8chte noch eine Sache ansprechen und eine Zusammenfassung schreiben \u2026 und vielleicht auch noch ein bisschen Meta diskutieren, aber da bin ich mir gerade noch nicht so sicher.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Beim letzten Mal zeigte ich dasVerhaeltnis der totalen Links zur Linkfrequenz (per Linklevel) und \u2026 [e]inzig von Interesse ist, dass das Maxium [\u2026] [dieses Verhaeltnisses] bei LL4 liegt, waehrend die [Verhaeltnisse der totalen Links zu den neuen Links bzw. den Selbstreferenzen] den gr\u00f8szten Wert erst bei LL5 erreichen [\u2026] Zur Erklaerung erinnere ich an die [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13191"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=13191"}],"version-history":[{"count":4,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13191\/revisions"}],"predecessor-version":[{"id":13200,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13191\/revisions\/13200"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=13191"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=13191"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=13191"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}