{"id":12895,"date":"2023-06-19T13:37:24","date_gmt":"2023-06-19T11:37:24","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=12895"},"modified":"2023-02-26T20:36:13","modified_gmt":"2023-02-26T18:36:13","slug":"kevin-bacon-xlviii-kollektive-wanderung-a","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2023\/06\/kevin-bacon-xlviii-kollektive-wanderung-a\/","title":{"rendered":"Kevin Bacon &#8211; XLVIII &#8211; kollektive Wanderung (a)"},"content":{"rendered":"<p>Weil das &#8222;gemischten Verhalten&#8220; der Linkfrequenzverteilungen so schwer zu interpretieren war, nahm ich mir <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=12874\" target=\"_blank\" rel=\"noopener\">beim letzten Mal<\/a> vor mal zu schauen, wie sich das &#8222;Kollektiv&#8220; der Wikipediaseiten von\u00a0 niedrigen zu hohen Linkfrequenzen \u201ebewegt\u201c. Die schiere Datenmenge steht sich dabei selbst im Weg und deswegen entschied ich mich diese zu komprimieren und mir fuer jedes Linklevel nur anzuschauen \u2026<\/p>\n<blockquote><p>[\u2026] wieviele Seiten eigentlich in jeder Gr\u00f8szenordnung \u201estecken\u201c [\u2026]<\/p><\/blockquote>\n<p>Ich gab auch eine kurze Erklaerung was ich damit meinte:<\/p>\n<blockquote><p>[\u2026] ich [schaue] mir an, wie viele Seiten eine bis zehn Zitierungen, wie viele Seiten 11 bis 100 Zitierungen, wie viele Seiten 101 bis 1000 Zitierungen usw. usf. [\u2026] erhalten haben.<\/p><\/blockquote>\n<p>Das ist ein neues Konzept und recht viel auf einmal. Deswegen zeige ich erstmal wie das bei den totalen Links und den Selbstreferenzen aussieht, auch wenn man die &#8222;kolletkive Bewegung&#8220; schon aus den einzeilnen Verteilunge ablesen kann.<\/p>\n<p>Zur Erinnerung sind <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/06\/kevin-bacon-xxiv-zustandsdichte-a-viele-verteilungen\/\" target=\"_blank\" rel=\"noopener\">hier<\/a> alle Verteilungen bzgl. der totalen Links pro Linklevel zu sehen und ich zeige nochmal zwei (mehr oder weniger) repraesentative Verteilungen:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/115_total_links_pages_per_magnitude_examples.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12902 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/115_total_links_pages_per_magnitude_examples.png\" alt=\"\" width=\"584\" height=\"462\" \/><\/a><\/p>\n<p>Die grauen gestrichelten Linien illustrieren einen Teil des Konzepts der Datenkomprimierung. Weiterhin ist auch gleich eine weitere Vereinfachung zu sehen; anstatt immer zu sagen &#8222;wie viele Seiten 11 bis 100 Zitierungen haben&#8220; (usw. usf.) sag ich einfach (in diesem Fall) Gruppe 2. Die Gruppennummer ist dabei die Zehnerpotenz der oberen Grenze des Intervalls auf der Abszisse. Der Wert fuer die untere Grenze is i.A. der Wert de oberen Grenze geteilt durch 10. Der Wert an der oberen Grenze ist in der jeweiligen Gruppe enthalten, der an der unteren Grenze nicht. Die einzigen Ausnahmen sind Gruppe 0 und Gruppe 1 wegen der Besonerheiten der nullten Potenz. Zur Ersteren zaehlen NUR die Seiten, die den Nullwert annehmen (der rote Balken, der zu LL<sub>2<\/sub> geh\u00f8rt). Zur Letzteren zaehle ich auch alle Seiten die den Wert eins annehmen.<\/p>\n<p>Bei den zwei Beispielverteilungen wuerde ich also auf LL<sub>2<\/sub> erwarten, dass alle Gruppen einen Wert haben, waehrend auf LL<sub>16<\/sub> nur Gruppe 4 einen Wert hat.<br \/>\nDamit soll genug gesagt sein zum Prinzip und das ist das Ergebnis:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/116_total_links_pages_per_magnitude__.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12906 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/116_total_links_pages_per_magnitude__-800x382.png\" alt=\"\" width=\"800\" height=\"382\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/116_total_links_pages_per_magnitude__-800x382.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/116_total_links_pages_per_magnitude__-1024x489.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/116_total_links_pages_per_magnitude__-768x367.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/116_total_links_pages_per_magnitude__-1536x733.png 1536w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/116_total_links_pages_per_magnitude__.png 1600w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>Weil das bei kleinen Linkleveln so unuebersichtlich ist habe ich nur ein paar repraesentative Gruppen reingepackt. Auszerdem ist das Diagramm ausnahmsweise laenger, damit man bei besagten kleinen Linkleveln nicht die Uebersicht verliert. Gestrichelte Linien verbinden Teile der Kurve einer Gruppe zwischen denen es keine Werte gibt.<\/p>\n<p>Beim letzten Mal schrieb ich diesbzgl.:<\/p>\n<blockquote><p>Wikipediaseiten haben zuerst wenige, dann viel mehr, dann viel viel viel mehr totale Links um dann wieder weniger, viel weniger, viel viel viel weniger und letztlich gar keine Links mehr zu haben.<\/p><\/blockquote>\n<p>Und das ist genau das was man hier sieht \u2026 abgesehen von der letzten Aussage, weil ich Gruppe 0 weggelassen hab. Diese replizierte naemlich wieder nur <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/06\/kevin-bacon-xxiii-aussteiger\/\" target=\"_blank\" rel=\"noopener\">ein altbekanntes Resultat<\/a>, welches durch die ausfuehrliche und mehrfache Besprechung des \u201eS\u00e3o Paulo FC\u201c-Artefakts hinreichend bekannt ist. Aber der Reihe nach (und es mag helfen, wenn man das Gezappel der individuellen Verteilungen, die oben verlinkt sind, nochmal anschaut).<\/p>\n<p>Auf LL<sub>0<\/sub> befinden sich (im Diagram) viele Seiten in den Gruppen 1 bis 3, nur eine Seite in Gruppe 5 und keine Seite in Gruppe 8. Auf LL<sub>1<\/sub> nimmt die Anzahl der Seiten in den drei erstgenannten Gruppen rapide ab, dafuer aber in Gruppe 5 rapide zu. Das ist die &#8222;kollektive Bewegung&#8220; von der ich sprach. Auf LL<sub>2<\/sub> wird dann auch Gruppe 8 (zunaechst etwas z\u00f8gerlich) besetzt und von LL<sub>3<\/sub> bis LL<sub>6<\/sub> halten sich praktisch (fast) alle Seiten dort auf und die Gruppen 1 bis 3 sind komplett leergeraeumt.<br \/>\nAbe LL<sub>7<\/sub> setzt dann die &#8222;Rueckwaertsbewegung&#8220; ein. Diese ist aber nicht so &#8222;chaotisch&#8220; wie die &#8222;Vorwaertsbewegung&#8220; und die Gruppen werden in absteigender Reihenfolge nach und nach gefuellt und dann wieder geleert, wenn die Seiten zur naechsttieferen Gruppe &#8222;weiterwandern&#8220;. Zunaechst natuerlich Gruppe 5, aber dann auch die Gruppen 3 und 2. Gruppe 1 wird nie wieder besetzt, da am Ende alle Seiten direkt von Gruppe 2 zu Gruppe 0 springen.<\/p>\n<p>Das war letztlich easy peasy zu verstehen, insb. wenn man (wie bereits erwaehnt), das (oben verlinkte) Gezappel der linklevlabhaengigen Verteilungen der totalen Links sich nochmal anschaut.<br \/>\nDeswegen geht&#8217;s gleich weiter mit den <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2023\/01\/kevin-bacon-xxxiv-schon-gerade\/\" target=\"_blank\" rel=\"noopener\">Selbstreferenzen<\/a>. Zur Erinnerung zwei Beispielverteilungen:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/117_self_references_pages_per_magnitude_examples.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12907 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/117_self_references_pages_per_magnitude_examples.png\" alt=\"\" width=\"584\" height=\"462\" \/><\/a><\/p>\n<p>Die Gruppen gehen nicht ganz so weit wie bei den totalen Links und nicht gezeigt ist Gruppe 6, weil sich da ueber alle Linklevel gesehen nur zwei Seiten aufhalten (siehe das naechste Diagramm). Von der Andersartigkeit der Verteilungen abgesehen (welche aber bereits ausfuehrlich besprochen wurde) gibt&#8217;s aber letztlich nichts Neues und deswegen geht&#8217;s gleich weiter mit den Seiten pro Gr\u00f8szenordnung:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/118_self_references_pages_per_magnitude.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-12908 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/118_self_references_pages_per_magnitude-800x382.png\" alt=\"\" width=\"800\" height=\"382\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/118_self_references_pages_per_magnitude-800x382.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/118_self_references_pages_per_magnitude-1024x489.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/118_self_references_pages_per_magnitude-768x367.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/118_self_references_pages_per_magnitude-1536x733.png 1536w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/118_self_references_pages_per_magnitude.png 1600w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>Das hier ist so viel uebersichtlicher, dass ich alle Gruppen dringelassen habe. Beim letzten Mal schrieb ich nur kurz:<\/p>\n<blockquote><p>[e]s ist viel wahrscheinlicher, dass eine Seite sehr wenige Selbstreferenzen als viele hat [\u2026]<\/p><\/blockquote>\n<p>\u2026 und das ist was man sieht; Gruppe 1 ist immer h\u00f8her als Gruppe 2 ist immer h\u00f8her als Gruppe 3 usw. usf. Das aendert sich auch dann nicht, wenn Gruppen die Seiten mit mehr (und viel mehr) Selbstreferenzen repraesentieren, bei LL<sub>2<\/sub> oder LL<sub>3<\/sub> ein h\u00f8heres Signal aufweisen als am Anfang. Die Erh\u00f8hung kommt naemlich durch das Vorhandensein von mehr totalen Links zustande und wenn ich davon mehr habe, habe ich (dem maechtigen Gesetz entsrpechend) auch mehr Seiten in Gruppe 1.<br \/>\nWieauchimmer, ab ungefaehr LL<sub>10<\/sub> befinden sich onehin die meisten Seiten in Gruppe 0 und es passiert nicht mehr wirklich was.<\/p>\n<p>Alles in allem sind die Seiten pro Gr\u00f8szenordnung sowohl fuer die totalen Links, als auch fuer die Selbstreferenzen leicht zu verstehen, da diese relativ direkt aus den Verteilungen pro Linklevel folgen. Das ist der Hauptgrund, warum ich zunaechst diese abgehandelt habe, damit man etwas vertrauter wird mit der Datenkomprimierung und was man da dann eigtl. sieht.<br \/>\nDas bedeutet aber auch, dass man fuer diese beiden Gr\u00f8szen da nichts weiter &#8222;rausholen&#8220; kann.<br \/>\nBeim naechsten Mal dann das Gleiche fuer die Linkfrequenzen. Das ist komplizierter und da passiert viel mehr.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Weil das &#8222;gemischten Verhalten&#8220; der Linkfrequenzverteilungen so schwer zu interpretieren war, nahm ich mir beim letzten Mal vor mal zu schauen, wie sich das &#8222;Kollektiv&#8220; der Wikipediaseiten von\u00a0 niedrigen zu hohen Linkfrequenzen \u201ebewegt\u201c. Die schiere Datenmenge steht sich dabei selbst im Weg und deswegen entschied ich mich diese zu komprimieren und mir fuer jedes Linklevel [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/12895"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=12895"}],"version-history":[{"count":9,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/12895\/revisions"}],"predecessor-version":[{"id":12917,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/12895\/revisions\/12917"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=12895"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=12895"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=12895"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}