{"id":13616,"date":"2024-03-19T13:37:16","date_gmt":"2024-03-19T11:37:16","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13616"},"modified":"2024-01-16T16:42:26","modified_gmt":"2024-01-16T14:42:26","slug":"kevin-bacon-lxi-fast-vergessen-zum-dritten-konkrete-beispiele","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2024\/03\/kevin-bacon-lxi-fast-vergessen-zum-dritten-konkrete-beispiele\/","title":{"rendered":"Kevin Bacon &#8211; LXI &#8211; Fast vergessen zum Dritten (konkrete Beispiele)"},"content":{"rendered":"<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13553\" target=\"_blank\" rel=\"noopener\">In den<\/a> vorherigen <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13581\" target=\"_blank\" rel=\"noopener\">Beitraegen<\/a> habe <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13598\" target=\"_blank\" rel=\"noopener\">ich untersucht<\/a>, wie <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13608\" target=\"_blank\" rel=\"noopener\">schnell<\/a> man (im Durchschnitt) von den spezifischen Seiten einer <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13528\" target=\"_blank\" rel=\"noopener\">Untergruppe<\/a> zu irgendeiner (!) anderen Seite kommt \u2026 u.U.<\/p>\n<p>Eine Sache die von Interesse ist kann ich leider nicht untersuchen: wie schnell kommt man von den spezifischen Seiten einer Untergruppe zu den spezifischen Seiten einer anderen Untergruppe \u2026 u.U. Ich wuerde bspw. vermuten, dass ich am schnellsten von Seiten mit vielen Links zu Seiten mit vielen Zitaten komme.<br \/>\nDie dafuer n\u00f8tige Information faellt bei der <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/01\/kevin-bacon-xv-ein-vektor-mit-5798312-dimensionen\/\" target=\"_blank\" rel=\"noopener\">Netzwerkanalyse<\/a> an. Die konnte aber leider nicht gespeichert werden, denn das wuerde ca. 100 TB erfordern. Ich hatte schon angefangen und das programmiert, denn ich hatte ein paar Ideen, wie man die Information verlustfrei (!) komprimieren k\u00f8nnte \u2026 ich habe mir also meinen eigenen <a href=\"https:\/\/en.wikipedia.org\/wiki\/ZIP_(file_format)\" target=\"_blank\" rel=\"noopener\">&#8222;Zip&#8220;-Algorithmus<\/a> ueberlegt. Ich war maechtig stolz auf die Ideen die ich hatte, aber leider ist die Entropie in den entsprechenden Daten so grosz, dass ich das Datenvolumen auf maximal 1\/3 reduzieren k\u00f8nnte. Ungefaehr 30 TB sind immer noch zu viel. Dies insb. im Lichte dessen, dass erstens die Ergebnisse vermutlich nicht viel mehr Erkentnissgewinn zur Folge gehabt haetten, als das was ich mittels der neuen Links und der Linkfrequenz herausbekommen habe, ich zweitens nicht gewusst haette, was ich sonst noch mit den Daten machen soll, und dass ich drittens dann die gesamte (mehrmonatige) Netzwerkanalyse nochmal haette durchlaufen lassen muessen.<\/p>\n<p>Anstatt dessen schau ich heute mal, wie ein &#8222;Nutzererlebniss&#8220; aussieht, denn das ist ja doch anders als die abstrakten Betrachtungen vorher \u2026 naja \u2026 abstrakt bleibt es vermutlich, denn ich zeige immer noch Diagramme.<\/p>\n<p>Da ich ein Nutzer der Wikipedia (meist mehrfach pro Tag) und ganz normal<sup>[Citation needed]<\/sup> bin, nehme ich meine eigene Erfahrung diesbezueglich als repraesentativ an.<br \/>\nZunaechst ist dann zu sagen, dass ich praktisch gesehen <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2021\/10\/kevin-bacon-ix-citation-not-missing-a-information-operations\/\" target=\"_blank\" rel=\"noopener\">die meistzitierten Seiten<\/a> nie aufrufe. Klar, die laenderspezifischen Seiten sind sicherlich interessant fuer Millionen von Schulkindern pro Jahr, aber danach schauen die auch nie wieder drauf. Sicher, <a href=\"https:\/\/en.wikipedia.org\/wiki\/Japan\" target=\"_blank\" rel=\"noopener\">Japan<\/a> schaute ich mir an im Zuge der Vorbereitung auf meine grosze Reise im Jahre 2023; aber Letztere war auszergew\u00f8hnlich und ich habe die Seite nie in einem anderen Zusammenhang besucht.<br \/>\nDesweiteren schaue ich mir nie die am wenigsten zitierten Seiten an \u2026 auszer im Rahmen dieses Projekts, da habe ich buchstaeblich tausende von denen gesehen. Aber ansonsten wuerde ich nie im Leben drauf kommen mich ueber <a href=\"https:\/\/en.wikipedia.org\/wiki\/Bacon,_Ohio\" target=\"_blank\" rel=\"noopener\">Bacon in Ohio<\/a> zu informieren.<\/p>\n<p>Vielmehr schaue ich als Nutzer nach &#8222;normalen&#8220; Seiten \u2026 hier &#8217;ne Stadt \u2026 dort &#8217;ne Person \u2026 und ab und zu mal ein Dingens (sehr weitgefasst). Beispielhaft dafuer nehme <a href=\"https:\/\/en.wikipedia.org\/wiki\/Kevin_Bacon\" target=\"_blank\" rel=\"noopener\">Kevin Bacon<\/a> (wen auch sonst), das <a href=\"https:\/\/www.youtube.com\/watch?v=LHMmqeVWXTg\" target=\"_blank\" rel=\"noopener\">durch Monty Python<\/a> beruehmt gewordene <a href=\"https:\/\/en.wikipedia.org\/wiki\/Trondheim\" target=\"_blank\" rel=\"noopener\">Trondheim<\/a>, das Erzbistum <a href=\"https:\/\/en.wikipedia.org\/wiki\/Magdeburg\" target=\"_blank\" rel=\"noopener\">Magdeburg<\/a> und den guten alten <a href=\"https:\/\/en.wikipedia.org\/wiki\/Pencil\" target=\"_blank\" rel=\"noopener\">Bleistift<\/a>.<\/p>\n<p>In diesem Diagramm zeige ich mittels der farbigen Baender nochmals die Bereiche der sechs Untergruppen und wie sich die vier Beispiele dazu verhalten:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/162_examples_which_group_.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13633 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/162_examples_which_group_.png\" alt=\"\" width=\"602\" height=\"489\" \/><\/a><\/p>\n<p>Interessant! Ich haette nicht erwartet, dass Trondheim so beliebt ist.<br \/>\nWieauchimmer, man sieht, dass die von mir als &#8222;normal&#8220; empfundenen Seiten das zumindest teilweise mglw. gar nicht sind. Pencil und Kevin Bacon liegen bzgl. der Anzahl der Zitate von andere Seiten in der &#8222;mittelvielen&#8220; Gruppe (die ich unterbewusst als &#8222;normal&#8220; betrachte \u2026 hier sieht man aber einen der Gruende, warum ich fuer den Namen der Gruppen dieses Adjektiv nicht benutzen wollte). Man k\u00f8nnte argumentieren, dass sie nahe genug an der gleichen Gruppe bzgl. der Anzahl der Links liegen, denn prinzipiell k\u00f8nnte man da auch etwas (mehr) Spielraum einraeumen, <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13528\" target=\"_blank\" rel=\"noopener\">wenn man die Grenzen fuer die Gruppen festlegt<\/a>. Diese Argumentation k\u00f8nnte man auch fuer Magdeburg vornehmen (auch bzgl. der Zitate), aber definitiv nicht fuer Trondheim. Letzteres liegt genau zwischen zwei Gruppen bzgl. beider Charakteristika.<\/p>\n<p>Ganz sch\u00f8n viele &#8222;k\u00f8nnte&#8220; in obigen Saetzen. Letztlich ist das aber nicht so wichtig. Fuer mich sind das &#8222;normale&#8220; Seiten und ich wollte nur mal schauen wo die liegen. Von Interesse sind die kumulativen Anteile:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/163_examples_cumulative_new_links_and_link_frequency.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13635 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/163_examples_cumulative_new_links_and_link_frequency.png\" alt=\"\" width=\"560\" height=\"449\" \/><\/a><\/p>\n<p>Bemerkung: mit &#8222;Zitate&#8220; meine ich natuerlich die Linkfrequenz, aber das ist so viel zu schreiben und ich wollte es nicht abkuerzen \u2026 und das Diagramm war schon fertig \u2026 und so schlimm ist das nicht, denn Letztere kommt ja wegen Ersteren zustande.<\/p>\n<p>OI! \u2026 alle vier Beispiele werden ungefaehr ein Linklevel &#8222;schneller&#8220; von anderen Seiten gesehen (kumulativer Anteil Zitate, helle Kurven), als dass sie andere Seiten erreichen (kumulativer Anteil neue Links, nicht-helle Kurven) \u2026 *kurzer Blick auf das erste Diagramm* \u2026 das sollte mich eigtl. nicht verwundern, denn alle Beispiele haben (signifikant) mehr als Links als Zitate.<\/p>\n<p>Wenn wir mal zur <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13553\" target=\"_blank\" rel=\"noopener\">Analyse der Untergruppen<\/a> zurueck schauen, so liegt der &#8222;50-Prozent-Uebergang&#8220; der Beispiele bzgl. der Links an ca. der Stelle der Untergruppen mit den vielen Links \/ Zitaten. Das ist interessant, denn einige der obigen &#8222;das k\u00f8nnte man auch dort und dort einordnen&#8220; tendierten eher zur Untergruppe mit den &#8222;mittelvielen&#8220; Links. Andererseits sprechen wir hier von vier Beispielen im Vergleich zu einer Gruppe mit ueber 2 Millionen Seiten.<br \/>\nBzgl. des kumulativen Anteils der Linkfrequenz liegen die Beispiele zwischen den Untergruppen mit vielen bzw. mittelvielen Zitaten; Kevin Bacon und Pencil liegen naeher an Letzterer waehrend Trondheim und Magdeburg naeher an Ersterer liegen \u2026 was dem Erwartungsbild (nach dem ersten Diagramm) entspricht.<\/p>\n<p>Alles in allem erwartete ich bei den vier Beispielen nix fundamental Unerwartetes und das ist dann auch eingetreten.<\/p>\n<p>SO \u2026 nun aber \u2026 jetzt bin ich wirklich durch und beim naechsten Mal fang ich tatsaechlich (und endlich?) an &#8222;zusammen zu packen&#8220;.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>In den vorherigen Beitraegen habe ich untersucht, wie schnell man (im Durchschnitt) von den spezifischen Seiten einer Untergruppe zu irgendeiner (!) anderen Seite kommt \u2026 u.U. Eine Sache die von Interesse ist kann ich leider nicht untersuchen: wie schnell kommt man von den spezifischen Seiten einer Untergruppe zu den spezifischen Seiten einer anderen Untergruppe \u2026 [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13616"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=13616"}],"version-history":[{"count":6,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13616\/revisions"}],"predecessor-version":[{"id":13638,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13616\/revisions\/13638"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=13616"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=13616"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=13616"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}