{"id":13636,"date":"2024-03-23T13:37:37","date_gmt":"2024-03-23T11:37:37","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13636"},"modified":"2024-02-19T16:38:07","modified_gmt":"2024-02-19T14:38:07","slug":"kevin-bacon-lxii-zusammenpacken-romisch-i","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2024\/03\/kevin-bacon-lxii-zusammenpacken-romisch-i\/","title":{"rendered":"Kevin Bacon &#8211; LXII &#8211; Zusammenpacken \u2026 r\u00f8misch I"},"content":{"rendered":"<p>Mit dem <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13616\" target=\"_blank\" rel=\"noopener\">vorigen Beitrag<\/a> m\u00f8chte ich die &#8222;formalen&#8220; Betrachtungen in der <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?s=kevin+bacon\" target=\"_blank\" rel=\"noopener\">Kevin Bacon Maxiserie<\/a> nach (heute auf den Tag genau) zwei Jahren und elf Monaten abschlieszen. Aber keine Sorge, die drei Jahre kriege ich sicherlich noch voll, denn zwei zu Kevin Bacon geh\u00f8rende Sachen habe ich noch. Die kommen aber in den &#8222;Anhang&#8220;, denn bzgl. des Wikipedialinknetzwerkes werde ich nix Neues anfangen.<\/p>\n<p>Zum Einen bin ich vor kurzem auf eine Datenquelle gestoszen, in der fuer jede Seite die tatsaechlichen &#8222;so-oft-wurde-ich-angeschaut&#8220;-Zahlen zu finden sind. Damit kann ich schauen ob meine Vermutung, dass die Anzahl der (internen) Zitate die eine Seite erhaelt (wie oft diese also auf andenen Seiten verlinkt ist), mit der &#8222;Beliebtheit&#8220; (oder auch &#8222;Wichtigkeit&#8220;) korreliert, stimmt.<\/p>\n<p>Zum Anderen muss ich schauen, ob die Resultate i.A. reproduzierbar sind. Dafuer habe ich mir zum Einen die Wikipedia nochmal beschafft (das war schon im Dezember, also ziemlich genau drei Jahre spaeter). Auszerdem gehe ich gerade durch die vielen (Analyse)Programme welche ich im Zuge dieses Projektes schuf durch und schreibe die nochmal neu aber (hoffentlich) klarer, strukturierter und allgemeiner (oder spezifischer, falls gegeben) \u2026 also i.A: besser (hoffentlich). Ebenso verpasse ich den Programmen eine ausfuerhliche Dokumentation. Damit ich das dann auch mal der Welt zur Verfuegung stellen kann.<br \/>\nBeides zusammen genommen ist also eine gute Gelegenheit den neuen Code auf seine Richtigkeit und die vorherigen Ergebnisse auf ihre Reproduzierbarkeit zu ueberpruefen. Das werde ich dann aber i.A. nur noch kurz zeigen \u00e0 la &#8222;Hier ist alt, hier ist neu, passt schon&#8220;.<\/p>\n<p>Wieauchimmer, das ist Zukunftsmusik. Der heutige Beitrag soll die Serie &#8222;im Geiste&#8220; abschlieszen mittels eines zusammenfassenden Rueckblicks.<\/p>\n<p>Los ging alles mit einer <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2021\/04\/kevin-bacon-i-vorwort\/\" target=\"_blank\" rel=\"noopener\">fixen (und definitiv NICHT konkreten) Idee<\/a> und ich dachte damals, dass das Ganze in sechs Beitraegen fertig wird \u2026 HAHA!<br \/>\nDie fuer die Realisierung der Idee n\u00f8tigen <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2021\/05\/kevin-bacon-ii-rohdaten\/\" target=\"_blank\" rel=\"noopener\">Rohdaten<\/a> waren schnell gefunden und in den Beitragen III bis VII sortierte ich all den Kram raus, der fuer die Analyse irrelevant war. Am Ende blieben 5,798,312 Seiten zur Analyse uebrig und so schnell ging&#8217;s (mehr als) sechs Beitraege zu schreiben. Dabei hatte ich noch nicht mal angefangen mich damit zu beschaeftigen, womit ich mich urspruenglich beschaeftigen wollte. Auszerdem konnte hier zum ersten Mal ein Phaenomen beobachtet werden, welches im weiteren Verlauf der Maxiserie mit sch\u00f8ner Regelmaeszigkeit auftauchte: eine weitere Unterteilung der &#8222;Kapitel&#8220;, wenn ein Thema zu viel wurde fuer einen einzigen Beitrag.<\/p>\n<p>Aber dann ging&#8217;s endlich richtig los \u2026 ich &#8222;sprang&#8220; in die Daten um zu schauen, was die mir so erzaehlen \u2026 und wurde sofort abgelenkt vom urspruenglichen Ziel, denn ich schaute mir zunaechst an, was man machen kann ohne dass man das Linknetzwerk aller Seiten &#8222;abschreitet&#8220;.<\/p>\n<p>Die Analyse der <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?s=Kevin+Bacon+Titelspielereien\" target=\"_blank\" rel=\"noopener\">Laenge der Titel<\/a> fand zwar alles unter dem selben r\u00f8mischen Numeral statt, umfasste aber sechs Beitraege \u2026 und brachte mir sogar eine &#8222;Superabschweifung&#8220; in Form eines <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2021\/09\/kevin-bacon-viii-geburtstagsbeitragseinschub-der-soldat-john-ryan\/\" target=\"_blank\" rel=\"noopener\">Geburtstagsbeitrags<\/a> ein :) .<\/p>\n<p>Bei der Analyse <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?s=Kevin+Bacon+Citation+%28not%29+missing\" target=\"_blank\" rel=\"noopener\">wie oft eine Seite (intern) von anderen Seiten zitiert<\/a> machte mich <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2021\/10\/kevin-bacon-ix-citation-not-missing-a-information-operations\/\" target=\"_blank\" rel=\"noopener\">sofort<\/a> auf zwei Phaenomene aufmerksam, welche im weiteren Verlauf der Maxiserie immer wieder zur Erklaerung anderer Phaenomene herangezogen wurden. Zum Einen, dass ein paar wenige Seiten urst krass viel \u00f8fter zitiert werden als die &#8222;durchschnittliche Seite&#8220;. Zum Anderen, dass es Seiten gibt die kuenstlich aufgeblaeht sind, einfach weil jemand bspw. zu allen &#8222;D\u00f8rfern&#8220; eines Landes eine Wikipediaseite mit zwei Saetzen erstellt hat, welche dann immer das lokale Wort fuer &#8222;Dorf&#8220; verlinken. Die Wichtigkeit dieser Beobachtungen war mir zu dem Zeitpunkt aber natuerlich noch nicht bewusst.<br \/>\nDesweiteren traten bereits hier <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2021\/10\/kevin-bacon-ix-citation-not-missing-c-maechtige-gesetze\/\" target=\"_blank\" rel=\"noopener\">doppelllogarithmischer Diagramme und (ein) maechtige(s) Gesetz(e)<\/a> auf \u2026 deren Bedeutsamkeit sich durch die ganze Serie zog und nicht unterschaetzt werden darf!<br \/>\nUnter <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?s=Kevin+Bacon+Vorne%2C+Hinten%2C+Links%2C+Rechts%2C+Oben%2C+Unten%3A+Links\" target=\"_blank\" rel=\"noopener\">r\u00f8misch zehn<\/a> tat ich das Gleiche fuer die Anzahl der Links und sehr aehnliche Resultate.<\/p>\n<p>Was mich auf die Idee brachte dies &#8222;zusammen zu ziehen&#8220; und die &#8222;Relevanzdiskussion&#8220; mal <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?s=Kevin+Bacon+messbare+Relevanz\" target=\"_blank\" rel=\"noopener\">mit Zahlen anzugehen<\/a> weisz ich nicht mehr. Dabei traten aber zwei Dinge zutage, welche sich ebenso mehr als ein Mal bemerkbar machen sollten.<br \/>\nZum Einen, dass die Analyse und das Verstaendniss der Daten oft relativ grosze Abstraktionsgrade erfordert. Der Sprung von der Anzahl der Zitate einer Seite zum <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2021\/11\/kevin-bacon-xi-messbare-relevanz-a\/\" target=\"_blank\" rel=\"noopener\">(lueckenlosen) &#8222;Relevanzwert&#8220;<\/a> einer Seite war da noch recht einfach \u2026 was mglw. fuer die kurz darauf folgende <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2021\/12\/kevin-bacon-xi-messbare-relevanz-c\/\" target=\"_blank\" rel=\"noopener\">&#8222;komprimierte Relevanz&#8220;<\/a> nicht mehr gesagt werden kann.<br \/>\nZum Anderen, dass es <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2021\/12\/kevin-bacon-xi-messbare-relevanz-e-eine-anomalie\/\" target=\"_blank\" rel=\"noopener\">Anomalien<\/a> in den Daten <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2021\/12\/kevin-bacon-xi-messbare-relevanz-f-der-blob\/\" target=\"_blank\" rel=\"noopener\">gibt<\/a>, die gesonderte, detaillierte Betrachtungen erfordern um sie erklaeren zu k\u00f8nnen. Zum Glueck bin ich so &#8222;gestrickt&#8220;, dass mir sowas keine Ruhe laeszt und derartige, oft (eigtl. immer) zeitaufwaendige &#8222;Abschweifungen&#8220; von der Masse der Daten hin zu &#8222;Minoritaeten&#8220;, sollte mir im Weiteren Verlauf der Serie die besten Erlebnisse und Entdeckungen bescheren \u2026 wenn auch oftmals nach vielem Haareraufen.<\/p>\n<p>Dann ging es aber endlich weiter \u2026 naja \u2026 nicht so richtig, denn das Linknetzwerk musste ja erstmal &#8222;abgeschritten&#8220; werden, bevor ich mich der urspruenglichen Idee widmen konnte. Dafuer &#8222;mathematisierte&#8220; ich von &#8222;Kapitel&#8220; XII bis XV das Problem und der einzige <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/01\/kevin-bacon-xv-ein-vektor-mit-5798312-dimensionen\/\" target=\"_blank\" rel=\"noopener\">&#8222;technische&#8220; Artikel<\/a> der ganzen Serie ist dem &#8222;Geniestreich&#8220; gewidmet, der das &#8222;Abschreiten&#8220; (und damit die Realisierung der Idee) ueberhaupt erst m\u00f8glich machte.<\/p>\n<p>Das wahrhaft technische habe ich euch, meinen lieben Leserinnen und Lesern, gar nicht &#8222;angetan&#8220; und &#8222;versteckte&#8220; es in nur <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/02\/kevin-bacon-xvi-flash-friday\/\" target=\"_blank\" rel=\"noopener\">einem einzigen Beitrag<\/a>. Ich wollte aber wenigstens einen Beitrag haben bzgl. der tatsaechlichen Umsetzung des &#8222;Geniestreichs&#8220; in funktionierenden Code, war es doch das, was mir in diesem langen Projekt die gr\u00f8szte Zufriedenheit brachte. Ich musste naemlich so viele Sachen lernen, von denen ich vorher nicht die geringste Ahnung hatte um sehr spezifische, sehr technische Probleme zu l\u00f8sen von denen ich vorher noch nicht mal wusste, dass es die gibt. Der Weg zum besagten, nicht nur funktionierenden, sondern auch praktikabel schnellen (!) Code war so befriedigend, dass ich ernsthaft ueberlegte, das Projekt an der Stelle zur Ruhe zu legen \u2026 dachte ich doch, dass das nicht getoppt werden k\u00f8nnte \u2026 damit lag ich zwar richtig, aber zu dem Zeitpunkt konnte ich natuerlich noch nichts von den Entdeckungen (und weiteren, zu ueberkommenden Problemen) ahnen, welche mir fast genausoviele intellektuelle Orgasmen bescheren sollten :) .<\/p>\n<p>Ach ja, an der Stelle sollte ich nochmal erwaehnen, dass erst dieser Code die praktische Durchfuehrbarkeit des Projektes erm\u00f8glichte. Der &#8222;Geniestreich&#8220; machte es prinzipiell m\u00f8glich, aber erste Implementierungen haetten ein halbes Jahrhundert gebraucht um zu Ergebnissen zu gelangen. Durch besagten Code konnte das auf ca. vier Monate Gesamtrechenzeit reduziert werden (und ca. 2 Monte tatsaechliche Rechenzeit, weil ich mehr als einen Laptop 24\/7 damit beschaeftigt hielt).<br \/>\nUnd ja, ich bin da bis heute maechtig stolz auf mich \u2026 meiner Meinung nach durchaus berechtigt denn bevor ich damit anfing dachte ich immer, dass ich gewisse erwartete Probleme nie im Leben l\u00f8sen k\u00f8nnte, weil ich dafuer nicht genug Kompetenz habe \u2026 und dann hab ich mir die Kompetenz zu eigen gemacht und das doch geschafft \u2026 toll wa :) .<\/p>\n<p>Bevor es dann mit den Untersuchungen der Resultate des &#8222;Abschreitens&#8220; des Linknetzwerks aller Wikipediaseiten los gehen konnte, stellte ich in Kapitel XVII die Gr\u00f8szen vor, deren Entwicklung bei besagter Linknetzwerkanalyse ueberhaupt untersucht wurden. Am schwierigsten \u2026 oder eher abstraktesten war dabei die Gr\u00f8sze, die ich <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/04\/kevin-bacon-xvii-groszen-von-interesse-b\/\" target=\"_blank\" rel=\"noopener\">&#8222;Linkfrequenz&#8220;<\/a> nannte. Spaeter stellte sich heraus, dass es sehr gut war, dass ich das mit untersuchte, denn war diese doch sehr sehr &#8222;fruchtbar&#8220;.<\/p>\n<p>An dieser Stelle breche ich fuer heute ab und fuege dem (urspruenglichen) Titel ein &#8222;r\u00f8mische I&#8220; hinzu. Wie so oft gibt&#8217;s mehr zu erzaehlen als in einen Artikel passt \u2026 aber es war ja auch (bzw. ist immer noch) eine sehr langanhaltende Serie.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Mit dem vorigen Beitrag m\u00f8chte ich die &#8222;formalen&#8220; Betrachtungen in der Kevin Bacon Maxiserie nach (heute auf den Tag genau) zwei Jahren und elf Monaten abschlieszen. Aber keine Sorge, die drei Jahre kriege ich sicherlich noch voll, denn zwei zu Kevin Bacon geh\u00f8rende Sachen habe ich noch. Die kommen aber in den &#8222;Anhang&#8220;, denn bzgl. [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13636"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=13636"}],"version-history":[{"count":6,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13636\/revisions"}],"predecessor-version":[{"id":13770,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13636\/revisions\/13770"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=13636"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=13636"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=13636"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}