{"id":14091,"date":"2024-10-23T13:37:46","date_gmt":"2024-10-23T11:37:46","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=14091"},"modified":"2024-10-02T15:22:44","modified_gmt":"2024-10-02T13:22:44","slug":"kevin-bacon-anhang-a2-reproduzierbarkeit-4-ein-maechtiges-werkzeug-ii-relevanzwert-zu-bedeutungsgruppe","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2024\/10\/kevin-bacon-anhang-a2-reproduzierbarkeit-4-ein-maechtiges-werkzeug-ii-relevanzwert-zu-bedeutungsgruppe\/","title":{"rendered":"Kevin Bacon \u2013 Anhang A2 \u2013 Reproduzierbarkeit 4: ein maechtiges Werkzeug (ii) &#8211; Relevanzwert zu Bedeutungsgruppe"},"content":{"rendered":"<p>Ohne lange Vorrede, knuepfe ich recht direkt beim <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=14083\" target=\"_blank\" rel=\"noopener\">letzten Mal<\/a> an.<br \/>\nUrspruenglich schaute ich nur auf die Zitate die eine Wikipediaseite auf sich vereinte und betrachtete diese als ein Masz fuer die &#8222;Relevanz&#8220; besagter Seite. Ich definierte (nicht formal, aber irgendwie schon) dann, dass der &#8222;Relevanzwert&#8220; eine Art &#8222;Projektion&#8220; der Anzahl der Zitate auf eine kontinuierliche Verteilung ist. <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2021\/11\/kevin-bacon-xi-messbare-relevanz-a\/\" target=\"_blank\" rel=\"noopener\">Hier<\/a> bin ich damals naeher darauf eingegangen; dennoch zur Wiederholung zwei kurze Beispiele.<br \/>\n&#8211; Seiten mit wenigen Zitaten werden 1:1 &#8222;projiziert&#8220;. Es gibt Seiten mit, zwei, drei, vier, oder fuenf Zitaten und deren &#8222;Relevanzwert&#8220; entspricht dann auch 2, 3, 4 oder 5.<br \/>\n&#8211; Bei vielen Zitaten kommt es aber zu Luecken. Bspw. k\u00f8nnte es (eine) Seite(n) mit 235 Zitaten geben, was dann (noch) einem &#8222;Relevanzwert von 235 entspricht. Wenn es nun keine Seiten mit 236 oder 237 Zitaten gibt (eine Luecke) sondern erst wieder mit 239 Zitaten, so werden Letztere einem &#8222;Relevanzwert&#8220; von 236 (ohne Luecke!) zugeordnet.<\/p>\n<p>Soweit zur Auffrischung alter Sachen. Aber eigentlich will ich vom Begriff &#8222;Relevanzwert&#8220; weg kommen. Der Grund liegt in dem was ich beim letzten Mal schrieb: auch die Anzahl der Links die eine Seite hat ist von Interesse. Die k\u00f8nnen aber nicht mehr (oder vielmehr nicht auch) als Relevanzwert angesehen werden. Dennoch m\u00f8chte ich gerne zwischen Anzahl Zitaten und Anzahl Links unterscheiden k\u00f8nnen.<br \/>\nDas oben beschriebene Prinzip hilft aus dem Dilemma heraus, denn alle Seiten welche die selbe Anzahl an Zitaten \/ Links haben (je nachdem, was man betrachtet) werden in eine Gruppe &#8222;geschmissen&#8220;. Und das was dann auf der jeweiligen Achse des zweidimensionalen Falschfarbenbildes abgetragen ist, entspricht der Bedeutung der Achse. Somit kommt man leicht zu den Bedeutungsgruppen, bzw. ganz konkret: Zitategruppen bzw. Linksgruppen. Am Prinzip aendert sich aber nix, nur der Name ist anders und die Interpretation bzgl. dessen fuer was besagtes Prinzip steht ist verallgemeinert worden.<\/p>\n<p>An der Stelle kann ich mich um den Reproduzierbarkeitsteil des Anhangs kuemmern. Fuer die Daten von 2020 gab es nur 5,696 verschiedene M\u00f8glichkeiten wieviele Zitate eine Seite haben konnte. Weil man bei der Null anfaengt zu zaehlen (denn es gibt Seiten die keine Zitate haben), entspricht das einem h\u00f8chsten Relevanzwert von 5,695. Hier ist der Vergleich mit den Daten von 2023:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/173_citations_groups_2020_vs_2023.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14096 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/173_citations_groups_2020_vs_2023.png\" alt=\"\" width=\"558\" height=\"460\" \/><\/a><\/p>\n<p>Man sieht, dass sich die 2023 Daten (rote Punkte) ab ca. 3-tausend Zitaten ueber die 2020-Daten erheben. Die Vielfalt in der Anzahl der Zitate die eine Seite haben kann ist also gr\u00f8szer in den neueren Daten (und damit steigt die Anzahl der Zitategruppen). Wie oben erwaehnt, werden Seiten mit wenigen Zitaten 1:1 auf die entsprechende Gruppe &#8222;projiziert&#8220; \u2026 am Grafen kann man ablesen, dass &#8222;wenig&#8220; bis ca. 3-tausend Zitate bedeutet.<br \/>\nInsgesamt gibt es in den 2023-Daten 6164 Zitategruppen, also nicht ganz 500 mehr als in den 2020-Daten.<\/p>\n<p>Die S-Form hat nix zu sagen und kommt durch die halblogarithmische Darstellung zustande. Diese waehlte ich aus zwei Gruenden. Zum Einen, weil eine Seite (es ist die Hauptseite \u2026 ich frage mich uebrigens, warum die nie in den 2020-Daten auftauchte \u2026 vielleicht hat sich seitdem was in der Wikipedia an sich geaendert \u2026 oh \u2026 ich schwoffte ab) ueber 5 Millionen Zitate erhaelt und man bei linearer Abzsisse nix Relevantes sehen wuerde (nur eine Kurve die senkrecht nach oben geht und dann flach verlaeuft). Zum Zweiten, weil es bei einer logarithmischen Ordinatebei hohen Zitategruppen(zahlen?) zur &#8222;logarithmischer Komprimierung&#8220; kommt und man dadurch auch wieder nix Relevantes (naemlich den Unterschied) sieht.<\/p>\n<p>Alles in allem wuerde ich dies als reproduziert ansehen. Die Aenderung der Anzahl der Zitategruppen war zu erwarten und die Aenderung liegt jetzt nicht v\u00f8llig wild ganz woanders (bei 5 Trillionen oder so \u2026 oder auch nur &#8217;nem Faktor 2 wenn man mal drueber nachdenkt).<\/p>\n<p>Und nun kommt was Neues \u2026 und Altes was aber auch neu ist, weil ich&#8217;s vorher noch nicht gezeigt hatte: die &#8222;Projektion&#8220; der Anzahl der Links die eine Seite haben kann auf die Linksgruppen:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/174_links_groups_2020_vs_2023.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-14097 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/174_links_groups_2020_vs_2023.png\" alt=\"\" width=\"579\" height=\"456\" \/><\/a><\/p>\n<p>Man beachte die andere Skalierung! Weil die Anzahl der Links nicht so hohe <del>Extrem<\/del>Maximalwerte hat, konnte ich beide Achsen linear belassen. Man kann aber erahnen, was ich oben mit &#8222;senkrecht nach oben und dann flach&#8220; meine; bzw. wie nuetzlich die &#8222;logarithmische Komprimierung&#8220; ist \u2026 aber das zog sich ja immer wieder durch diese Serie. Desweiteren sieht man eine andere, bereits erwaehnte Sache: bis ca. 1500 Links ist der Anstieg der Kurve linear und das entspricht einer (im Wesentlichen) 1:1 &#8222;Projektion&#8220;.<br \/>\nAnsonsten ist nur noch zu sagen, dass die Anzahl der Linksgruppen nur ca. 1\/3 der Anzahl der Zitategruppen betraegt und dass besagte Anzahl auch hier (leicht) zunimmt in den 2023-Daten.<br \/>\nAlles in allem ist das zwar neu, aber gleichzeitig auch eine Reproduktion \u2026 toll wa! Der fruehe Wurm faengt gleich zwei Spatzen auf dem Dach :) .<\/p>\n<p>Juti \u2026 das soll reichen fuer heute. Beim naechsten Mal \u2026 \u2026 \u2026 *ueberleg* \u2026 \u2026 \u2026 gibt&#8217;s dann endlich wieder bunte Bilder. Da muss ich aber noch ueberlegen, wie ich das aufziehe.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ohne lange Vorrede, knuepfe ich recht direkt beim letzten Mal an. Urspruenglich schaute ich nur auf die Zitate die eine Wikipediaseite auf sich vereinte und betrachtete diese als ein Masz fuer die &#8222;Relevanz&#8220; besagter Seite. Ich definierte (nicht formal, aber irgendwie schon) dann, dass der &#8222;Relevanzwert&#8220; eine Art &#8222;Projektion&#8220; der Anzahl der Zitate auf eine [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14091"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=14091"}],"version-history":[{"count":4,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14091\/revisions"}],"predecessor-version":[{"id":14098,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/14091\/revisions\/14098"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=14091"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=14091"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=14091"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}