{"id":13850,"date":"2024-05-13T13:37:21","date_gmt":"2024-05-13T11:37:21","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13850"},"modified":"2024-04-16T15:56:35","modified_gmt":"2024-04-16T13:56:35","slug":"kevin-bacon-anhang-a1-popularitaetswettbewerb-2","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2024\/05\/kevin-bacon-anhang-a1-popularitaetswettbewerb-2\/","title":{"rendered":"Kevin Bacon &#8211; Anhang A1 &#8211; Popularitaetswettbewerb 2"},"content":{"rendered":"<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13803\" target=\"_blank\" rel=\"noopener\">Beim letzten Mal<\/a> stellte ich eine neue Datenquelle vor, welche die Anzahl der Seitenaufrufe pro Tag fuer jede Wikipediaseite hat. Das ist von Interesse, denn in den Analysen der vorhergehenden Jahre behauptete ich oft, dass i.A. Seiten mit mehr Zitaten populaerer sind. Das ist durchaus eine plausible Behauptung, allein schon weil oefter zitierte Seiten eine gr\u00f8szere Chance haben angeklickt zu werden, einfach weil die \u00f8fter von Nutzern gesehen werden. Der Quelltext enthaelt allerdings keine Information darueber, dass das auch &#8222;in Echt&#8220; (also extern und nicht nur via internen Zitaten von einer Seite zur naechsten) gilt.<\/p>\n<p>Die neuen Daten erlauben mir das nun direkt zu testen indem man sich die Aufrufe einer Seite in Abhaengigkeit von der Anzahl der (Wikipedia internen) Zitate (oder Links) anschaut.<br \/>\nDas ist das Prinzip, aber natuerlich ist das nicht ganz so einfach. Zunaechst einmal muss man die beim letzten Mal erwaehnten natuerlichen und unnatuerliche Artefakte in den Daten &#8222;rausmitteln&#8220;. Das ist einfach, denn dafuer muss nur die durchschnittliche Anzahl an Seitenaufrufen pro Monat berechnet werden (fuer jede Seite). Es ist leicht einzusehen, dass das nix am allgemeinen Prinzip aendert, die Interpretierbarkeit des Diagramms hingegen deutlich erleichtert.<\/p>\n<p>Ich vermutete aber, dass das immer noch nicht ausreicht, denn ich ging davon aus, dass selbst die durchschnittlichen monatlichen Seitenaufrufe massiv streuen. Oder anders: ich erwartete eine dichte Punktwolke ohne viel Struktur, wie schon bei der <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/04\/kevin-bacon-xviii-groszvieh-macht-definitiv-mehr-mist-als-kleinvieh-zum-ersten\/\" target=\"_blank\" rel=\"noopener\">Abhaengigkeit der Anzahl der Links von der Anzahl der Zitate<\/a> von &#8222;damals&#8220;. Die L\u00f8sung lag (wieder) in einer gruppenweise Mittelung der durchschnittlichen Seitenaufrufe. &#8222;Gruppenweise&#8220; bedeutet hier (wieder), dass alle Seiten die eine gegebene Anzahl an Zitaten \/ Links haben eine Gruppe ausmachen. Die durchschnittlichen Seitenaufrufe aller Mitglieder der Gruppe wurden dann gemittelt.<br \/>\nDas sagt nicht mehr unbedingt viel ueber einzelne Seiten aus, denn die Information die in der Streuung der Werte liegt geht komplett verloren. Aber individuelle Seiten interessieren mich ohnehin nicht wirklich. Diese Herangehensweise erh\u00f8ht die Interpretierbarkeit allerdings deutlich, wenn man auf allgemeine Erwartungen (oder Verhalten) bei einer gegebenen Situation (die Anzahl der Zitate \/ Link) aus ist.<\/p>\n<p>Und hier ist nun endlich das Diagramm:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/165_average_pageviews_per_citations_or_links.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13866 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/165_average_pageviews_per_citations_or_links.png\" alt=\"\" width=\"616\" height=\"460\" \/><\/a><\/p>\n<p>Voll super wa! Fuer bis zu ca. 1000 Zitate \/ 500 Links verhaelt sich die Anzahl der durchschnittlichen monatlichen Seitenaufrufe nach einem maechtigen Gesetz. Danach gilt das nicht mehr i.A. denn die Punkte streuen zu sehr. Letzteres liegt daran, weil ich bei sehr vielen Zitaten \/ Links nicht mehr genuegend Seiten fuer eine gute Statistik habe. Die obige Behauptung ist aber weiterhin i.A. gueltig, denn Seiten mit mehr als ca. 1000 Zitaten \/ 500 Links halten sich eher im oberen, als im unteren Teil des Diagrams auf (und bei logarithmischer Achse &#8222;haut das doppelt rein&#8220; \u2026 streng genommen zehnfach, denn es ist ja &#8217;ne logarithmische Achse).<\/p>\n<p>Natuerlich haette ich die blauen Punkte gar nicht einzeichnen muessen, denn <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/2022\/05\/kevin-bacon-xviii-groszvieh-macht-definitiv-mehr-mist-als-kleinvieh-zum-dritten\/\" target=\"_blank\" rel=\"noopener\">wir wissen ja<\/a>, dass die Anzahl der Links nach einem maechtigen Gesetz von der Anzahl der Zitate abhaengt. Ich wollte das aber zeigen, denn besagte Abhaengigkeit fuehrt zu unterschiedlichen Anstiegen der blauen und roten &#8222;Kurve&#8220;.<\/p>\n<p>So \u2026 viel mehr gibt&#8217;s dazu nicht zu sagen. Es ist fein zu sehen, dass die plausible Behauptung tatsaechlich stimmt.<\/p>\n<p>Damit werde ich dann ab dem naechsten Mal die Reproduzierbarkeit der Ergebnisse angehen \u2026 nach ueber drei Jahren wird das dann aber zu einem unregelmaeszigeren Publikationsrhytmus fuehren, denn das mache ich zusammen mit dem neu schreiben der Analyseprogramme und das dauert &#8217;ne Weile.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Beim letzten Mal stellte ich eine neue Datenquelle vor, welche die Anzahl der Seitenaufrufe pro Tag fuer jede Wikipediaseite hat. Das ist von Interesse, denn in den Analysen der vorhergehenden Jahre behauptete ich oft, dass i.A. Seiten mit mehr Zitaten populaerer sind. Das ist durchaus eine plausible Behauptung, allein schon weil oefter zitierte Seiten eine [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13850"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=13850"}],"version-history":[{"count":4,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13850\/revisions"}],"predecessor-version":[{"id":13867,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13850\/revisions\/13867"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=13850"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=13850"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=13850"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}