{"id":11040,"date":"2021-10-19T13:37:10","date_gmt":"2021-10-19T11:37:10","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=11040"},"modified":"2021-04-22T11:18:36","modified_gmt":"2021-04-22T09:18:36","slug":"kevin-bacon-ix-citation-not-missing-c-maechtige-gesetze","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2021\/10\/kevin-bacon-ix-citation-not-missing-c-maechtige-gesetze\/","title":{"rendered":"Kevin Bacon &#8211; IX &#8211; Citation (not) missing (c) &#8211; Maechtige Gesetze"},"content":{"rendered":"<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=10934\" target=\"_blank\" rel=\"noopener\">Beim letzten Mal<\/a> stellte ich vor, wie oft Wikipediaseiten auf anderen Wikipediaseiten zitiert werden. Wenige Seiten die oft erwaehnt werden und viele Seiten die selten erwaehnt werden.<\/p>\n<p>Das wirklich Interessante kommt aber jetzt erst \u2026 in der doppeltlogarithmischen Darstellung:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/12_Number_citations_log_log.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-10942 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/12_Number_citations_log_log.png\" alt=\"\" width=\"608\" height=\"462\" \/><\/a><\/p>\n<p>Cool wa! Wie man mit Hilfe einfacher, mathematischer Werkzeuge total viel Information in nur ein Bild kondensieren kann \u2026 ich gebe aber zu, dass meist erst ganz am Ende der Bearbeitung einer Fragestellung steht, nachdem man besagte Information (mindestens halbwegs) verstanden hat.<\/p>\n<p>Das erwaehnte wirklich Interessante ist durch die rote Linie angedeutet: zwischen 50 und 5000 Zitierungen (also ueber zwei Gr\u00f8szenordnungen) scheint sich die Verteilung in der doppeltlogarithmischen Darstellung linear zu aendern. Dies deutet darauf hin, dass sich die Abhaengigkeit der Anzahl der Seiten pro Anzahl Zitierungen nach einem Potenzgesetz bechreiben laeszt \u2026 ich finde uebrigens, dass der englische Begriff &#8222;Power law&#8220; deutlich cooler und maechtiger klingt \u2026 das passt viel besser zur Relevanz der Wissenschaft :) \u2026 wieauchimmer \u2026 total viel Zeug verhaelt sich nach Potenzgesetzen und das ist total wichtig, denn diese sind immer ein Hinweis darauf, dass ein Phaenomen <a href=\"https:\/\/de.wikipedia.org\/wiki\/Skaleninvarianz\" target=\"_blank\" rel=\"noopener\">skaleninvariant<\/a> ist &#8212; dass es sich also im Groszen wie im Kleinen gleich verhaelt. Ein Beispiel waere der Flaecheninhalt eines Quadrats in Abhaengigkeit von der Seitenlaenge. Klar, bei langen Seiten sind die Zahlen gr\u00f8szer, aber Ersteres ist immer als das Quadrat von Letzterem auszudruecken \u2026 da aendert sich also nix mit der Gr\u00f8sze.<br \/>\nBzw. geht das dann sogar noch weiter zur <a href=\"https:\/\/de.wikipedia.org\/wiki\/Universalit%C3%A4t_(Physik)\" target=\"_blank\" rel=\"noopener\">Universalitaet<\/a> &#8212; dass sich unterschiedlichste Phaenomene auf (mehr oder weniger) die gleiche Art beschreiben lassen (bswp. die <a href=\"https:\/\/en.wikipedia.org\/wiki\/Wheat_and_chessboard_problem\" target=\"_blank\" rel=\"noopener\">Anzahl von Reisk\u00f8rnern auf einem Schachbrett<\/a> und das (ungebremste) Wachstum von Bakterien). Diese beiden Sachen (und das wir (als Menschheit) das erkannt haben) sind ganz fundamental wichtig fuer den Erfolg der modernen Wissenschaften und warum wir das heutzutage so gut haben.<\/p>\n<p>Die Steigung der Geraden ist ungefaehr minus zwei (zwei Gr\u00f8szenordnungen auf der Abzysse und (minus) vier Gr\u00f8szenordnungen auf der Ordinate). In diesem Bereich ist also die Anzahl der Seiten umgekehrt proportional zum Quadrat der Zitierungen. Vom Bauchgefuehl ergibt das erstmal Sinn. Das interessante an diesem Faktor ist dann weiter, dass dies <a href=\"https:\/\/arxiv.org\/abs\/cond-mat\/0412004\" target=\"_blank\" rel=\"noopener\">keine wohldefinierte Varianz zulaeszt<\/a> (lohnt sich durchaus zu lesen, wenigstens teilweise, weil viel sch\u00f8ne Beispiele gegeben werden). Dies hat wiederum zur Folge, dass sogenannte <a href=\"https:\/\/en.wikipedia.org\/wiki\/Black_swan\" target=\"_blank\" rel=\"noopener\">Black Swans<\/a> auftreten k\u00f8nnen; dass also total krasse Ausreiszer zwar aueszerst selten, aber durchaus zu erwarten sind. Dies gilt im Uebrigen fuer sehr viele natuerliche Phaenomene. Und damit schlieszt sich der Kreis zum letzten Mal, wo genau diese das Thema waren. Wobei die &#8222;Black Swans&#8220; in diesem Fall begrenzt sind, weil es nur eine endliche Anzahl von Wikipediaseiten gibt.<\/p>\n<p>Dazu abschlieszend sollte ich sagen, dass ich mit der Annahme einer umgekehrten Proportionalitaet auch falsch liegen k\u00f8nnte. Linearitaet in einer doppeltlogarithmischen Darstellung ist zwar eine notwendige, aber keine hinreichende Bedingung dafuer. Der Grund ist, dass es sich hierbei um eine endliche Datenmenge handelt. Man kann auf verschiedenste Arten endlliche Datenmengen generieren, die scheinbar einem Potenzgesetz folgen; es bei der Erweiterung ins Unendliche dann aber zu (mehr oder wenige subtilen, mathematisch definitiv wichtigen) Unterschieden kommt.<br \/>\nAuszerdem sagte schon der beruehmte Prof. Klos zwischen zwei Zigaretten: &#8222;Wer es nicht schafft bei doppeltlogarithmischer Darstellung eine gerade Linie durchzuziehen, der muss schon ziemllich minderbemittelt sein.&#8220;<\/p>\n<p>In diesem Zusammenhang habe ich habe bisher nicht die Gruppe von Wikipediaseiten die am allerwenigsten zitiert werden besprochen. Weil der der Beitrag jetzt aber schon so lang ist, verschiebe ich die Besprechung dieser letzten Gruppe auf das naechste Mal.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Beim letzten Mal stellte ich vor, wie oft Wikipediaseiten auf anderen Wikipediaseiten zitiert werden. Wenige Seiten die oft erwaehnt werden und viele Seiten die selten erwaehnt werden. Das wirklich Interessante kommt aber jetzt erst \u2026 in der doppeltlogarithmischen Darstellung: Cool wa! Wie man mit Hilfe einfacher, mathematischer Werkzeuge total viel Information in nur ein Bild [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/11040"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=11040"}],"version-history":[{"count":4,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/11040\/revisions"}],"predecessor-version":[{"id":11087,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/11040\/revisions\/11087"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=11040"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=11040"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=11040"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}