{"id":13261,"date":"2023-11-23T13:37:42","date_gmt":"2023-11-23T11:37:42","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13261"},"modified":"2023-08-14T16:59:54","modified_gmt":"2023-08-14T14:59:54","slug":"kevin-bacon-lx-log-log-plots-ueber-integrale-ii-zwei-einfache-beispiele","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2023\/11\/kevin-bacon-lx-log-log-plots-ueber-integrale-ii-zwei-einfache-beispiele\/","title":{"rendered":"Kevin Bacon &#8211; LX &#8211; log-log-Plots ueber Integrale (ii): zwei einfache Beispiele"},"content":{"rendered":"<p>Ich versprach <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13196\" target=\"_blank\" rel=\"noopener\">beim letzten Mal<\/a> Freude und die kann man anhand dieses Diagramms erfahren:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/137_simulation_negative_exponent.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13256 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/137_simulation_negative_exponent.png\" alt=\"\" width=\"569\" height=\"485\" \/><\/a><\/p>\n<p>Und wie so oft sage ich hier zunaechst mein beruehmtes: aber der Reihe nach \u2026 tihihi.<\/p>\n<p>Die grauen, als &#8222;Rohdaten&#8220; beschriftete, Punkte sind das Resultat einer Simulation. Bei dieser unterlag die Wahrscheinlichkeit einen gegebenen, ganzzahligen (!) &#8222;Messwert&#8220; im Intervall [1, 10k] zu erhalten einem simplen Potenzgesetz mit einem Exponent von -2.23 und keinen Vorfaktoren oder anderweitigen Konstanten.<br \/>\nIch machte 100-tausend &#8222;Messungen&#8220; und zaehlte wie oft jeder Messwert auftrat. Hier ist also in den grauen Punkten (mal wieder) ein Histogramm zu sehen und das verhaelt sich wie erwartet; eine Gerade im log-log-Plot \u2026 zumindest bis zu Messwerten von ca. 100 (ganz konkret geschah der &#8222;Schnitt&#8220; bei 130). Auch erwartet ist der &#8222;Schwanz&#8220; bei Messwerten ueber 100 hinaus. Mit bspw. 1000<sup>-2.23<\/sup> = 2 x 10<sup>-7<\/sup> ist die Wahrscheinlichkeit zwar sehr klein aber eben nicht null und bei 100k Messungen ist das nicht unplausibel den Wert 1000 ein Mal zu messen. Das ist also ECHT! Das sind KEINE Ausreiszer!<\/p>\n<p>Die hohen Messwerte muss ich aber &#8222;abschneiden&#8220;, um mittels linearer Regression (lila, nicht durchgehende Kurve) den Anstieg der Geraden zu -2.2028 ermitteln zu k\u00f8nnen. Das ist gar nicht mal so schlecht, bedeutete aber in diesem konkreten Fall, dass ich 133 Messwerte ignorieren muste \u2026 schade eigentlich, nicht wahr.<\/p>\n<p>Aber keine Sorge, Rettung naht in Form der blauen Punkte welche so berechnet wurden:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/Integral_powerlaw_positive_example.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13259\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/Integral_powerlaw_positive_example.png\" alt=\"\" width=\"301\" height=\"72\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/Integral_powerlaw_positive_example.png 787w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/Integral_powerlaw_positive_example-768x183.png 768w\" sizes=\"(max-width: 301px) 100vw, 301px\" \/><\/a><\/p>\n<p>Weil es sich hierbei um diskrete Werte handelt kann das Integral als eine einfache Summe berechnet werden. Ich werde das aber weiterhin als Integral bezeichnen (und betrachten).<br \/>\nDie Grenzen des Integrals sind so zu verstehen, dass der Wert desselbigen bei einem gegebenen Messwert <em>x<\/em> die Summe ueber ALLE <em>f(x)<\/em> von dem gegebenen Messwert bis zum maximalen Messwert ist.<\/p>\n<p>Das kann man auch anders ausdruecken, indem man <em>f(x)<\/em> derart normiert, dass die Flaeche unter der Kurve 1 wird (der Anstieg aendert sich dadurch ja nicht). Dann kann <em>f(x)<\/em> direkt als die Wahrscheinlichkeit angesehen werden <em>x<\/em> zu messen. Das ist leicht zu verstehen, insb. wenn man in Betracht zieht was (wie oben beschrieben) bei der Simulation passiert, wenn eine &#8222;Messung&#8220; gemacht wurde.<br \/>\nBei dieser &#8222;Wahrscheinlichkeitsinterpretation&#8220; entspricht ein Integralwert zu\u00a0 einem gegebenen <em>x<\/em> der Wahrscheinlichkeit, dass eine Messung einen Wert produzieren wird der gr\u00f8szer oder gleich <em>x<\/em> ist.<br \/>\nDiese Interpretation ist in vielen Situationen sehr hilfreich weswegen ich die hier erwaehne. Wirklich sinnvoll ist die aber nur fuer negative Exponenten (kleiner als -1).<br \/>\nFuer positive Exponenten kommt man mit einer solchen Interpretation ganz sch\u00f8n in die <a href=\"https:\/\/de.wikipedia.org\/wiki\/Bredouille\" target=\"_blank\" rel=\"noopener\">Bredouille<\/a>; auch wenn die Mathematik natuerlich erhalten bleibt. Was der Grund ist, warum ich diese Interpretation eher vermeide und solche Normierungen im Weiteren nicht vornehme.<\/p>\n<p>Zurueck zum Diagramm; man sieht leicht, dass ich bei den blauen Punkten auch Werte ueber 130 benutzen kann um den Anstieg selbiger zu ermitteln. Dieser betraegt -1.2486 und da es sich hierbei um das Integral handelt muss man dran denken, dass dieser um eins erniedrigt werden muss um den Exponenten zu erhalten.<br \/>\nDer Unterschied zum wahren (hier NICHT in Anfuehrungszeichen, da ich den exakten Exponenten fuer die Simulationen kenne) Wert betraegt fuer die &#8222;Rohdaten&#8220; 0.0272 und fuer das Integral nur 0.0186. Letzteres ist also ca. 50% genauer. Der Unterschied hier ist aber nicht so wichtig (kann in anderen Zusammenhaengen aber wichtig werden.<\/p>\n<p>Das Integral hat zwei (!) viel wichtigere Konsequenzen die weit ueber den kleineren Unterschied hinaus gehen. Zum Ersten muss ich KEINE (oder in anderen Zusammenhaengen weniger) Messwerte ausschlieszen UND zum Anderen ist der lineare Zusammenhang (hier auf der Abszisse) ueber zwei weitere Gr\u00f8szenordnungen zu erkennen.<br \/>\nErsteres ist selbsterklaerend und Letzteres ist krass urst gut, denn dadurch werden Ergebnisse robuster (und man kann denen dadurch noch mehr vertrauen).<\/p>\n<p>In einer zweiten Simulation aenderte ich das Vorzeichen (aber nicht den Wert) des Exponenten; grosze Messwerte sind damit viel wahrscheinlicher als kleine Messwerte und das spiegelt sich in den grauen Punkten (linke Abszisse) in diesem Diagramm wider:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/138_simulation_positive_exponent.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13264 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/138_simulation_positive_exponent.png\" alt=\"\" width=\"633\" height=\"485\" \/><\/a><\/p>\n<p>Der gr\u00f8szte Unterschied zum ersten Diagramm ist, dass es keinen &#8222;Schwanz&#8220; (der in diesem Fall zu kleineren Werten gehen muesste) gibt. Demnach kann ich auch keine Messwerte &#8222;ignorieren&#8220; bei der linearen Regression (lila, nicht durchgehende Kurve) und selbige fuehrt zu einem Anstieg von +1.8832 \u2026 was ganz sch\u00f8n schlecht ist.<\/p>\n<p>Wenn man nun das Integral mit den Grenzen wie oben bildet, erhaelt man die schwarze Kurve (rechte Abszisse). Da passiert erstmal gar nichts und dann ganz pl\u00f8tzlich passiert was sehr schnell. Das wird verstaendlich, wenn man (ausnahmsweise) die &#8222;Wahrscheinlichkeitsinterpretation&#8220; her nimmt. Bei derartigen Grenzen besagte diese, dass der Integralwert zu einem gegebenen Messwert angibt, wie grosz die Wahrscheinlichkeit ist, diesen oder einen h\u00f8heren Messwert zu erhalten. Weil hohe Messwerte sehr viel wahrscheinlicher sind als kleine Messwerte aendert sich der Integralwert zunaechst nicht stark und dann pl\u00f8tzlich urst dolle.<br \/>\nDie schwarzen Punkte bilden sicherlich keine Gerade und diese &#8222;komische Sache&#8220; fuehrte bei mir zu geh\u00f8rigem Kopfzerbrechen \u2026 worauf ich ja aber im nicht Detail eingehen wollte. Ich sage nur so viel: die Mathematik ist hier nicht &#8222;kaputt&#8220;. Das ist nur eine der Sachen bei der kontinuierliche Mathematik die von minus Unendlich bis plus Unendlich reicht mit echten diskreten Messwerten &#8222;kollidiert&#8220;, die nicht mal bis Null (wichtig!) und sicher nicht bis Unendlich reichen. Man kann das fixen und dann wird das wieder sch\u00f8n gerade, auch bei diesen Grenzen \u2026 das war zwar interessant auszuknobeln, aber wie gesagt, das soll hier nicht das Thema sein.<\/p>\n<p>Anstatt das kompliziert zu machen gebe ich die viel einfachere L\u00f8sung (welche man in den blauen Punkten (auch rechte Abszisse) sieht) direkt an &#8212; &#8222;invertierte&#8220; Integralgrenzen:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/Integral_powerlaw_negative_example.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13267\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/Integral_powerlaw_negative_example.png\" alt=\"\" width=\"173\" height=\"71\" \/><\/a><\/p>\n<p>In der &#8222;Wahrscheinlichkeitsinterpretation&#8220; wuerde das der Aussage entsprechen, dass der Integralwert zu einem gegebenen <em>x<\/em> angibt, einen Messwert _kleiner_ oder gleich <em>x<\/em> zu erhalten \u2026 aber wie erwaehnt, kann man die &#8222;Rohdaten&#8220; bei positiven Exponenten NICHT mehr streng als Wahrscheinlichkeiten interpretieren (auszer in ganz konkreten Beispielen mit endlichen Messungen). Ich fand das nur so anschaulich, weswegen ich das erwaehne \u2026 aber das &#8222;vergesst&#8220; ihr, meine lieben Leserinnen und Leser, ganz schnell wieder und merkt euch nur die schnelle L\u00f8sung um auch bei positiven Exponenten Geraden in log-log-Plots von Integralen zu erhalten.<br \/>\nZum Glueck tritt dieser Fall zumindest bei der Analyse des Wikipedianetzwerkes nicht so haeufig auf.<\/p>\n<p>Wieauchimmer, die lineare Regression des Integrals fuehrt zu einem Anstieg der blauen Punkte von +3.2282, was auch um eins reduziert werden muss und dann sehr nah am wahren Wert ist \u2026 das ist mal echt urst cool, wa!<\/p>\n<p>Genug fuer heute. Beim naechsten Mal fange ich an, nochmal durch (fast) alle doppellogarithmischen Diagramme durch zu gehen. Das werden also ein paar Artikel. ABER ich schaue mir das nicht nochmal im Detail an; das werden also Artikel mit Bildern und (meist) nicht ganz so viel Text wie hier \u2026 mit der Ausnahme, wenn es was Neues oder Interessantes zu sehen gibt.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ich versprach beim letzten Mal Freude und die kann man anhand dieses Diagramms erfahren: Und wie so oft sage ich hier zunaechst mein beruehmtes: aber der Reihe nach \u2026 tihihi. Die grauen, als &#8222;Rohdaten&#8220; beschriftete, Punkte sind das Resultat einer Simulation. Bei dieser unterlag die Wahrscheinlichkeit einen gegebenen, ganzzahligen (!) &#8222;Messwert&#8220; im Intervall [1, 10k] [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13261"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=13261"}],"version-history":[{"count":5,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13261\/revisions"}],"predecessor-version":[{"id":13272,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13261\/revisions\/13272"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=13261"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=13261"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=13261"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}