{"id":13102,"date":"2023-10-23T13:37:19","date_gmt":"2023-10-23T11:37:19","guid":{"rendered":"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13102"},"modified":"2023-05-25T12:04:05","modified_gmt":"2023-05-25T10:04:05","slug":"kevin-bacon-lvii-mehr-und-einfachere-ordnung","status":"publish","type":"post","link":"http:\/\/www.soeren-in-norwegen.net\/blog\/2023\/10\/kevin-bacon-lvii-mehr-und-einfachere-ordnung\/","title":{"rendered":"Kevin Bacon &#8211; LVII &#8211; mehr und einfachere Ordnung"},"content":{"rendered":"<p>Beim <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13091\" target=\"_blank\" rel=\"noopener\">vorletzten Mal<\/a> stellte ich die Entwicklung der zitierten Seiten vor. Diese Gr\u00f8sze kann man nicht direkt als Ordnungsparameter benutzen aber <a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/?p=13113\" target=\"_blank\" rel=\"noopener\">beim letzten Mal<\/a> zeigte ich, dass der daraus gewinnbare \u201eVolumenanteil\u201c der Kettenseiten an allen Zitaten sehr wohl als ein solcher benutzt werden kann.<br \/>\nHeute nun zeige ich, dass das viel einfacher geht. Ich wollte aber den &#8222;Volumenanteil&#8220; zuerst abgehandelt haben, denn ich denke, dass dieser intuitiver als Ordnungsparameter zu verstehen ist.<\/p>\n<p>Wieauchimmer, viel leichter aus den Messungen &#8222;herauszuziehen&#8220; ist die Entwicklung der UNzitierten Seiten und weil die Daten nicht so zappeln sieht der entsprechende Graf auch viel besser aus als der Graf vom &#8222;Volumenanteil&#8220; vom letzten Mal:<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/133_not_cited_pages.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13121 size-full\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/133_not_cited_pages.png\" alt=\"\" width=\"718\" height=\"456\" \/><\/a><\/p>\n<p>Vor der Normierung der Daten wurde von diesen der Wert aller Seiten die niemals zitiert werden abgezogen; Letztere entsprechen nur einem &#8222;Offset&#8220; und ich wollte das Nulllevel auch auf Null haben.<\/p>\n<p>Aber moment Mal! Die Anzahl der UNzitierten Seiten ist doch nur die Anzahl aller Seiten minus die zitierten Seiten \u2026 also das &#8222;umgedrehte&#8220; Ergebnis vom vorletzten Mal. Wieso war Letzteres kein Ordnungsparameter, das &#8222;Umgedrehte&#8220; aber doch?<br \/>\nUm diese Frage zu beantworten, musste ich eine ganze Weile gruebeln, aber im Grunde ist es gar nicht so kontraintuitiv. In kurz: in einem Gas herrscht UNordnung, denn dort wuseln alle Teilchen umher und kollidieren die ganze Zeit mit allen anderen Teilchen. Wenn das Gas zur Fluessigkeit kondensiert ist, herrscht Ordnung, denn die selben Teilchen wuseln nicht mehr so dolle umher und kollidieren entsprechend nicht mehr mit allen anderen Teilchen.<br \/>\nFuer das System des Wikipedialinknetzwerkes habe ich &lt; Kollision &gt; mit &lt; wird zitiert &gt; gleichgesetzt. Die Anzahl der UNzitierten Seiten drueckt dann aus, wieviele Seiten aus dem &#8222;Gewusel&#8220; heraus genommen wurden und somit auch nicht mehr zur Unordnung beitragen k\u00f8nnen. Entsprechend ist die Anzahl der UNzitierten Seiten ein direktes Masz fuer die Ordnung \u2026 \u2026 \u2026 und das geht sogar ganz von allein in die richtig Richtung (von wenig zu viel).<\/p>\n<p>Nun war es aber so, dass bei der Entwicklung der zitierten Seiten \u2026<\/p>\n<blockquote><p>[\u2026] noch ziemlich viel \u201enach hinten raus\u201c passiert [\u2026] [,]<\/p><\/blockquote>\n<p>\u2026 was man in der logarithmischen Darstellung sah. Das war ein wichtiger Punkt bzgl. der Ungeeignetheit der &#8222;zitierten Seiten&#8220; als Ordnungsparaemter. Wieso scheint sich das nicht auf die &#8222;umgedrehten&#8220; Daten zu uebertragen (siehe die rote Kurve im Diagramm)? Nun ja, das W\u00f8rtchen &#8222;scheint&#8220; ist wichtig, denn natuerlich uebertraegt sich das auch auf die &#8222;umgedrehten&#8220; Daten. Aber die relative Aenderung dreht sich AUCH um und deswegen spielt das keine Rolle mehr.<br \/>\nEine kurze Erklaerung fuer jeweils LL<sub>65<\/sub> zu LL<sub>37<\/sub>. Bei den zitierten Seiten betraegt der jeweilige Wert 92 bzw. 4572. Das ist ein absoluter Unterschied von 4480 (zitierten) Seiten und ein relativer Unterschied von fast 5000 (!) Prozent \u2026 also dreieinhalb Gr\u00f8szenordnungen! Bei den UNzitierten Seiten betragen die Werte 5,798,220 Seiten und 5,793,740 Seiten, was AUCH einem absoluten (!) Unterscheid von 4480 Seiten entspricht. Das MUSS ja zwingend (!) so sein. ABER der der relative Unterschied betraegt gerade mal 0.077 Prozent \u2026 normiert k\u00f8nnen diese Werte also mit einem guten Gewissen als Eins gesetzt werden.<\/p>\n<p>Das fetzt wa! Und weil sich der \u201eVolumenanteil\u201c der Kettenseiten an allen Zitaten aus dem &#8222;umgedrehten&#8220; der obigen Kurve berechnet muss da auch das Gleiche bei rauskommen \u2026 \u2026 \u2026 nur wenn man die zwei Kurven miteinander vergleicht (linkes Diagramm) \u2026<\/p>\n<p><a href=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/134_comparison_Ordnungsparameter_.png\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" loading=\"lazy\" class=\"aligncenter wp-image-13181 size-medium\" src=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/134_comparison_Ordnungsparameter_-800x304.png\" alt=\"\" width=\"800\" height=\"304\" srcset=\"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/134_comparison_Ordnungsparameter_-800x304.png 800w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/134_comparison_Ordnungsparameter_-1024x389.png 1024w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/134_comparison_Ordnungsparameter_-768x292.png 768w, http:\/\/www.soeren-in-norwegen.net\/blog\/wp-content\/uploads\/134_comparison_Ordnungsparameter_.png 1192w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><\/a><\/p>\n<p>\u2026 dann sieht das so aus, als ob der Start (und eingeschraenkt auch das Ende) des Phasenuebergangs an sich um zwei Linklevel verschoben ist. Das muss diskutiert werden und da widme ich mich zunaechst dem &#8222;Ende&#8220; des Phasenuebergangs.<\/p>\n<p>Mit einer gestrichelten Linie legte ich beim letzten Mal den durchschnittlichen Plateauwert des &#8222;Volumenanteils&#8220; (nach dem Phasenuebergang) fest. Dieser lag bei 0.002 und der &#8222;Volumenanteil&#8220; passiert diesen Wert zwischen LL<sub>11<\/sub> und LL<sub>12<\/sub> wo es ungefaehr 1000 Familien gibt. Die ca. 1000 Familien muss ich mit der Breite der Antwortfunktion multiplizieren und dann noch mal mit den (fuer Kettenseiten) 50 durchschnittlichen Links (<em>cf<\/em>. die Diskussion diesbezueglich beim letzten Mal). Das ergibt 500k zitierte Links an dieser Stelle was ungefaehr 10 % aller Wikipediaseiten entspricht. Im Umkehrschluss bedeutet dies, dass die Kurve fuer die Anzahl der normierten Links zwischen LL<sub>11<\/sub> und LL<sub>12<\/sub> von unter 90 % auf ueber 90 % springen muss.<br \/>\nIm linken Diagramm legte ich gestrichelte Linien rein, mit deren Hilfe man (leichter) sieht, dass dies der Fall ist (der Wert von 0.002 beim letzten Mal entspricht in der der normierten Kurve einem Wert von ungefaehr 0.5).<\/p>\n<p>Leider ist die Sache bzgl. des Starts des Phasenuebergangs nicht so einfach. Es scheint, dass der Anteil der UNzitierten Links ab LL<sub>8<\/sub> ansteigt, waehrend das fuer den &#8222;Volumenanteil&#8220; erst bei LL<sub>10<\/sub> der Fall ist. Eine logarithmische Darstellung aendert daran auch nix.<br \/>\nDazu sage ich frei heraus: auch mein geuebter Blick wurde getaeuscht, denn ich bin auf die Aenderung absoluter Gr\u00f8szen hereingefallen. Anders gesagt: hier gilt eine Art Umkehrung dessen was ich oben schrieb bzgl. der relativen Aenderung und der Sachverhalt ist im rechten Diagramm gezeigt. Aber der Reihe nach denn was ich da gemacht habe ist etwas komplizierter.<\/p>\n<p>Natuerlich bin ich letztlich an absoluten Aenderungen interessiert, aber diese werden durch relative Aenderungen von einem Linklevel zum naechsten &#8222;getrieben&#8220;. Deswegen habe ich fuer die Kurven im rechten Diagramm zunaechst die Differenz der entsprechenden Werte von einem Linklevel zum vorhergehenden Linklevel berechnet. Danach schaute ich, wie grosz diese Aenderung im Vergleich zum absoluten Wert des vorhergehenden Linklevels war. Wie gesagt, dass ist im Wesentlichen das Gleiche wie weiter oben erklaert (nur &#8222;umgedreht&#8220;).<br \/>\nDie relative Aenderung ist uebrigens sowas wie die zweite Ableitung. Ich schaue also wie sich die Aenderung aendert.<\/p>\n<p>In der rechten Abbildung erkennt man, dass die &#8222;Wuselphase&#8220; (mit vielen Kollisionen \/ Zitaten) bei kleinen Linkleveln sehr stabil ist und bis LL<sub>6<\/sub> immer stabiler wird. Die Werte des &#8222;Volumenanteils&#8220; bzw. der UNzitierten Links aendern sich weniger und weniger im Vergleich zum vorherigen Linklevel. Deswegen ist das in der linken Abbildung eine gerade Linie. Bei LL<sub>7<\/sub> nimmt die relative Aenderung fuer beide Kurven leicht zu. Dadurch dass es vorher einen eindeutigen Trend in beiden Gr\u00f8szen gibt, k\u00f8nnte man argumentieren, dass der Phasenuebergang hier los geht. Ich bin mit dieser Aussage aber eher vorsichtig, denn der &#8222;Sprung&#8220; entspricht nur einem Faktor vier zum LL<sub>6<\/sub> und das liegt definitiv innerhalb der Schwankungsbreite. Dann auf LL<sub>8<\/sub> springen BEIDE Kurven pl\u00f8tzlich um einen Faktor von ueber 100 nach oben. Hier wuerde ich also definitiv sagen, dass der Phasenuebergang los geht und man sieht, dass dasfuer beide Gr\u00f8szen zum selben Linklevel geschieht. Das ist gut, denn das muss ja (wie oben gesagt) so sein, weil der &#8222;Volumenanteil&#8220; aus der &#8222;Umkehrung&#8220; der UNzitierten Links berechnet wird.<br \/>\nAber warum sieht man das nicht im linken Diagramm?<\/p>\n<p>Auch das ist einfach erklaert, am Beispiel der Aenderung der Werte von LL<sub>7<\/sub> zu LL<sub>8<\/sub>. Der Wert der relativen Aenderung des &#8222;Volumenanteils&#8220; betraegt ca. 0.02 % und des Anteils der UNzitierten Links 0.69 %. Ersteres bedeutet, dass sich erst die fuenfte Nachkommastelle des absoluten Wertes des &#8222;Volumenanteils&#8220; aendert, waehrend bei den UNzitierten Links bereits die dritte Nachkommastelle (des absoluten Wertes) betroffen ist. Wenn der erste Wert um einen Faktor 100 zu nimmt, dann ist das zwar eine grosze relative Aenderung auf 2 % aber letztlich ist auch dann nur die dritte Nachkommastelle betroffen und solch kleine Aenderungen sieht man eben nicht im linken Diagramm waehrend sich eine Aenderung um (ueber) 69 % deutlich bemerkbar macht.<\/p>\n<p>Aber eigtl.\u00a0 gibt es hier gar kein Mysterium denn wie gesagt ist der &#8222;Volumenanteil&#8220; abhaengig von den (UN)zitierten Links. Ich habe die Diskussion dennoch so lang und breit durchgefuehrt, weil es im linken Diagramm der zweiten Abbidung nicht so aussieht und solche Diskrepanzen muss man verstehen bevor man weitergehen kann.<\/p>\n<p>Festzuhalten ist das Folgende: anstatt des &#8222;Volumenanteils\u201c der Kettenseiten an allen Zitaten kann die Anzahl der UNzitierten Links als Ordnungsparameter genutzt werden. Das ist prima, denn Letzteres ist eindeutiger und man muss dafuer nicht die Anzahl der Familien bestimmen.<\/p>\n<p>SO \u2026 genug fuer heute \u2026 und auch genug bzgl. der Ordnungsparameter \u2026 und auch genug bzgl. der Phasen \u2026 ich kann hier also ohne viel Pomp abschlieszen, dass ich tatsaechlich einen Phasenuebergang im Wikipedialinknetzwerk gefunden habe \u2026 das ist schon ziemlich famos!<br \/>\nNun muss ich mal schauen, was ich als naechstes machen kann \u2026 viel ist nicht mehr ueber \u2026 aber das dachte ich schon vor einem Jahr.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Beim vorletzten Mal stellte ich die Entwicklung der zitierten Seiten vor. Diese Gr\u00f8sze kann man nicht direkt als Ordnungsparameter benutzen aber beim letzten Mal zeigte ich, dass der daraus gewinnbare \u201eVolumenanteil\u201c der Kettenseiten an allen Zitaten sehr wohl als ein solcher benutzt werden kann. Heute nun zeige ich, dass das viel einfacher geht. Ich wollte [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13102"}],"collection":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/comments?post=13102"}],"version-history":[{"count":10,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13102\/revisions"}],"predecessor-version":[{"id":13182,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/posts\/13102\/revisions\/13182"}],"wp:attachment":[{"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/media?parent=13102"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/categories?post=13102"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.soeren-in-norwegen.net\/blog\/wp-json\/wp\/v2\/tags?post=13102"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}